OpenAI《AI in the Enterprise》中文翻译
OpenAI 最近发布的《AI in the Enterprise》这份文档是OpenAI发布的一份企业级AI应用指南,旨在向企业介绍如何利用OpenAI的AI技术(特别是ChatGPT和相关模型)来提升业务效率、创新产品和服务,并应对企业级挑战。文档面向企业决策者、IT负责人和开发者,提供了AI在企业场景中的应用案例、技术实现路径以及部署建议。这份文档原版是英文,为了方便自己学习理解,我将其翻译成中文(利用各种LLM工具),并整理出这篇文章,分享给需要的人。本译文已经生成PDF,读者朋友们也可以直接下载AiInTheEnterprise中文翻译.pdf
一种全新的工作方式
作为一家人工智能研究与部署公司,OpenAI 优先考虑与全球企业的合作,因为我们的模型将在复杂、互联的工作流程和系统中发挥最佳性能。
我们看到人工智能在以下三个方面带来了显著且可衡量的改进:
- 劳动力表现 帮助人们在更短的时间内交付更高质量的成果。
- 自动化常规操作 将人们从重复性任务中解放出来,使他们能够专注于创造更高价值。
- 驱动产品 通过提供更相关、更及时的客户体验来增强产品。
然而,利用人工智能与开发软件或部署云应用不同。最成功的公司往往是将人工智能视为一种全新范式来对待。这会带来一种实验性的思维方式和迭代方法,从而更快地实现价值,并获得用户和利益相关者更大的认同。
我们的方法:迭代开发 | OpenAI 围绕三个团队组织工作。我们的研究团队推进人工智能基础研究,开发新的模型和功能。应用团队将这些模型转化为产品,例如 ChatGPT 企业和我们的 API。部署团队则将这些产品引入企业,解决它们最迫切的使用场景。我们采用迭代部署的方式,快速从客户使用案例中学习,并利用这些信息加速产品改进。这意味着定期发布更新、收集反馈,并在每一步提升性能和安全性。结果是:用户能够尽早且频繁地体验人工智能的新进展,而你们的反馈将塑造未来的产品和模型。 |
执行摘要
企业AI采用的七个经验教训
- 从评估开始 使用系统化的评估流程来衡量模型在你的使用场景中的表现。
- 将AI嵌入你的产品 创造新的客户体验和更相关的互动。
- 立即开始并尽早投资 越早行动,价值累积得越多。
- 定制和优化你的模型 针对你的具体使用场景调整AI,可以显著提升价值。
- 让专家使用AI 最接近某个流程的人最适合利用AI来改进它。
- 为开发者扫除障碍 自动化软件开发生命周期可以成倍增加AI的回报。
- 设定大胆的自动化目标 大多数流程涉及大量重复性工作,非常适合自动化。目标要远大。
接下来,我们将深入探讨每个经验教训,并以客户故事作为示例。
企业AI采用的七个经验教训
Lesson 1 从评估开始
摩根士丹利如何通过迭代确保质量与安全
作为全球金融服务领导者,摩根士丹利是一家以关系为核心的企业。毫不意外,公司内部对于人工智能如何为高度个人化且敏感的工作增添价值存在一些疑问。
答案是对每个拟议的应用进行深入的评估。评估是一个严格、结构化的流程,用于衡量人工智能模型在特定使用场景中的实际表现,依据既定的基准。它还是一个持续改进AI赋能流程的方式,每一步都有专家反馈。
起步阶段
摩根士丹利的首次评估聚焦于提升财务顾问的效率和效果。
理念很简单:如果顾问能够更快获取信息并减少在重复性任务上的时间,他们就能为客户提供更多更好的洞察。
他们从三个模型评估开始:
- 语言翻译 衡量模型生成翻译的准确性和质量。
- 摘要生成 评估模型如何凝练信息,依据准确性、相关性和连贯性的共识指标。
- 人类训练师 将AI结果与专家顾问的响应进行比较,依据准确性和相关性评分。
这些评估以及其他评估为摩根士丹利提供了信心,开始将这些使用场景逐步投入生产。
现阶段进展
如今,98%的摩根士丹利财务顾问每天使用OpenAI;文档访问率从20%跃升至80%,搜索时间大幅缩短;由于任务自动化和更快的洞察,顾问能够将更多时间用于客户关系。
顾问的反馈极为积极。他们与客户的互动更加深入,过去需要数天的后续工作如今在几小时内即可完成。
凯特琳·埃利奥特(Kaitlin Elliott)
公司生成式AI解决方案负责人
想了解更多?请观看《摩根士丹利:塑造金融服务未来》并向我们咨询评估框架相关信息。
评估的定义 | 评估是验证和测试模型输出结果的过程。严格的评估能带来更稳定、可靠的应用,这些应用能够适应变化。评估围绕任务构建,衡量模型输出的质量与基准的对比——是否更准确?更合规?更安全?关键指标将取决于每个使用场景中最重要的事项。 |
Lesson 2 将AI嵌入你的产品
Indeed如何让职位匹配更具人性化
当人工智能被用于自动化和加速繁琐、重复的工作时,员工可以专注于只有人类才能完成的任务。而且,由于人工智能能够处理来自多个来源的庞大数据量,它可以创造出更具人性化的客户体验,因为这些体验更相关、更个性化。
Indeed,全球排名第一的求职网站,利用 GPT-4o mini 以全新的方式为求职者匹配职位。
“为什么”的力量
为求职者提供优质的职位推荐只是 Indeed 体验的起点。他们还需要向候选人解释为什么推荐了某个特定职位。
Indeed 利用 GPT-4o mini 的数据分析和自然语言处理能力,在发送给求职者的电子邮件和消息中塑造这些“为什么”陈述。借助人工智能,广受欢迎的“邀请申请”功能还能解释为什么候选人的背景或过往工作经验使该职位适合他们。
Indeed 团队将之前的职位匹配引擎与加入新定制上下文的 GPT 驱动版本进行了测试。性能提升显著:
- 职位申请启动量增加 20%
- 下游成功率提升 13%——不仅更多候选人愿意申请,雇主也更有可能雇用他们。
考虑到 Indeed 每月向求职者发送超过 2000 万条消息,且每月有 3.5 亿访客访问该网站,这些增长转化为显著的商业影响。
但规模扩大也意味着使用更多令牌(tokens)。为了提高效率,OpenAI 与 Indeed 合作微调了一个更小的 GPT 模型,该模型能够以 60% 更少的令牌 提供相似的结果。
帮助求职者找到合适的职位——并理解为什么某个机会适合他们——是一个深刻人性化的成果。Indeed 团队利用人工智能帮助更多人更快地找到工作,这对所有人来说都是双赢。
“我们看到很多机会继续投资于这种新基础设施,以帮助我们增加收入。”
克里斯·海姆斯(Chris Hyams)
首席执行官
Lesson 3 立即开始并尽早投资
Klarna如何从AI知识积累中获益
人工智能很少是即插即用的解决方案——其使用场景通过迭代不断变得更复杂且影响力更大。越早开始,组织就越能从持续改进中获得累积的收益。
Klarna,一家全球支付网络和购物平台,推出了一款新的AI助手来优化客户服务。在短短几个月内,这款助手处理了三分之二的客服聊天,相当于数百名客服人员的工作量,并将平均问题解决时间从11分钟缩短到仅2分钟。这项举措预计将带来4000万美元的利润提升,同时保持与人工支持相当的客户满意度。这些成果并非一蹴而就。Klarna通过持续测试和优化AI助手实现了这一性能。
同样重要的是,Klarna 90%的员工现在在日常工作中使用人工智能。组织范围内对AI的熟悉度不断提高,使Klarna能够更快地行动、更高效地启动内部项目,并持续优化客户体验。通过早期投资和鼓励广泛采用,Klarna正见证AI效益的累积——为其业务各个方面带来回报。
这次人工智能在客户互动方面的突破意味着我们的客户能够以更优惠的价格享受更优质的体验,我们的员工面临更有趣的挑战,我们的投资者获得更好的回报。
塞巴斯蒂安·西米亚特科夫斯基(Sebastian Siemiatkowski)
联合创始人兼首席执行官
Lesson 4 定制和优化你的模型
Lowe’s如何改进产品搜索
在人工智能采用方面取得最大成功的企业,往往是那些投入时间和资源来定制和训练自己AI模型的企业。OpenAI在我们的API上投入了大量资源,使模型的定制和微调变得更加简单——无论是通过自助方式,还是使用我们的工具和支持。
我们与《财富》50强家居改善公司Lowe’s密切合作,改善其电子商务搜索功能的准确性和相关性。Lowe’s与数千家供应商合作,经常需要处理不完整或不一致的产品数据。
关键在于准确的产品描述和标签。但这还需要理解购物者的搜索方式,这种动态在不同产品类别中会有所变化。这时就需要进行微调。
通过微调OpenAI模型,Lowe’s团队将产品标签准确性提高了20%,错误检测能力提升了60%。
“当我们看到在产品数据上微调GPT 3.5的结果时,团队的兴奋之情溢于言表。我们知道我们找到了一款成功的产品!”
尼尚特·古普塔(Nishant Gupta)
数据、分析与计算智能高级总监
产品说明: OpenAI已推出视觉微调功能,进一步改善电子商务搜索,并应对医学影像和自动驾驶领域的挑战。
什么是微调?
如果将GPT模型比作一件商店买来的西装,那么微调就是量身定制的选择——是你根据组织特定数据和需求定制模型的方式。
为什么重要:
- 提高准确性 通过在你的独特数据(如产品目录或内部常见问题解答)上进行训练,模型能提供更相关、更符合品牌的结果。
- 领域专长 微调后的模型能更好地理解你所在行业的术语、风格和上下文。
- 一致的语气和风格 对零售商来说,这意味着每个产品描述都能保持品牌声音;对律师事务所来说,这意味着每次都能正确格式化引文。
- 更快的结果 减少手动编辑或重新检查,意味着你的团队可以专注于高价值任务。
Lesson 5 让专家使用AI
BBVA采取专家主导的AI方法
你的员工是最接近流程和问题的人,通常也是寻找AI驱动解决方案的最佳人选。让这些专家掌握AI远比尝试构建通用的或横向的解决方案更有效。
BBVA,这家全球银行业领导者,拥有超过12.5万名员工,每个人都面临独特的挑战和机会。他们决定让员工使用AI,并与法律、合规和IT安全团队密切合作,确保负责任的使用。他们在全球范围内推广了ChatGPT企业版,然后让员工自行探索使用场景。
“通常,在我们这样的企业中,即使是构建一个原型也需要技术资源和时间,”BBVA全球AI采用负责人埃莱娜·阿尔法罗(Elena Alfaro)说。“通过定制GPT,任何人都可以创建应用程序来解决独特的问题——开始非常容易。”
在五个月内,BBVA员工创建了超过2900个定制GPT,其中一些将项目和流程时间从数周缩短到数小时。这种影响遍及多个学科和部门:
- 信用风险团队 使用ChatGPT更快、更准确地确定信用价值。
- 法律团队 每年使用它回答4万个关于政策、合规等问题。
- 客户服务团队 自动化NPS调查的情感分析。
这种成功继续扩展到市场营销、风险管理、运营等领域。这一切都源于他们将AI交到那些知道如何在自己领域应用它的人手中。
“我们认为对ChatGPT的投资是对我们员工的投资。AI放大了我们的潜力,帮助我们更高效、更具创造力。”
埃莱娜·阿尔法罗(Elena Alfaro)
全球AI采用负责人
产品说明: 通过深入研究,ChatGPT可以独立完成工作。给它一个提示,它就能综合数百个在线资源,生成博士级别的全面报告。这释放了员工的生产力,让他们在几分钟内就能获得任何主题的深入、详细研究。在跨领域专家的内部评估中,深入研究平均为每个复杂任务节省了4小时。
了解更多详情,请观看《BBVA将AI交到每个团队手中》。
Lesson 6 为开发者扫除障碍
Mercado Libre更快、更一致地构建AI程序
在许多组织中,开发者资源是主要的瓶颈和增长抑制因素。当工程团队不堪重负时,会减缓创新速度,并造成应用程序和创意积压的不可逾越障碍。
Mercado Libre,拉丁美洲最大的电子商务和金融科技公司,与OpenAI合作构建了一个开发平台层来解决这一问题。这个平台名为Verdi,由GPT-4o和GPT-4o mini驱动。如今,它帮助Mercado Libre的1.7万名开发者统一并加速AI应用程序的构建。
Verdi集成了语言模型、Python节点和API,创建了一个可扩展、一致的平台,以自然语言作为核心接口。开发者现在可以更快地构建始终高质量的应用程序,而无需深入源代码。安全性、防护措施和路由逻辑都已内置。
因此,AI应用程序开发速度显著加快,帮助Mercado Libre的员工完成许多出色的工作,包括:
- 提升库存容量 GPT-4o mini Vision为产品列表进行标签和完善,使Mercado能够编目100倍的产品。
- 检测欺诈 每天评估数百万产品列表的数据,将标记项目的欺诈检测准确率提高到近99%。
- 定制产品描述 翻译产品标题和描述,以适应西班牙语和葡萄牙语的细微方言差异。
- 增加订单 自动化评论摘要,帮助用户快速了解产品反馈。
- 个性化通知 定制推送通知以提高参与度并改进产品推荐。
接下来:利用Verdi改进物流,减少延迟交付,并在组织内承担更多高影响力的任务。
“我们使用GPT-4o mini设计了理想的AI平台,重点是降低认知负荷,使整个组织能够迭代、开发和部署新的创新解决方案。”
塞巴斯蒂安·巴里奥斯(Sebastian Barrios)
技术高级副总裁
Lesson 7 设定大胆的自动化目标
我们在OpenAI如何自动化自己的工作
在OpenAI,我们每天与人工智能共存,因此我们经常发现自动化自己工作的新方法。
例如:我们的支持团队过去常常被繁琐的工作拖累,花费大量时间访问系统、理解上下文、撰写回复并为客户采取正确行动。
为此,我们构建了一个内部自动化平台。该平台基于我们现有的工作流程和系统运行,自动化重复性工作,加速洞察和行动。
我们的第一个使用场景:基于Gmail撰写客户回复并触发行动。使用我们的自动化平台,团队可以即时访问客户数据和相关知识文章,然后将结果融入回复邮件或具体行动中——例如更新账户或开启支持工单。
通过将AI嵌入现有工作流程,我们的团队变得更高效、更快速响应,并且更以客户为中心。这个平台每月处理数十万个任务,让员工能够专注于更高影响力的工作。不出所料,这个系统现已扩展到其他部门。
这一切的实现,是因为我们从一开始就设定了大胆的自动化目标,而不是接受低效流程作为业务成本。
总结
相互学习
正如前述案例所示,每个企业都充满机会,利用人工智能的力量实现更好的成果。使用场景可能因公司和行业而异,但经验教训适用于所有市场。
共同主题是:AI部署受益于开放、实验性的思维方式,并以严格的评估和安全防护措施为后盾。取得成功的公司并非急于将AI模型注入每个工作流程。它们围绕高回报、低投入的使用场景进行协调,在迭代中学习,然后将这些经验应用于新领域。
结果清晰且可衡量:更快、更准确的流程;更个性化的客户体验;以及更有回报的工作,因为员工能够专注于人类最擅长的领域。
我们现在看到企业正在整合AI工作流程,以自动化日益复杂的流程——通常使用工具、资源和其他代理来完成任务。
我们将继续从AI的前线报告,帮助指导你的思考。
产品说明:Operator
Operator是OpenAI代理方法的一个示例。利用其虚拟浏览器,Operator可以像人类一样浏览网页、点击按钮、填写表单和收集数据。
它还可以在广泛的工具和系统上运行流程,无需定制集成或API。企业使用它来自动化以前需要人工干预的工作流程,例如:
- 自动化软件测试和质量保证: 使用Operator像真实用户一样与网页应用程序交互,标记任何用户界面问题。
- 代表用户更新记录系统: 无需技术指令或API连接。
结果:端到端的自动化,将团队从重复性任务中解放出来,提升整个企业的效率。
值得信赖的AI企业平台
安全与隐私一览
对于我们的企业客户来说,没有什么比安全、隐私和控制更重要。以下是我们如何确保这些:
- 你的数据归你所有 我们不会使用你的内容来训练我们的模型;你的企业保留完全所有权。
- 企业级合规性 数据在传输和存储时均加密,符合SOC 2 Type 2和CSA STAR Level 1等顶级标准。
- 精细的访问控制 你可以选择谁能查看和管理数据,确保内部治理和合规性。
- 灵活的保留设置 调整日志记录和存储设置,以匹配你组织的政策。
了解更多关于OpenAI和安全的信息,请访问我们的安全页面或OpenAI安全门户。
更多资源
OpenAI是一家人工智能研究与部署公司。我们的使命是确保通用人工智能造福全人类。