AI Companion AI

Zoom 首席技术官深入探讨:我们的联合式人工智能方法如何最大程度地提高性能、质量和实惠性

5 阅读分钟数

发布日期 2023年11月28日

Zoom 首席技术官深入探讨:我们的联合式人工智能方法如何最大程度地提高性能、质量和实惠性
Xuedong Huang
黄学东
首席技术官

黄学东担任首席技术官 (CTO)。在加入 Zoom 之前,他曾在 Microsoft 担任 Azure AI 首席技术官和技术研究员。他在人工智能领域的职业生涯十分耀眼:1993 年,他组建了 Microsoft 的语音技术团队,带领 Microsoft 的人工智能团队在语音识别、机器翻译、自然语言理解和计算机视觉领域取得了多项业界首个达到人类水平的里程碑式成就,他还是电气与电子工程师协会 (IEEE) 和美国计算机协会 (ACM) 会士,并当选为美国国家工程院和美国艺术与科学院院士。

黄学东于 1989 年获得爱丁堡大学电子工程博士学位(获得英国 ORS 和爱丁堡大学奖学金资助),1984 年获得清华大学计算机科学硕士学位,1982 年获得湖南大学计算机科学学士学位。

欢迎查阅 Zoom AI 最新动态,了解联合式架构的实施成效。

从提出概念到实现,踏上变革性的人工智能之旅就如同在一条蜿蜒曲折的道路上行进,充满了持续不断的颠覆、调适和创新。在过去 30 年的这段旅程中,从语音识别和自然语言理解到电脑视觉,我亲眼见证了人工智能的进化历程,并积极参与其中。我加入 Zoom 已有六个月,这段时间的创新速度尤其令人震惊。

在 Zoom,我们利用 AI 提升人际协作效率和生产力。Zoom AI 是我们的创新基石,其设计目标在于提高工作效率,促进无缝协作,并帮助您提炼更深入的见解,以改进您在整个 Zoom 平台的工作方式。Zoom 采用联合式 AI 架构,只要您的 Zoom 用户账户绑定付费服务,即可免费使用 Zoom Workplace 内全部 AI 功能。*下文将详细介绍这套 AI 体系,以及它如何以更低成本实现优质运行效果。

Zoom 的联合式人工智能方法

多年来,Zoom 一直在提供语音识别、电脑视觉、机器翻译和大型语言模型 (LLM) 等人工智能服务,以增强沟通。我们使用的 LLM 包括 Zoom 的 LLM,以及第三方模型 OpenAI GPT 3.5、GPT 4 和 Anthropic Claude 2。我们的联合方法让我们可以无差别地整合来自合作伙伴的较新 LLM(无论它们是否开源),例如 OpenAI 的 GPT 4 Turbo,以持续改善 Zoom 客户的端到端体验。

我们遵循成本效益策略,首先采用最适合任务的低成本 LLM。然后,我们的 Z-Scorer 会评估初始任务的完成质量,如果需要,我们会使用更高级的 LLM,在初始 LLM 成果的基础上提高任务的完成度,这种方式就类似于,与任何单打独斗的个人相比,有凝聚力的团队通过团结协作,将能够创造出质量更高的产品。

与其他 LLM 的性能比较

根据我们的内部测试,与仅采用 OpenAI GPT-3.5 Turbo 或其他几种最先进 LLM 的单一模型方法相比,我们的团队通过联合式 AI 方法提高了 Zoom AI 的相对质量(按照我们的专有质量评估方法,相对差异如下:AI Companion 的质量评分达到 99%,而 OpenAI GPT-3.5 Turbo 则为 93%)。

我们从三大维度衡量性能表现:更低使用成本、更快响应速度、更高质量输出内容。以作为 Microsoft Copilot 对标基准的 OpenAI GPT-4-32k 模型作对比,如图 1 所示,我们的会议提问功能在 AI 输出质量持平的前提下,成本更低、响应更快。

图 1. Zoom 的联合 AI 方案在 Zoom AI 的会议查询任务中,在成本和质量关键指标上与 OpenAI GPT-4-32k 的对比(以相对百分比的形式表示)。Microsoft Copilot 使用 OpenAI GPT-4 与 Microsoft Graph 及其他组件协同运作。我们不会使用客户数据训练我们的 AI 模型,在此图表中,我们使用 Zoom 的内部会议数据,与作为 Microsoft Copilot 代理的 OpenAI GPT-4 进行基准比较。

我们的模型在多语言处理能力方面进一步凸显优势,目前除英语外,预览版已支持 32 种语种。考虑到大多数 LLM 主要使用英语数据进行预训练,我们新增了翻译模型,以拓宽多语言支持范围。Zoom AI 多语言会议摘要功能会借助 Zoom 自研翻译模型,将非英语转写文字译为英语,同时兼顾原文与译文数据开展分析。如图 2 所示,我们的模型不仅 AI 质量大幅超越 GPT-3.5,相对质量更是达到 GPT-4-32k 的 97%,而使用成本却不足后者的 6%。

图 2. Zoom 联合式 AI 在多语言摘要任务上的相对性能占比(对标 OpenAI GPT-4-32k),覆盖英语以外 32 种语种,包含中文、法语、德语、意大利语、日语、葡萄牙语、西班牙语。Microsoft Copilot 搭配 OpenAI GPT-4、Microsoft Graph 及其他组件运行。本图表采用 Zoom 内部会议数据完成基准测试,以 OpenAI GPT-4 作为 Microsoft Copilot 的对标参照。

这些例子突出了 Zoom 联合式人工智能方法的有效性,它将不同机器学习系统的优势无缝结合起来,提供高性能的结果。

人工智能的成功之道

我们相信,AI 的便利应尽可能惠及广泛的用户群体。我们的联合 AI 方案在实现这一愿景的过程中发挥着关键作用。正因如此,当其他公司按用户人数收费时,我们却能将Zoom Workplace 的诸多 AI 功能融入符合条件的付费 Zoom 套餐,而订阅这些套餐用户则无需支付额外费用。*

我们鼓励您亲自体验 Zoom Workplace 的 AI 功能,请访问我们的入门指南,了解更多关于如何启用和使用这些功能的信息。如果您暂未订阅符合条件的付费 Zoom 套餐,请立即升级以解锁 Zoom AI 的强大功能。

*注:Zoom Workplace 中的部分 AI 功能并非面向全部地区、全垂直行业开放。

 

我们深受客户青睐

Okta
纳斯达克
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom - 单一平台,连接无碍