AI Companion 会议和聊天

Zoom 的联合人工智能方法为 Zoom 最受欢迎的功能带来了高质量的结果

Zoom 的首席技术官 Xuedong Huang 讨论了我们的 AI 联合方法，以及它如何为会议摘要、回顾和后续步骤提供高质量的性能。

8 阅读分钟数

发布日期 2024年3月26日

Zoom 的联合人工智能方法为 AI Companion 最受欢迎的功能带来了高质量的结果

在此博客中

01 Zoom 联合人工智能方法在用户最需要它的场景中效果更为明显 - Jumplink to Zoom 联合人工智能方法在用户最需要它的场景中效果更为明显
02 优质的人工智能已嵌入到整个 Zoom Workplace 和 Zoom 商业服务中 - Jumplink to 优质的人工智能已嵌入到整个 Zoom Workplace 和 Zoom 商业服务中

黄学东

首席技术官

黄学东担任首席技术官 (CTO)。在加入 Zoom 之前，他曾在 Microsoft 担任 Azure AI 首席技术官和技术研究员。他在人工智能领域的职业生涯十分耀眼：1993 年，他组建了 Microsoft 的语音技术团队，带领 Microsoft 的人工智能团队在语音识别、机器翻译、自然语言理解和计算机视觉领域取得了多项业界首个达到人类水平的里程碑式成就，他还是电气与电子工程师协会 (IEEE) 和美国计算机协会 (ACM) 会士，并当选为美国国家工程院和美国艺术与科学院院士。

黄学东于 1989 年获得爱丁堡大学电子工程博士学位（获得英国 ORS 和爱丁堡大学奖学金资助），1984 年获得清华大学计算机科学硕士学位，1982 年获得湖南大学计算机科学学士学位。

2023 年 11 月，我介绍了 Zoom 的联合人工智能方法如何实现与 OpenAI GPT-4 几乎相当的质量，而推理成本仅为 OpenAI 的 6%。尽管上述结果曾令人印象深刻，与 OpenAI 的 GPT-4 相比，我们现在可以为 Zoom 最受欢迎的会议功能提供更高品质的人工智能。在我们的内部人工验证基准盲测中，与 GPT-4 相比，Zoom AI Companion 的相对误差分别降低了 20%（Zoom 会议摘要的“总结”）和 60%（“后续步骤”）以上。

为了支持我们的培训工作，提高任务完成质量，我们采用了独特的联合人工智能方法，利用许多闭源和开源的高级大型语言模型 (LLM) 共同协作，从而获得更好的结果。这与被限制在特定 LLM 的其他提供商大不相同。例如，微软 Copilot 依靠的是 GPT-4，谷歌依靠的是 Gemini。

此人工智能方法使 Zoom AI Companion 变得与众不同，可为那些使用 Zoom 最受欢迎的功能的客户提供高品质体验。正如我在上次更新中提到的，我们使用专有的 Z 评分器来评判人工智能生成的结果质量。首先，我们采用成本较低，但最适用于每项任务的 LLM。接着，我们的 Z 评分器会评估初始任务的完成质量。如有必要，我们可以使用另一个互补的 LLM 来完善任务。这个过程会得到质量更高的输出信息，就像团队所取得的成就可以比任何个人都大。

此后，我们又将各种 LLM 的其他质量信号纳入其中，从而改进了我们的 Z 评分器。此外，为了更好地符合人类偏好，我们改进了联合强化学习。通过将 Zoom LLM 与一系列互补的 LLM 相结合，Zoom 广受欢迎的会议摘要功能可提供高质量的结果，根据我们最近的基准测试，其性能现已超过用于支持 Microsoft Teams 中 Copilot 的 GPT-4。

在人工智能安全方面，我们还组建了一个由 Claude-3、Gemini 和 GPT-4 等多个 LLM 组成的“委员会”，以此减少大多数 LLM 的固有偏差，从而减少“幻觉”，并改进我们的 Zoom LLM。例如，不同的 LLM 不太可能犯同样的“幻觉”错误，因此我们可以得出一致性更强的回答，减少异常值的影响。

我们最近对“会议摘要”中最受欢迎的两个部分（会议总结和后续步骤）的结果进行了基准测试。自 2023 年 9 月推出 AI Companion 以来，已有 50 多万 Zoom 客户启用了这些功能。

在最新的内部基准测试中，我们在不透露生成各个摘要所使用的人工智能模型的情况下，让人类评委选出最准确的会议摘要。如下图所示，在每次盲测中，Zoom LLM 在以英语进行会议总结和提取后续步骤方面的结果均优于 GPT-4。我们可以将会议总结和会议后续步骤的相对误差分别降低 20% 和 60% 以上，从而直接转化为卓越的质量优势。

*图 1. 以英语进行会议总结和后续步骤的人工评估。联合使用 Zoom LLM 和 Anthropic Claude-3 的最终结果明显优于单独使用 OpenAI GPT-4 的结果。*

我们还使用 Zoom LLM 与 GPT-4 进行比较，衡量了日语会议摘要的整体质量。从下图中可以看出，我们的联合方法在此取得的结果更好。

*图 2. 对整体日语会议摘要的人工评估。联合使用 Zoom LLM 和 OpenAI GPT-4 的最终结果优于单独使用 OpenAI GPT-4 的结果。*

我们致力于在 Zoom 平台上为客户提供 Zoom AI Companion 所带来的优势，符合条件的 Zoom 付费套餐无需支付额外费用。*持续关注 Zoom Workplace 和 Zoom 商业服务中的 AI 质量，将有助于提升客户价值。此外，Zoom 委托 GigaOm 进行的一项研究（发布时间为 2024 年 3 月 26 日）表明，AI Companion 转录的准确率高达 95%，在会议中提问场景中，AI Companion 给出结果的速度比 ChatGPT-4 网页版快四倍之多。

借助这些最新的创新技术，您就可以确信，每次 Zoom 会议都可以随附一份人工智能生成的会议摘要，其人工智能质量在业内堪称一流。