Zoom Workplace 现已发布!利用人工智能协作平台重新定义团队合作
Zoom Workplace 将通信、员工参与度、空间和工作效率解决方案整合到一个平台上,并将 Zoom AI Companion 功能贯穿其中。
Zoom 的首席技术官 Xuedong Huang 讨论了我们的 AI 联合方法,以及它如何为会议摘要、回顾和后续步骤提供高质量的性能。
更新日期 May 06, 2024
发布日期 March 26, 2024
2023 年 11 月,我介绍了 Zoom 的联合人工智能方法如何实现与 OpenAI GPT-4 几乎相当的质量,而推理成本仅为 OpenAI 的 6%。尽管上述结果曾令人印象深刻,与 OpenAI 的 GPT-4 相比,我们现在可以为 Zoom 最受欢迎的会议功能提供更高品质的人工智能。在我们的内部人工验证基准盲测中,与 GPT-4 相比,Zoom AI Companion 的相对误差分别降低了 20%(Zoom 会议摘要的“总结”)和 60%(“后续步骤”)以上。
为了支持我们的培训工作,提高任务完成质量,我们采用了独特的联合人工智能方法,利用许多闭源和开源的高级大型语言模型 (LLM) 共同协作,从而获得更好的结果。这与被限制在特定 LLM 的其他提供商大不相同。例如,微软 Copilot 依靠的是 GPT-4,谷歌依靠的是 Gemini。
此人工智能方法使 Zoom AI Companion 变得与众不同,可为那些使用 Zoom 最受欢迎的功能的客户提供高品质体验。正如我在上次更新中提到的,我们使用专有的 Z 评分器来评判人工智能生成的结果质量。首先,我们采用成本较低,但最适用于每项任务的 LLM。接着,我们的 Z 评分器会评估初始任务的完成质量。如有必要,我们可以使用另一个互补的 LLM 来完善任务。这个过程会得到质量更高的输出信息,就像团队所取得的成就可以比任何个人都大。
此后,我们又将各种 LLM 的其他质量信号纳入其中,从而改进了我们的 Z 评分器。此外,为了更好地符合人类偏好,我们改进了联合强化学习。通过将 Zoom LLM 与一系列互补的 LLM 相结合,Zoom 广受欢迎的会议摘要功能可提供高质量的结果,根据我们最近的基准测试,其性能现已超过用于支持 Microsoft Teams 中 Copilot 的 GPT-4。
在人工智能安全方面,我们还组建了一个由 Claude-3、Gemini 和 GPT-4 等多个 LLM 组成的“委员会”,以此减少大多数 LLM 的固有偏差,从而减少“幻觉”,并改进我们的 Zoom LLM。例如,不同的 LLM 不太可能犯同样的“幻觉”错误,因此我们可以得出一致性更强的回答,减少异常值的影响。
我们最近对“会议摘要”中最受欢迎的两个部分(会议总结和后续步骤)的结果进行了基准测试。自 2023 年 9 月推出 AI Companion 以来,已有 50 多万 Zoom 客户启用了这些功能。
在最新的内部基准测试中,我们在不透露生成各个摘要所使用的人工智能模型的情况下,让人类评委选出最准确的会议摘要。如下图所示,在每次盲测中,Zoom LLM 在以英语进行会议总结和提取后续步骤方面的结果均优于 GPT-4。我们可以将会议总结和会议后续步骤的相对误差分别降低 20% 和 60% 以上,从而直接转化为卓越的质量优势。
我们还使用 Zoom LLM 与 GPT-4 进行比较,衡量了日语会议摘要的整体质量。从下图中可以看出,我们的联合方法在此取得的结果更好。
我们致力于在 Zoom 平台上为客户提供 Zoom AI Companion 所带来的优势,符合条件的 Zoom 付费套餐无需支付额外费用。*持续关注 Zoom Workplace 和 Zoom 商业服务中的 AI 质量,将有助于提升客户价值。此外,Zoom 委托 GigaOm 进行的一项研究(发布时间为 2024 年 3 月 26 日)表明,AI Companion 转录的准确率高达 95%,在会议中提问场景中,AI Companion 给出结果的速度比 ChatGPT-4 网页版快四倍之多。
借助这些最新的创新技术,您就可以确信,每次 Zoom 会议都可以随附一份人工智能生成的会议摘要,其人工智能质量在业内堪称一流。
*AI Companion 不一定适用于所有地区或垂直行业。