AI Companion 会议和聊天

将人工智能质量放在首位,以增强无障碍访问和协作能力

Zoom AI Companion 2.0 在语音识别和人工智能生成的会议智能质量方面领先于经过测试的竞争对手

更新日期 February 13, 2025

发布日期 November 14, 2024

将人工智能质量放在首位,以增强无障碍访问和协作能力
黄学东
黄学东
首席技术官

黄学东担任首席技术官 (CTO)。在加入 Zoom 之前,他曾在 Microsoft 担任 Azure AI 首席技术官和技术研究员。他在人工智能领域的职业生涯十分耀眼:1993 年,他组建了 Microsoft 的语音技术团队,带领 Microsoft 的人工智能团队在语音识别、机器翻译、自然语言理解和计算机视觉领域取得了多项业界首个达到人类水平的里程碑式成就,他还是电气与电子工程师协会 (IEEE) 和美国计算机协会 (ACM) 会士,并当选为美国国家工程院和美国艺术与科学院院士。

黄学东于 1989 年获得爱丁堡大学电子工程博士学位(获得英国 ORS 和爱丁堡大学奖学金资助),1984 年获得清华大学计算机科学硕士学位,1982 年获得湖南大学计算机科学学士学位。

技术可以发挥巨大的均衡作用,人工智能也不例外。它可以帮助我们完成以前无法完成的事情。在我们继续为 Zoom AI Companion 构建功能和能力的同时,我们格外关注我们的产品如何帮助增强客户的能力,并致力于提供最高质量的结果,使他们能够高效、成功地开展工作。 

我们的客户将 AI Companion 应用于各行各业,包括金融服务、医疗保健、教育、政府等。如今,在教育领域和大学里,学生和教师已经使用 Zoom 的人工智能功能来改善讲座的无障碍访问。在医疗保健领域,人们可以参加虚拟预约,并使用转录文字和摘要功能来扩大获得医疗服务的机会。 

利用人工智能使技术更加无障碍,不仅仅是为听障人士提供字幕,还可以打破语言障碍。35 年前,当我还是苏格兰爱丁堡的一名学生,还在学习英语时,我不仅在观看 BBC 时受益于字幕,还让我看到了准确的字幕和翻译能为世界各地的人们做些什么。人工智能的应用已经相当广泛,我们希望继续提高质量,为更多人提供可能性。

我们在会议转录方面的成功是这一历程的一部分,它涉及到人工智能如何增强个人技能和经验以帮助他们更进一步的诸多方面。这可以是会议或网络研讨会中的自动实时字幕将实时字幕翻译成另一种语言,或使用 AI Companion 进行会议转录,以便与会议摘要、智能录制、行动项目等一起使用。在全球商业环境中创造更加无障碍、更公平的会议体验对每个人都有好处。

准确的语音识别是 Zoom AI Companion 的基础

今年早些时候,我曾分享过我们的联合人工智能方法如何以更低的成本匹配或超越其他人工智能模型。今天,我很高兴与大家分享最近委托 TestDevLab 对 Zoom AI 性能进行评估的结果,该结果进一步巩固了 Zoom AI Companion 2.0 与其他经过测试的 AI 工具相比在语音识别和会议智能方面的领先地位。 

Zoom AI Companion 2.0 无缝集成了工作和网络信息,为 Zoom Workplace 体验带来了令人印象深刻的升级。虽然人工智能功能集成到 Zoom Workplace 中的方式有很多,但 AI Companion 的一个方面为我们最广泛使用的人工智能功能提供支持,包括会议摘要、行动项目和转录文字。

这些人工智能功能的有效性取决于它们所提取的转录内容的准确性。我们的许多常用功能(例如提出会议内提问)都依赖于高质量的语音识别。可靠的转录文字可让人工智能准确捕捉姓名、主题和意图,从而形成摘要、要点和可操作见解的基础。

衡量转录准确性的行业标准是词错误率 (WER),即比较人工生成的转录文字与人工智能生成的转录文字之间的差异百分比。在过去几年中,Zoom 一直在努力实现人工智能架构的现代化,以最大限度地降低 WER。通过最大限度地降低 WER,我们创建了精确、可靠的转录文字,帮助客户取得有效、可操作的成果。

在 WER 分析中,红色文本表示遗漏的单词,蓝色文本表示在源转录文字中找不到的单词。

在 WER 分析中,红色文本表示遗漏的单词,蓝色文本表示在源转录文字中找不到的单词。 

 

Zoom 提供更准确的转录文字以增强人工智能功能

结果显而易见:Zoom AI Companion 的表现优于 Microsoft Teams,WER 明显更低,转录准确率更高。在会议中,每个字都很重要,即使是微小的转录错误也会对摘要、任务或会议期间提出问题的答案产生重大影响。

TestDevLab 创建和运行这些测试的方法如下:

  • 他们使用了三次录制的会议,参会者从 2 人到 16 人不等。
  • 文件在连接到通话的各个计算机上同步播放。
  • 为保持一致性,每个平台的每个测试都重复了五次。

在每次测试中,他们都比较了 Zoom Workplace 和 Microsoft Teams,并测评了每次会议的词错误率。

在测评 WER(词错误率)时,百分比越低,表示转录质量越高。

在测评 WER(词错误率)时,百分比越低,表示转录质量越高。

会议摘要和记录是许多人工智能平台中最受欢迎和最常用的功能。由于它们的使用如此广泛,确保尽可能减少错误就显得更加重要。它们之所以受欢迎,是因为它们节省时间,而且人们发现阅读、总结和更好地理解重要信息非常有价值。

TestDevLab 还对 Zoom Workplace 和 Microsoft Teams 的会议摘要质量和对话式人工智能(如答案稳定性)进行了排名。为了评估摘要,他们创建了一个具有人工验证结果的 LLM 助手。

可靠的转录文字为下游人工智能功能奠定更好的基础

转录并不是 TestDevLab 测评的唯一 AI Companion 功能。与转录文字不同,会议摘要等其他人工智能功能的目标不是提供逐字逐句的副本,而是提供符合用户期望的会议内容的定制版本。 

TestDevLab 还对 Zoom Workplace 和 Microsoft Teams 的会议摘要质量和对话式人工智能(如答案稳定性)进行了排名。为了评估摘要,他们创建了一个具有人工验证结果的 LLM 助手。

在本次评估中,我们测试了 Microsoft Teams 中的两项摘要功能:智能回顾功能(需通过 Teams Premium 或 Microsoft 365 Copilot 许可证提供),以及 Teams Meetings 中 Microsoft Copilot AI 助手的基于提示的摘要生成功能。由于 Copilot AI 助手只能根据提示生成摘要,因此我们提示 Copilot 在会议结束时创建摘要和行动项目。

在本次评估中,我们测试了 Microsoft Teams 中的两项摘要功能:智能回顾功能(需通过 Teams Premium 或 Microsoft 365 Copilot 许可证提供),以及 Teams Meetings 中 Microsoft Copilot AI 助手的基于提示的摘要生成功能。由于 Copilot AI 助手只能根据提示生成摘要,因此我们提示 Copilot 在会议结束时创建摘要和行动项目。

在对话式人工智能方面,TestDevLab 测评了人工智能平台在会议期间回答问题的能力,既包括与会议背景信息相关的问题,也包括不相关的网络搜索,如“世界上最高的建筑是什么?”Zoom AI Companion 在响应时间和稳定性(所有会议参会者都能得到相似答案)方面都优于 Microsoft。

更高的稳定性表明,Zoom 的人工智能能始终如一地为所有参会者提供可靠的响应,从而在会议期间提供更流畅的体验。

更高的稳定性表明,Zoom 的人工智能能始终如一地为所有参会者提供可靠的响应,从而在会议期间提供更流畅的体验。 

 

Zoom AI Companion 提供更好、更公平的会议体验

这些成果彰显了我们对 Zoom Workplace 和 AI Companion 质量的承诺。我们努力创造一种方式,让人们更轻松地相互联系,提高日常工作效率,并有机会使用人工智能支持他们的工作。人工智能生成的会议转录只是人们可以借助 AI Companion 为许多人创造更公平体验的一种方式,这些人群包括耳聋者、听力障碍者、神经多样性人士以及在会议中可能说不同语言的人。

TestDevLab 进行的这项评估强调了 Zoom Workplace 和 AI Companion 在人工智能性能方面的领先地位,与经过测试的竞争对手相比,Zoom Workplace 和 AI Companion 具有更高的转录准确性、更快的会议内问题响应速度和更稳定的对话式人工智能功能。

此外,Zoom Workplace 为付费 Zoom 账户提供 AI Companion,无需支付额外费用。而一些替代平台则不同,它们会对每个额外的用户授权人工智能功能收取额外费用。在 Zoom,我们认为让尽可能多的客户可以使用这些精准且具有变革性的工具非常重要。我们从基础做起,创建高质量的转录文字,并不断为所有客户创造卓越的人工智能体验。

如果您没有符合条件的付费 Zoom 套餐,请立即升级以获取 AI Companion 带来的优势。

我们深受客户青睐

Okta
纳斯达克
Rakuten
Logitech
Western Union
Autodesk
Dropbox
Okta
纳斯达克
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom - 单一平台,连接无碍