认识您的全新 AI 助手 Zoom AI Companion!
符合条件的付费 Zoom 套餐中提供 Zoom AI Companion 且无需支付额外费用,您可以使用 Zoom AI Companion 提高工作效率并加强团队协作。
在同期参评的产品对比中,Zoom 的语音识别、AI 生成会议智能内容质量表现领先
发布日期 2024年11月14日
黄学东担任首席技术官 (CTO)。在加入 Zoom 之前,他曾在 Microsoft 担任 Azure AI 首席技术官和技术研究员。他在人工智能领域的职业生涯十分耀眼:1993 年,他组建了 Microsoft 的语音技术团队,带领 Microsoft 的人工智能团队在语音识别、机器翻译、自然语言理解和计算机视觉领域取得了多项业界首个达到人类水平的里程碑式成就,他还是电气与电子工程师协会 (IEEE) 和美国计算机协会 (ACM) 会士,并当选为美国国家工程院和美国艺术与科学院院士。
黄学东于 1989 年获得爱丁堡大学电子工程博士学位(获得英国 ORS 和爱丁堡大学奖学金资助),1984 年获得清华大学计算机科学硕士学位,1982 年获得湖南大学计算机科学学士学位。
技术可以发挥巨大的平衡作用,人工智能也不例外。它可以帮助我们完成以往无法完成的任务。在持续拓展 Zoom Workplace 的 AI 功能与能力的过程中,我们始终高度重视如何通过产品为客户赋能,并致力于交付优异成果,助力客户在工作中高效达成目标。
各行各业的客户都在使用 Zoom Workplace 中的 AI 功能,涵盖金融服务、医疗保健、教育、政务等领域。如今,在教育和大学院校场景中,学生和教师已经开始借助 Zoom 的 AI 功能来提升课堂无障碍体验;在医疗保健场景中,用户可以参加线上问诊,并依靠转写、摘要功能拓宽医疗服务获取渠道。
利用人工智能使技术更加无障碍,不仅仅是为听障人士提供字幕,还可以打破语言障碍。35 年前,当我还是苏格兰爱丁堡的一名学生,还在学习英语时,我不仅在观看 BBC 时受益于字幕,还让我看到了准确的字幕和翻译能为世界各地的人们做些什么。人工智能的应用已经相当广泛,我们希望继续提高质量,为更多人提供可能性。
我们在会议转写领域取得的成果只是发展历程中的一环,它体现出 AI 能够从多方面扩充人的技能与经验,助力人们提升工作上限。相关能力包含会议及网络研讨会自动实时字幕、实时字幕多语言翻译,或是会议内容转写,用于生成会议摘要、智能录制文件、行动项等。在全球化商业环境中打造更便捷、更公平的会议体验,能惠及所有使用者。
今年年初,我曾分享了我们的联合 AI 方案如何以远低于其他 AI 模型的成本,达到甚至超越同类模型的性能。今天,我很高兴能够分享近期由 TestDevLab 委托开展的最新 Zoom AI 性能评估结果。这项评估进一步巩固了 Zoom 在语音识别与会议智能领域的领先地位,其表现优于其他受测 AI 工具。
我们的 AI 功能无缝整合工作与网页信息,大幅升级了 Zoom Workplace 使用体验。尽管 AI 功能集成至 Zoom Workplace 的形式多样,但有一项核心能力支撑着我们使用最广泛的各类 AI 功能,包括会议摘要、行动项与转写文字。
这些人工智能功能的有效性取决于它们所提取的转录内容的准确性。我们的许多常用功能(例如提出会议内提问)都依赖于高质量的语音识别。可靠的转录文字可让人工智能准确捕捉姓名、主题和意图,从而形成摘要、要点和可操作见解的基础。
衡量转写准确性的行业标准是词错率 (WER),即比较人工生成的转写文字与 AI 生成的版本之间的差异百分比。近年来,Zoom 一直致力于革新 AI 架构以最大限度降低 WER。通过降低 WER,我们能够生成精准可靠的转写文字,为客户创造更高效、更切实的成果。
在 WER 分析中,红色文本表示遗漏的单词,蓝色文本表示在源转录文字中找不到的单词。
结果显而易见:Zoom 的表现优于 Microsoft Teams,WER 明显更低,转写准确率更高。在会议中,因一字之差而造成的细微转写错误,也会对摘要、任务或会议期间提出问题的答案产生重大影响。
TestDevLab 创建和运行这些测试的方法如下:
在每次测试中,他们都比较了 Zoom Workplace 和 Microsoft Teams,并测评了每次会议的词错误率。
在测评 WER(词错误率)时,百分比越低,表示转录质量越高。
会议摘要和记录是许多人工智能平台中最受欢迎和最常用的功能。由于它们的使用如此广泛,确保尽可能减少错误就显得更加重要。它们之所以受欢迎,是因为它们节省时间,而且人们发现阅读、总结和更好地理解重要信息非常有价值。
TestDevLab 还对 Zoom Workplace 和 Microsoft Teams 的会议摘要质量和对话式人工智能(如答案稳定性)进行了排名。为了评估摘要,他们创建了一个具有人工验证结果的 LLM 助手。
转写并非 TestDevLab 测评的唯一 AI 功能。和转写文字不同,会议摘要等其他 AI 功能不会原样复刻全部对话内容,而是生成贴合用户需求的定制化会议内容汇总。
TestDevLab 还对 Zoom Workplace 和 Microsoft Teams 的会议摘要质量和对话式人工智能(如答案稳定性)进行了排名。为了评估摘要,他们创建了一个具有人工验证结果的 LLM 助手。
在本次评估中,我们测试了 Microsoft Teams 中的两项摘要功能:智能回顾功能(需通过 Teams Premium 或 Microsoft 365 Copilot 许可证提供),以及 Teams Meetings 中 Microsoft Copilot AI 助手的基于提示的摘要生成功能。由于 Copilot AI 助手只能根据提示生成摘要,因此我们提示 Copilot 在会议结束时创建摘要和行动项目。
在对话式 AI 维度,TestDevLab 测评了各平台会议问答能力,包含会议相关提问、无关全网检索类问题(例如 “世界最高建筑是什么”)。无论响应速度、稳定性(所有参会者都能获取相似答案),Zoom 的表现均优于 Microsoft。
更高的稳定性表明,Zoom 的人工智能能始终如一地为所有参会者提供可靠的响应,从而在会议期间提供更流畅的体验。
这些成果彰显了我们对 Zoom Workplace 质量的承诺。我们致力于打造便捷的沟通渠道,提升用户日常工作效率,让所有人都能借助 AI 辅助工作。AI 生成会议转写只是 Zoom Workplace 打造公平使用体验的其中一项能力,惠及耳聋人士、听障人士、神经多样性人士,以及在会议中使用不同语种的人士。
TestDevLab 开展的这项评测表明,Zoom Workplace 的 AI 性能处于行业领先水平;对比同期参评竞品,它拥有更高的转写准确率、更快的会议内问题响应速度,对话式 AI 功能运行也更为稳定。
此外,Zoom Workplace 还能为付费 Zoom 账户提供诸多 AI 功能,且无需支付额外费用。部分替代平台则不同,它们会对每个已获取 AI 功能权限的用户收取额外费用。在 Zoom,我们坚信这些精准高效、颠覆传统的工具应当惠及更多客户。因此,我们从基础做起,着手创建高质量转写文字,致力于为每一位用户打造卓越的 AI 体验。
如果您尚未订阅符合条件的付费 Zoom 套餐,请立即升级,以解锁 Zoom Workplace 各项权益。