
认识您的全新 AI 助手 Zoom AI Companion!
符合条件的付费 Zoom 套餐中提供 Zoom AI Companion 且无需支付额外费用,您可以使用 Zoom AI Companion 提高工作效率并加强团队协作。
Zoom 的 CTO 黄学东探讨了小语言模型 (SLM) 如何帮助我们实现对 AI 智能体的愿景,使其以联合方式协同运作以改进日常任务。
更新日期 February 25, 2025
发布日期 February 19, 2025
黄学东担任首席技术官 (CTO)。在加入 Zoom 之前,他曾在 Microsoft 担任 Azure AI 首席技术官和技术研究员。他在人工智能领域的职业生涯十分耀眼:1993 年,他组建了 Microsoft 的语音技术团队,带领 Microsoft 的人工智能团队在语音识别、机器翻译、自然语言理解和计算机视觉领域取得了多项业界首个达到人类水平的里程碑式成就,他还是电气与电子工程师协会 (IEEE) 和美国计算机协会 (ACM) 会士,并当选为美国国家工程院和美国艺术与科学院院士。
黄学东于 1989 年获得爱丁堡大学电子工程博士学位(获得英国 ORS 和爱丁堡大学奖学金资助),1984 年获得清华大学计算机科学硕士学位,1982 年获得湖南大学计算机科学学士学位。
Zoom 始终聚焦创新,持续通过 Zoom AI Companion 探索 AI 优先的转型之路。在过去的一年里,我分享了 Zoom 的联合方法如何交付高质量成果,以及 Zoom 如何专注于提高语音识别质量并为实现其他 AI 功能奠定更优基础。随着人工智能的不断进步,我们正在加速普及代理式 AI。
到目前为止,人工智能依赖大语言模型 (LLM) 来响应用户提示并生成回复。但在考量 SLM 如何实现定制化 AI 智能体时,我们发掘了更多机遇。我们正在构建 AI Companion,以支持代理式 AI 为您管理一系列多步骤操作。
当我们将 AI 视为智能体而非独立技能与应答时,意味着其不再局限于输入提示返回简单结果,而应成为人类自身及目标的延伸。为此,我们的 AI 智能体融入以下特征:
为实现这些 AI 智能体,我们激动地宣布一个重要里程碑:我们新研发的小语言模型 (SLM) 在公开基准测试中,以 20 亿参数规模达到业界领先水平。借助 Zoom 即将推出的 AI 工作室定制功能,我们正着手设计 Zoom 的 SLM,以便在处理专业工作量时达到接近业界领先 LLM 的质量。这将为 AI Companion 执行复杂的代理式 AI 任务铺平道路,让多个 AI 智能体以无与伦比的成本效益协同配合。
在 Zoom 的联合 AI 方法中,我们主张协调多个定制模型,而非依赖单一的综合大型模型。Zoom 的 SLM 旨在针对特定任务进行优化,以增强这一方法。通过在具备相应智能体的定制 SLM 上分配工作量,同时利用领先的 LLM,我们力图实现几项重要优势:
让我们深入剖析这一突破的意义,以及它与主流模型的对比优势。
为创建 Zoom 的 SLM,我们使用了 6 万亿个多语言数据令牌和 256 个 Nvidia H100 GPU。整个培训周期从开始到结束为期约 30 天。下表描述了根据 Zoom 的内部测试,SLM 功能在几个公共基准中与其他机型的对比情况:
按照社区惯例,我们使用 Lighteval 工具评估了这些基准的准确性,该工具在 MMLU 和 MMLU专业版上提供了 5 个示例,在 GPQA 上提供了 2 个示例,在 BBH 上则提供了 3 个示例。
表 1. 将 Zoom SLM 与 2B 类别中的其他 SLM 进行对比(分数越高越好)。
如表 2 所示,未经特定领域或任务定制的 SLM 在质量评估指标上通常仍逊于主流 LLM(如 OpenAI 的 GPT-4o-mini)。
表 2. Zoom SLM 在没有定制的情况下,与 2B 类别以外的 LLM(如 OpenAI GPT 4o-mini)相比,竞争力较弱。
不过,最有趣的结果是,这些 SLM 在针对专业任务进行定制时表现出卓越的能力。通过使用 Zoom 的 AI 工作室进行定制,我们期望有效缩小其与更昂贵的 LLM 之间的质量差距。定制化 SLM 可以作为专业智能体,与 LLM 协同执行关键任务,优先提升每个 AI 智能体的准确性、速度和成本效益。
定制化 SLM 在机器翻译等任务中表现出色。我们利用 115 亿个专为机器翻译设计的令牌(包括合成数据)对 SLM 进行调整,大幅提高了广泛采用的 COMET-22 质量指标,其中涵盖 14 个语言对,包括中文、英文、法文、日文、葡萄牙文和西班牙文等主要语言,如表 3 所示。
我们的 SLM 还可以进行定制,以支持 AI Companion 的代理式 AI 槽解码基准,该基准用于衡量模型在执行动作时对用户指令的解析能力。如表 3 所示,定制化 SLM 拥有 20 亿个用于代理式 AI 领域数据的合成令牌,其性能也优于 GPT-4o-mini。
这一效率和适应性的结合旨在使 Zoom 能够为全球客户提供大幅改进的机器翻译,并支持 Zoom AI 工作室针对特定的代理式 AI 工作量进行定制。
表 3:定制 Zoom SLM 与 OpenAI GPT-4o-mini 在专业工作量中的对比,得分越高越好。
这些定制化 SLM 将成为我们 AI 智能体的核心支柱,以更高效率实现与当前昂贵 LLM 相当的成果。利用我们的联合 AI,这些 AI 智能体和技能将有助于实现无与伦比的效率、成本效益和准确性。
我们为自身的进步感到自豪,而这仅仅是个开始。我们的愿景是为每个组织配备能够提供经济高效的高性能解决方案的 AI 智能体。借助 AI 智能体和 SLM 的附加功能,AI Companion 将助您打造高效职场,完成更多任务,成就卓越业绩。