Zoom Workplace 隆重推出!藉助 AI 技術的協作平台,重新塑造團隊工作
Zoom Workplace 將通訊、員工敬業度、空間和生產力解決方案整合至單一平台,並融入 Zoom AI Companion 功能。
更新日期 March 25, 2024
發佈日期 November 28, 2023
黃學東是技術長 (CTO)。加入 Zoom 之前,他曾在 Microsoft 擔任 Azure AI 技術長和技術研究員。他在人工智慧領域的職業生涯十分輝煌:於 1993 年創立了微軟語音技術小組,領導微軟人工智慧團隊在語音辨識、機器翻譯、自然語言理解和電腦視覺領域實現了多個業界首個堪與人類匹敵的里程碑,是 IEEE 會員和 ACM 院士,並當選為美國國家工程院和美國藝術與科學院院士。
學東於 1989 年獲得愛丁堡大學電子工程博士學位 (英國 ORS 和愛丁堡大學獎學金資助),1984 年獲得清華大學電腦科學碩士學位,1982 年獲得湖南大學電腦科學學士學位。
請閱讀我們有關 Zoom AI Companion 的最新更新,以及我們聯合式方法的成效。
從概念到實現的轉型 AI 之旅就像一條蜿蜒曲折的道路,充滿持續的顛覆、適應和創新。在過去的 30 年裡,我一直在這段旅程中身處第一線,且積極參與了 AI 從語音識別和自然語言理解到電腦視覺的演進。自從我加入 Zoom,過去六個月的創新步伐尤其令人驚艷。
在 Zoom,我們正在使用 AI 來改進人類協作和生產力。Zoom AI Companion 是我們創新的基石,專為幫助提高生產力、促進無縫協作並獲得更深入的見解而設計,以增強您在 Zoom 平台上的工作方式。Zoom 的聯合式 AI 方法讓我們能夠免費提供 AI Companion,並將付費服務指派給您的 Zoom 使用者帳戶。*以下將更詳細的介紹我們的 AI,以及它如何以較低的成本提供高品質的表現。
Zoom 多年來一直提供語音辨識、電腦視覺、機器翻譯和大語言模型 (LLM) 等 AI 服務來強化溝通。我們使用的 LLM 包括 Zoom 的 LLM,以及第三方模型 OpenAI GPT 3.5 和 GPT 4,以及 Anthropic Claude 2。我們的聯合式方法可以納入新的 LLM,例如來自合作夥伴的 OpenAI GPT 4 Turbo,以及開源和閉源 LLM,以持續改善 Zoom 客戶的端對端體驗。
我們堅持具經濟效益的策略,首先採用最適合該任務的低成本 LLM。然後,我們的 Z-Scorer 會評估初始任務完成品質,如有需要,我們會根據初始 LLM 所取得的成果,使用更進階的 LLM 來增強任務完成情況,就像一個有凝聚力的團隊共同合作,將比任何個人更有效率的創造出更高品質的產品。
根據我們的內部測試,採用聯合式 AI 方法後,我們的團隊提升了 AI Companion 的相對品質,相較於單一模型方法 (例如 OpenAI GPT-3.5 Turbo),品質評分的相對差異為 99% 對 93% (根據我們的專屬品質評估方法),並且優於其他幾個最先進的大型語言模型 (LLM)。
我們將效能衡量為成本更低、回應時間更快和輸出品質更高的綜合體現。與作為 Microsoft Copilot Proxy 的 OpenAI GPT-4-32k 模型相比,Zoom AI Companion 的會議問題功能可降低成本並加快回應時間,同時保持相當的 AI 品質,如圖 1 所示。
AI Companion 的多語言表現進一步證明了我們模型的強大,且現在支援英語以外的 32 種語言 (預覽版)。有鑑於大多數 LLM 主要是用英語為主的資料進行預先訓練,因此我們增加了翻譯模型來擴展我們的多語言能力。透過使用 Zoom 的翻譯模型將非英語轉錄文字翻譯成英文,以便 Zoom AI Companion 進行多語言會議摘要,我們不僅考慮翻譯後的資料,也同時考慮原始資料。如圖 2 所示,我們的模型不僅顯著提高了 GPT-3.5 的 AI 品質,而且接近 GPT-4-32k AI 品質(相對品質達 97%),而成本卻不到 6%。
這些範例強調了 Zoom 聯合式 AI 方法的成效,無縫結合不同機器學習系統的優勢,以提供高效能的結果。