人工智慧

Zoom AI：重新定義超越最艱鉅挑戰的可能性

Zoom 在 2025 年底取得了多項 AI 領域的重大突破。其聯邦式架構研究成果目前在複雜推理和搜尋基準測試上的表現優於領先的前沿模型，證明多系統協調能夠跨產業實現過高的準確性和可靠性。

7 閱讀分鐘

更新日期 December 29, 2025

發佈日期 December 29, 2025

在此網路日誌中

01 DeepSearchQA - Jumplink to DeepSearchQA
02 利用新型前沿模型進行擴展 - Jumplink to 利用新型前沿模型進行擴展
03 代理型 AI 的影響 - Jumplink to 代理型 AI 的影響

黃學東

技術長

黃學東是技術長 (CTO)。加入 Zoom 之前，他曾在 Microsoft 擔任 Azure AI 技術長和技術研究員。他在人工智慧領域的職業生涯十分輝煌：於 1993 年創立了微軟語音技術小組，領導微軟人工智慧團隊在語音辨識、機器翻譯、自然語言理解和電腦視覺領域實現了多個業界首個堪與人類匹敵的里程碑，是 IEEE 會員和 ACM 院士，並當選為美國國家工程院和美國藝術與科學院院士。

學東於 1989 年獲得愛丁堡大學電子工程博士學位 (英國 ORS 和愛丁堡大學獎學金資助)，1984 年獲得清華大學電腦科學碩士學位，1982 年獲得湖南大學電腦科學學士學位。

隨著 2025 年即將結束，我很自豪地回顧我們的團隊在提升 Zoom 的 AI 能力方面所取得的進展：這一切始於我們先前對人類的最後考試（HLE）基準測試所做的準備 — 這是一項旨在測試 AI 推理能力和專家級理解能力的嚴格評估。此一工作已擴展至多個評估中，並取得了更廣泛的性能提升，進一步鞏固了我們專有的代理型聯邦式 AI 能夠提供大幅的改進，超越任何單一前沿模型的侷限。

我們在研究環境中將 Zoom 的聯邦式 AI 方法應用於 Google 新的 DeepSearchQA 基準測試：評估 AI 代理人在 17 個領域中複雜、多步驟的資訊搜尋任務。 於 2025 年 12 月 11 日與新的 Gemini 深度研究一同發布，此基準測試挑戰了 AI 系統超越單一答案檢索或廣譜事實以外的能力。

反之，DeepSearchQA 擁有一個具有挑戰性的、精心設計的任務資料集，旨在評估代理人執行複雜搜尋計畫以生成詳盡答案列表的能力。Zoom 的聯邦式 AI 在測試中達到了 76.3% 的準確率，超越了先前 66.1% 的最佳水準。

這項改進揭示了一個關鍵見解：AI 的重要性在於如何系統性地建構和應用。透過在內部測試中協調 OpenAI GPT‑5 和 Gemini 3 專業版預覽，並使用我們專有的代理型聯邦式框架「探索—驗證—聯邦」工作流程，我們旨在提供比單一模型更深入的推理覆蓋和更可靠的事實綜合。

型號／系統	DeepSearchQA 準確度
Zoom 聯邦式 AI（GPT-5 + Gemini 3 專業版預覽）	76.3%
Google Gemini 深度研究代理人	66.1%
OpenAI GPT‑5 專業版	65.2%
OpenAI GPT-5	59.4%
Google Gemini 3 專業版預覽	56.6%
Anthropic Claude Opus 4.5（思考）	24%

第三方基準測試結果最後更新日期：2025 年 12 月 10 日

這項突破凸顯 Zoom 的聯邦式模型不僅僅是一個普通的組合，而是一個可擴展的推理系統，能夠適應跨難度等級和領域。推動我們取得「人類的最後考試」（Humanity's Last Exam）突破性成果的原則，這對於代理型企業版應用程式而言同樣強大，因為在這些應用中可靠性和推理深度比延遲更重要。

我們的創新之處不在於建構另一個單一的整體模型，而是將最佳模型連結成一個系統，強調改善可靠性和協調性，而非單純的規模。 

隨著新的前沿 AI 模型的出現，架構也持續擴展 — 能夠在跨任務、產業和應用程式中提供更智慧、更以人為本的智慧功能。隨著 OpenAI 新版 GPT-5.2 的發布，Zoom 聯邦式 AI 研究已將 HLE 全集合準確度從 48.1% 提升至 53%，再次超越所有單獨的前沿模型。

型號／系統	HLE 全套準確性
Zoom 聯邦式 AI （GPT-5.2 + Gemini 3 專業版預覽）	53%
OpenAI GPT‑5.2專業版	50%
Zoom 聯邦式 AI （GPT-5 + Gemini 3 專業版預覽）	48.1%
Google Gemini 深度研究代理人	46.4%
Google Gemini 3 專業版預覽	45.8%
OpenAI GPT‑5.2	45.5%
Anthropic Claude Opus 4.5	43.2%
OpenAI GPT-5 專業版	42%
OpenAI GPT-5	35.2%

這些突破性的成果表明，Zoom 的聯邦式 AI 方法代表了協調全球最先進模型的典範轉移。這種方法超越了傳統單一模型的限制，建構了一個強大的框架，對代理型 AI 和 Zoom AI Companion 以及 Zoom Virtual Agent 的演進具有深遠的影響。

Zoom 的專有代理型聯邦技術奠定了新一代 AI 代理人的基礎，讓其能夠應對人類最複雜的挑戰。雖然這些基準測試成果標誌著重要的里程碑，但我們持續專注於最佳化延遲，這將有助於這種聯邦式架構在各種實際應用中發揮變革性的價值。

黃學東為 Zoom 的技術長。他曾擔任 Microsoft 技術研究員和 Azure AI CTO。他是美國國家工程院和美國文理科學院的當選院士。

基準測試結果說明：這些指標反映了 Zoom 對前沿 AI 模型的持續研究。所引用的模型可能仍在測試階段，以便整合到 Zoom 為客戶提供的聯邦式 AI 部署中。