AI Companion AI

Zoom CTO の深掘り: AI に対するフェデレーテッド アプローチで、パフォーマンス、品質、価格を最大化

5 分で読める

更新日 March 25, 2024

公開日 November 28, 2023

Zoom CTO の深掘り: AI に対するフェデレーテッド アプローチで、パフォーマンス、品質、価格を最大化
Xuedong Huang
Xuedong Huang
最高技術責任者

Xuedong Huang は弊社の最高技術責任者(CTO)です。Zoom に入社する前は、Microsoft に勤務し、Azure AI CTO 兼テクニカル フェローを務めていました。AI 分野でキャリアを積んできました。1993 年に Microsoft の音声テクノロジー グループを立ち上げ Microsoft AI チームを率いて、音声認識、機械翻訳、自然言語理解、コンピュータ ビジョンにおいて業界初の「人間に匹敵する画期的機能」を複数開発することに成功しました。IEEE および ACM のフェロー、全米技術アカデミーとアメリカ芸術科学アカデミーの選出メンバーでもあります。

1989 年、英国の ORS とエディンバラ大学からの奨学金支援によりエディンバラ大学で電気工学博士号を取得し、1984 年に清華大学でコンピュータ サイエンス修士号、1982 年に湖南大学でコンピュータ サイエンス学士号を取得しました。

Zoom AI Companion の最新情報と、フェデレーテッド アプローチの成功秘話をお読みください。

概念化から実現に至る変革的な AI のジャーニーへの出発は、絶え間ない混乱、適応、革新を特徴とする、曲がりくねった道への旅立ちに似ています。これまで 30 年にわたってこのジャーニーを歩んできた私は、音声認識や自然言語理解からコンピュータ ビジョンに至るまで、AI の進化を最前列で見守り、積極的にその進化に貢献してきました。私が Zoom に入社してからのこの 6 か月間のイノベーションのペースは、特に驚異的でした。

Zoom では、AI を使用して人間のコラボレーションと生産性の向上を図っています。Zoom AI Companion は、生産性の向上、シームレスなコラボレーションの促進、より深いインサイトの導出を支援し、Zoom プラットフォーム全体における作業方法を向上させるために設計された、Zoom のイノベーションの要です。Zoom の AI に対するフェデレーテッド アプローチにより、Zoom は AI Companion を Zoom ユーザー アカウントに割り当てられた有料サービスに含め、追加料金なしで提供できるようになりました。* ここでは、Zoom の AI について、また Zoom AI が高品質のパフォーマンスを低コストで提供する仕組みについて詳しく説明します。

AI に対する Zoom のフェデレーテッド アプローチ

Zoom は長年にわたり、音声認識、コンピュータ ビジョン、機械翻訳、大規模言語モデル(LLM)などの AI サービスを提供し、コミュニケーションを強化してきました。Zoom は、Zoom の LLM のほかに、サードパーティ モデルの LLM(OpenAI GPT 3.5、GPT 4、Anthropic Claude 2)を使用しています。Zoom のフェデレーテッド アプローチは、Zoom のお客様のエンドツーエンド体験を継続的に改善するために、OpenAI の GPT 4 Turbo のような新しい LLM、パートナーの LLM、オープンソースとクローズドソースの LLM を同様に取り入れることが可能です。

Zoom は、費用対効果の高い戦略を貫いています。その戦略ではまず、タスクにもっとも適した低コストの LLM を採用します。次に、Zoom の Z スコアラーが最初のタスク完了品質を評価し、必要であれば、最初の LLM で得た内容に基づいて、より高度な LLM を使用してタスク完了を補完します。これは、結束力のあるチームが一丸となって協力すれば、一個人よりも効率的に高品質の製品を生み出せるという一般論と同様の仕組みです。

他社の LLM とのパフォーマンス比較

Zoom 独自の内部テストによると、AI に対するフェデレーテッド アプローチにより、AI Companion は、OpenAI GPT-3.5 Turbo(当社独自の品質評価方法論による相対的な差は 99% 対 93% の品質評価)や、その他複数の最先端 LLM などの単一モデル アプローチよりも、相対的な品質が向上しました。

Zoom は、コスト削減、応答時間の短縮、出力の品質の向上を組み合わせ、パフォーマンスとして測定しています。Microsoft Copilot のプロキシ、OpenAI の GPT-4-32k モデルと比較すると、Zoom AI Companion のミーティング質問機能は、図 1 に示すように、同等の AI 品質を維持しながら、コストを削減して応答時間を短縮しています。

図 1: Zoom AI Companion のミーティング質問タスクのコストと品質の主要な指標における、OpenAI GPT-4-32k に対する Zoom のフェデレーテッド AI の相対的な割合。Microsoft Copilot は、OpenAI GPT-4 をMicrosoft Graph やその他のコンポーネントとのオーケストレーションに使用しています。Zoom は AI モデルのトレーニングに顧客データを使用しませんが、このグラフでは OpenAI GPT-4 を Microsoft Copilot のプロキシとして使用し、ベンチマークに Zoom 社内のミーティング データを使用しました。

Zoom が提供するモデルの威力は、AI Companion の多言語パフォーマンスによってさらに増大しています。現在は英語に加えて 32 の言語(プレビュー中)がサポート対象になりました。ほとんどの LLM は主に英語中心のデータで事前にトレーニングされています。それを考慮して、Zoom は多言語機能を拡張するために翻訳モデルを追加しました。Zoom AI Companion が提供する多言語対応のミーティング要約では、Zoom の翻訳モデルを使用して英語以外の文字起こしを英語に翻訳することで、翻訳されたデータだけでなく、元のデータも同時に考慮に入れて要約しています。図 2 に示すように、Zoom のモデルは GPT-3.5 よりも AI 品質を大幅に向上させただけでなく、6% 以下のコストで GPT-4-32k の AI 品質に迫っています(相対割合で 97%)。

図 2: Zoom AI Companion がサポートする英語以外の 32 言語(中国語、フランス語、ドイツ語、イタリア語、日本語、ポルトガル語、スペイン語、ほか)での多言語要約タスクにおける、OpenAI GPT-4-32k に対する Zoom のフェデレーテッド AI の相対的な割合。Microsoft Copilot は、OpenAI GPT-4 をMicrosoft Graph やその他のコンポーネントとともに使用しています。このグラフでは OpenAI GPT-4 を Microsoft Copilot のプロキシとして使用し、ベンチマーク用に Zoom 社内のミーティング データを収集しました。

これらの例は、異なる機械学習システムの強みをシームレスに組み合わせて高いパフォーマンスを実現する、AI に対する Zoom のフェデレーテッド アプローチの有効性を強調しています。

成功を収めた AI へのアプローチ

Zoom は、できるだけ多くの人々が広く AI の恩恵を享受できるようにすべきだと考えています。Zoom の AI に対するフェデレーテッド アプローチは、このビジョンを実現する上で大きな役割を果たしています。だからこそ、他社がユーザーごとに割増料金を請求するのに対し、Zoom は対象となる Zoom 有料プランのお客様に、追加料金なしで AI Companion を提供できるような仕組みを整えたのです。*

AI Companion をぜひお試しください。これらの機能の有効化と使用方法の詳細については、Zoom の入門ガイドをご覧ください。対象となる Zoom 有料プランをお持ちでない場合は、今すぐアップグレードして AI Companion のメリットをぜひ享受してください。

* 注: AI Companion は、地域や業種によってはご利用いただけない場合があります。

 

ご愛顧いただいているお客様

Okta
NASDAQ
楽天
Logicool
Western Union
オートデスク
Dropbox
Okta
NASDAQ
楽天
Logicool
Western Union
オートデスク
Dropbox

Zoom - すべてのつながりをひとつのプラットフォームで