
新しい AI アシスタント、Zoom AI Companion が登場!
Zoom AI Companion で、生産性とチームのコラボレーションを向上させましょう。該当する有料の Zoom プランがあれば追加料金なしでご利用いただけます。
Zoom AI Companion 2.0 は、音声認識と、AI 生成のミーティング インテリジェンスの品質において業界大手の競合他社をリードしています
更新日 November 20, 2024
公開日 November 14, 2024
Xuedong Huang は弊社の最高技術責任者(CTO)です。Zoom に入社する前は、Microsoft に勤務し、Azure AI CTO 兼テクニカル フェローを務めていました。AI 分野でキャリアを積んできました。1993 年に Microsoft の音声テクノロジー グループを立ち上げ Microsoft AI チームを率いて、音声認識、機械翻訳、自然言語理解、コンピュータ ビジョンにおいて業界初の「人間に匹敵する画期的機能」を複数開発することに成功しました。IEEE および ACM のフェロー、全米技術アカデミーとアメリカ芸術科学アカデミーの選出メンバーでもあります。
1989 年、英国の ORS とエディンバラ大学からの奨学金支援によりエディンバラ大学で電気工学博士号を取得し、1984 年に清華大学でコンピュータ サイエンス修士号、1982 年に湖南大学でコンピュータ サイエンス学士号を取得しました。
平等化を進めるうえでテクノロジーが優れた役割を果たすことがあります。人工知能(AI)も例外ではありません。AI のサポートによって、これまで私たち人間が成し得なかったことが達成できるかもしれません。当社が Zoom AI Companion の機能を次々と開発していく中で何よりも心に留めていることは、どうすれば Zoom プロダクトがお客様をサポートできるか、最高品質の結果を提供してお客様の業務の効率化と成功に貢献できるか、ということです。
AI Companion はさまざまな業界のお客様にご利用いただいており、その範囲は金融機関、医療機関、教育機関、行政機関など、多岐にわたります。大学を含む教育機関では現在、学生や教師がすでに Zoom の AI 機能を利用して講義へのアクセシビリティ向上に役立てています。医療機関ではバーチャル予約が導入され、患者は文字起こしや要約の機能を使って医療にアクセスする機会を増やしています。
AI を活用してテクノロジーの利便性を高めるという施策は、聴覚障害者向けの字幕だけでなく、言語の壁を取り除くための機能でも有用です。35 年前、私がまだスコットランドのエディンバラの学生で英語を学習していたころ、BBC の字幕のおかげで理解が深まりましたが、それだけでなく世界中の人々にとって、正確な字幕がどれほど役に立つかも肌身に感じました。AI の使用はすでにさまざまな場面に広がっていますが、さらに多くの人々の可能性を開花させるために、Zoom では引き続き AI の品質向上に取り組んでいきたいと考えています。
ミーティングの文字起こしでの成功例は、AI の品質向上施策の一部ではありますが、AI によってどのようにユーザーのスキルと体験が強化され、ユーザーが一歩先に進むために役立つのか、そのさまざまな側面に関連しています。そうした側面には、ミーティングやウェビナーの自動ライブ字幕、ライブ字幕の別言語への翻訳、または AI Companion を使用したミーティングの文字起こし(ミーティング要約、スマート レコーディング、アクション項目などに使用)などがあげられます。グローバルなビジネス環境において、よりアクセスしやすい公平なミーティング体験を構築することは、誰にとっても有益です。
今年初めの記事で、AI に対する Zoom のフェデレーテッド アプローチは、他社の AI モデルのアプローチに比べてかなり費用を抑えているにもかかわらず、同等またはずば抜けて優秀だとお伝えしました。今回は TestDevLab が委託した最新の Zoom AI パフォーマンス評価の結果をご共有したいと思います。この結果から、Zoom AI Companion 2.0 が、他社の評価済み AI ツールに対して、音声認識とミーティング インテリジェンスの分野で牽引役になっていることがさらに顕著になっています。
Zoom AI Companion 2.0 は、業務とウェブの情報をシームレスに連携させて、Zoom Workplace 体験を見事にアップグレードさせています。Zoom Workplace に AI 機能を連携させる方法は多々ありますが、もっとも幅広く使われている AI 機能(ミーティング要約、アクション項目、文字起こしなど)を強化する AI Companion の側面を 1 つあげましょう。
その側面とは、こうした AI 機能の有効性を左右する、元となる文字起こしの精度です。ミーティング内質問など、Zoom で人気の AI 機能の多くは、高品質な音声認識に支えられています。信頼できる文字起こしがあるからこそ、AI は名前やトピック、意図を正確に捉えることができ、それを土台に要約やハイライト、実用的なインサイトを生成できます。
文字起こしの精度を測定する業界基準は、人間が生成した文字起こしと AI が生成したものとの差異の割合を比較する、単語誤り率(WER)です。Zoom では、ここ数年 WER を最小化するべく AI アーキテクチャの最新化に取り組んできました。WER を最小化することで、精度の高い信頼できる文字起こしが作成でき、効果的で実用的な結果をお客様に提供できます。
WER 分析では、赤い文字が「文字起こしされなかった」単語、青い文字が「原文の文字起こしには見当たらない」単語を示します。
結果は明白でした。Zoom AI Companion は Microsoft Teams に比べて高性能で、圧倒的に WER が低く、より精度の高い文字起こしを提供していることがわかりました。すべての単語が重要なミーティングでは、少しでも文字起こしにミスがあると、要約やタスク、ミーティング中に提起された質問への回答に大きな影響を与えかねません。
TestDevLab によるテストの作成および実行方法は以下のとおりです。
各テストでは、Zoom Workplace と Microsoft Teams を比較し、各ミーティングの単語誤り率を測定しました。
WER(単語誤り率)の測定では、割合が低いほど文字起こしの品質が高いことを意味します。
ミーティングの要約と文字起こしは、数ある AI プラットフォームの中で、人気と使用度がもっとも高い機能の一部です。非常に幅広く使用されているため、できる限りエラーを削減することがさらに重要になります。これらの機能によって時間が節約できるうえ、ユーザーが多大な価値を置く重要な情報の閲覧や要約、深い理解が可能なため、人気があるのです。
TestDevLab では、Zoom Workplace と Microsoft Teams 双方についてミーティング要約の品質と会話型 AI(回答の安定性など)についても評価しました。要約を評価するため、人間による検証結果を備えた LLM アシスタントを作成しました。
TestDevLab が測定した AI Companion 機能は、文字起こしだけではありません。文字起こしと違い、ミーティング要約などのその他の AI 機能は、単語を一語一句複製しているわけではなく、ミーティングの内容をユーザーの要望に沿ってカスタマイズして提供しています。
TestDevLab では、Zoom Workplace と Microsoft Teams 双方についてミーティング要約の品質と会話型 AI(回答の安定性など)についても評価しました。要約を評価するため、人間による検証結果を備えた LLM アシスタントを作成しました。
この評価では、Microsoft Teams の要約機能であるインテリジェントな要約機能(Teams Premium または Microsoft 365 Copilot ライセンスで利用可能)と、Teams Meetings の Microsoft Copilot AI アシスタントによるプロンプト ベースの要約生成機能の 2 つをテストしました。Copilot AI アシスタントはプロンプトの指示がないと要約を生成できないため、ミーティング終了時に要約とアクション項目を生成するよう、Copilot にプロンプトで指示を出しました。
会話型 AI については、TestDevLab は AI プラットフォームがミーティング中に質問に回答する様子を、ミーティング内容に関連する質問と、ミーティングには関係のないウェブ検索に関連する質問(世界一の高層ビルは何?など)の両方に対して測定しました。回答の時間と安定性(ミーティング参加者全員が同じ回答を受け取る能力)の両方で、Zoom AI Companion は Microsoft を凌駕しました。
安定性が高いということは、Zoom の AI が一貫して信頼性の高い回答を参加者全員に提供しており、ミーティング中によりスムーズな体験を提供していることを示しています。
この結果は、Zoom Workplace と AI Companion の品質に対する当社の取り組みを浮き彫りにしています。Zoom では、人々がより簡単につながり合い、日常業務をより効率的にこなし、仕事のサポートに人工知能を利用する機会が持てるよう、その道筋作りに努めています。AI 生成のミーティング文字起こしは、AI Companion を使用して、聴覚障害者や難聴者、ミーティングのメイン言語とは異なる言語の話者など、多くの人々がより公平な体験を得られるようにするための 1 つの方法にすぎません。
TestDevLab が実施したこの評価により、評価済みの他社機能に比べて文字起こしの精度が高く、ミーティング内質問に対する回答が迅速で、会話型 AI 機能がより安定している Zoom Workplace と AI Companion が、AI パフォーマンスの牽引役であることが明白になっています。
さらに、Zoom Workplace では、AI 機能を利用するユーザーごとに追加料金が課せられる一部の代替プラットフォームと異なり、Zoom の有料アカウントがあれば AI Companion を追加料金なしで利用できます。Zoom では、精度の高い変革的なこれらのツールを、できる限り多くのお客様に提供することが重要だと考えています。そこでまずは土台となる高品質な文字起こしを作成し、その後もすべてのお客様への優れた AI 体験の構築を継続して行っています。
対象となる Zoom 有料プランをお持ちでない場合は、今すぐアップグレードして AI Companion のメリットをぜひ享受してください。