AI 功績

AIにおけるRAGとは？検索拡張生成について解説

検索拡張生成がAIをより賢くする仕組みと、それがビジネスにとって重要な理由をご確認ください。

公開日 2026年5月18日

本ブログの内容

01 RAGとは - Jumplink to RAGとは
02 検索拡張生成の意味とは - Jumplink to 検索拡張生成の意味とは
03 RAGの仕組み - Jumplink to RAGの仕組み
04 RAGシステムの4つの主要コンポーネント - Jumplink to RAGシステムの4つの主要コンポーネント
05 RAGのメリット - Jumplink to RAGのメリット
06 RAGと微調整の違いとは - Jumplink to RAGと微調整の違いとは
07 RAGの実際の使用例 - Jumplink to RAGの実際の使用例
08 Zoom AIにおけるRAGの活用 - Jumplink to Zoom AIにおけるRAGの活用
09 組織でRAGの活用を始めるには - Jumplink to 組織でRAGの活用を始めるには
10 結論 - Jumplink to 結論
11 RAGに関するよくあるご質問 - Jumplink to RAGに関するよくあるご質問

Robin Bunevich

Zoom AI部門プロダクトマーケティングマネージャー

ZoomプロダクトマーケティングマネージャーのRobin Bunevichは、Zoom AI部門のプロダクトマーケティングおよび戦略を統括しています。Robinは、3年にわたりZoomのイベントソリューション製品のマーケティングを主導し、Zoomで急成長している製品の1つであるZoom Eventsをリリースしました。現在は、組織がAIをワークフローにシームレスに導入できるよう支援することに注力しています。Zoomに入社する前は、ニューヨーク・タイムズ紙でライブイベントのマーケティングを担当し、2020年3月には同組織のバーチャルイベントプログラムへの全面的な移行を支援するうえで重要な役割を果たしました。Zoomでは、15年以上にわたるマーケティングと広告の経験を活かし、Zoom AIソリューションの認知度向上と普及に努めています。

AIアシスタントは、今や現代の職場に欠かせない存在となっています。しかし、しばらく使っていると誰もが同じ問題に直面します。AIが自信満々に回答したにもかかわらず、その内容が誤っていたり、時代遅れだったり、または完全なでっち上げだったりするのです。この現象は「ハルシネーション」と呼ばれ、職場におけるAIの導入を遅らせる最大の信頼障壁の一つとなっています。

RAG（検索拡張生成）は、まさにその問題を解決するために生まれた技術です。RAGは今日のAI分野においてもっとも重要な概念の一つであり、その仕組みを理解することで、組織がAIツールをどのように導入すべきかについて、より賢明な判断を下せるようになります

Zoomでは、RAGがZoom WorkplaceのAI機能の中核技術となっています。これにより、単にインターネット上の情報を学習したモデルに頼るのではなく、実際のミーティング、ドキュメント、ワークフローに基づいた、正確でコンテキストに即した回答を提供できます。本ブログでは、RAGの仕組みと、それがビジネスにとって重要な理由について詳しく解説します。

Zoom AI

RAG（Retrieval-Augmented Generation: 検索拡張生成）とは、応答を生成する前に外部の信頼できるナレッジベースに接続することで、大規模言語モデル（LLM）の出力精度を高めるAIフレームワークです。

分かりやすく言うと、AIモデルがトレーニング中に学習した内容だけに頼るのではなく、RAGではモデルがリアルタイムで情報を検索できます。これにより、関連性のある最新情報や組織固有の情報を参照しながら、事実に基づいた回答を生成できるようになります。

AIアシスタントに専属のリサーチ司書を付けるようなものだとお考えください。質問に答える前に、その司書がデータを検索して関連する情報を見つけ出し、その情報を使用して、より正確で信頼性の高い回答を返せるようになります。

この用語は、2020年に発表された研究論文の中で、Meta AI、ユニバーシティ・カレッジ・ロンドン、ニューヨーク大学のPatrick Lewis氏らによって提唱されました。この研究チームは、RAGを「ほとんどすべてのLLMに適用でき、実質的にあらゆる外部データソースと接続できる汎用的なアプローチ」として説明しています。

検索拡張生成の意味を理解するには、まずその名前を3つに分けて考えると分かりやすくなります。

検索とは、企業の社内文書、データベース、製品マニュアル、リアルタイムのデータフィードなど、外部のナレッジベースから必要な情報を検索・取得するプロセスを指します。RAGでは、ユーザーの質問に対してもっとも関連性の高い情報を、これらのデータソースから探し出します。
拡張とは、取得した情報を、言語モデルに到達する前に元のプロンプトに追加することを意味します。これにより、モデルは学習時には得られなかった情報も参照できるようになります。
生成は最終的な回答生成段階です。言語モデルは、自身が学習した知識と検索によって取得した情報の両方を用いながら、正確で文脈に即した回答を生成します。

これらをまとめると、RAGは、AIが生成するすべての回答が、単なるトレーニングデータからの統計的パターンマッチングではなく、実際の取得可能な証拠によって裏付けられていることを保証するシステムです。

ステップ1 — ユーザーからのクエリを受け取る。ユーザーは質問をしたり、プロンプトを送信したりします。

ステップ2 — 検索モデルがナレッジベースを検索する。システムはクエリを、埋め込みまたはベクトルと呼ばれる数値表現に変換し、外部のナレッジベースを検索して、意味的にもっとも関連性の高いドキュメントまたはデータチャンクを探し出します。

ステップ3 — 関連情報が返される。検索結果の中からもっとも関連性の高いコンテンツがナレッジベースから抽出され、追加コンテキストとして言語モデルにも渡されます。

ステップ4 — プロンプトを拡張する。元のユーザークエリと、検索によって取得したコンテンツを組み合わせて、より情報量の多いプロンプトを作成します。

ステップ5 — LLMが回答を生成する。言語モデルは、学習済みの知識と検索によって取得したコンテキストの両方を使用して、正確で最新、かつ実際のデータに基づいた回答を作成します。

ステップ6 — 回答をユーザーに返す。多くのシステムでは、回答とともに引用情報や出典も表示されるため、ユーザー自身が内容を検証できます。

これが、まさにZoom Workplaceがユーザーの質問に回答するときの仕組みです。ミーティング、チャット、ドキュメント、接続されたサードパーティアプリから関連情報を取得し、一般的なトレーニングデータだけを頼りに推測するのではなく、実際のデータに基づいて回答を生成します。これと同じ検索アーキテクチャが、ZoomMateのエージェント検索機能にも活用されています。必要なタイミングで、Googleドライブ、Salesforce、ServiceNowなどの連携アプリから関連情報を取得し、ユーザーへ提示できるようになっています。

RAGの内部的な仕組みを理解することで、組織はRAGをより効果的に実装し、その価値を適切に評価できるようになります。すべてのRAGシステムは、4つの基本コンポーネントを土台として構築されています。

ナレッジベース

ナレッジベースとは、システムが情報を取得するための外部データリポジトリです。社内ドキュメント、PDF、ヘルプセンターの記事、製品仕様書、ミーティングの文字起こし、CRMレコードなど、事実上あらゆる種類のデータを格納できます。ただし、ナレッジベースの価値は情報の鮮度に大きく左右されるため、適切に管理し、定期的に更新し続けることが、AIが高品質な回答を生成するために不可欠です。

埋め込みとベクトルストレージ

データをインテリジェントに検索できるようにするためには、まず検索システムが理解できる形式に変換する必要があります。そこで利用されるのが「埋め込み」と呼ばれるプロセスです。埋め込みでは、テキストをベクトルと呼ばれる数値表現に変換します。生成されたベクトルはベクトルデータベースに保存され、意味的類似性に基づいて整理されます。その結果、類似したテーマのコンテンツは近い場所に配置され、クエリ時に関連情報をより高速かつ高精度に検索できるようになります。

ドキュメントは通常、埋め込みを行う前にチャンクと呼ばれる小さなセグメントに分割されます。適切なチャンクサイズを設定することは、非常に重要です。大きすぎると情報が広範すぎて検索精度が下がり、小さすぎると文脈が失われて意味が伝わりにくくなります。

リトリーバー

リトリーバーは、ユーザーからクエリを受け取った際にナレッジベースを検索するコンポーネントです。ユーザーの質問をベクトルに変換し、ナレッジベースをスキャンして意味的にもっとも近い情報を見つけ出します。ここで重要なのは、RAGが単なるキーワード検索ではなく、概念的に近い情報を検索する点です。このセマンティック検索アプローチにより、ユーザーの言い回しとソースドキュメント内の表現が完全に一致していなくても、関連情報を正確に見つけることができます。

ジェネレーター

ジェネレーターは、大規模言語モデルそのもので、最終的な回答を生成するコンポーネントです。リトリーバーが取得した情報が追加されたプロンプトを受け取り、トレーニング済みの知識と、検索によって取得した固有の最新情報の両方を活用して回答を生成します。

RAGがエンタープライズ向けAIに最適なアーキテクチャとして急速に普及しているのには、明確な理由があります。ここでは、RAGがもたらす大きなメリットを紹介します。

ハルシネーションを大幅に削減できます。RAGでは、AIはメモリからのパターンマッチングだけに頼らず、実際に検索で取得した検証可能なドキュメントに基づいて回答します。そのため、事実と異なる情報や存在しない情報のねつ造など、不正確な回答が発生するリスクが大幅に低下します。回答は、組織が管理する実際のコンテンツに基づいて生成されます。
常に最新の情報を利用できます。大規模言語モデルには、トレーニングデータの更新期限があり、その時点を超えると、新たなイベント、最新のポリシー、変更された業務プロセスなどについての情報は一切知りません。RAGは、クエリを受け取るたびに最新のナレッジベースを検索することでデータの更新期限を回避し、常に最新情報を反映した回答を提供できます。
再トレーニングなしで業務特化型AIを実現できます。モデルを組織の内部知識（ポリシー、製品ドキュメント、顧客対応履歴）に接続することで、基盤モデルをゼロから再トレーニングする必要がなくなり、莫大なコストや複雑な運用を避けながら、ビジネスに特化した回答を行えるようになります。
コスト効率よく拡張できます。基盤モデルの再トレーニングや微調整には、計算コストがかかるうえ、長期間を要します。RAGでは、AIの知識を拡張または最新化したい場合、組織はナレッジベースを更新するだけで済みます。そのため、ビジネスの成長や情報量の増加にも柔軟かつ低コストで対応できます。
情報源が明確になり、信頼性が向上します。RAGシステムでは、回答とともに引用元や参照ドキュメントを表示するため、ユーザーは根拠を確認できます。こうした監査可能性は、意思決定前に情報の検証が求められる企業環境において非常に重要です。
デベロッパーによる管理がしやすくなります。ナレッジベースとモデルが分離されているため、デベロッパーはモデル自体に手を加えることなく、モデルがアクセスできるデータソースの調整、制限、拡張をいつでも行えます。これにより、ガバナンス、コンプライアンス、メンテナンスが格段に管理しやすくなります。
高いデータセキュリティを実現できます。RAGは、機密情報をモデルのパラメータに組み込むことなく活用できます。アクセス権はナレッジベースレベルで付与したり取り消したりできるため、AIに何を見せるか、何を見せないかを、組織が細かく管理できます。

組織にとって、より正確で関連性の高い回答ができるAIモデルを実現したい場合、主な選択肢は大きく分けて2つあります。微調整とRAGです。

微調整とは、自社のデータを用いてモデルを再トレーニングさせ、その知識をモデルのパラメータに組み込むことです。明確に定義された業務や比較的変化が少ないタスクでは優れた効果を発揮しますが、コストが高く、導入に時間がかかり、データが更新されるたびに再トレーニングが必要になります。
一方RAGは、基盤モデルを保持したまま、クエリ時に必要な知識を動的に取得します。そのため導入が迅速で、コスト効率もはるかに高く、再トレーニングなしで最新のデータを自動的に反映できます。

これら2つのアプローチは、どちらか一方を選ばなければならないものではありません。実際に多くの組織がこれらを組み合わせて使用しています。微調整によって、特定分野の専門用語や慣習をモデルに習得させる一方で、RAGによって、各クエリ時点の最新情報や具体的な事実を取得します。ほとんどのエンタープライズのユースケースでは、特に情報が頻繁に更新されるような場合、RAGが現実的な出発点です。

RAGはすでに、職場におけるもっとも価値の高いAI活用の一部を支えています。ここでは代表的な活用例をご紹介します。

カスタマーサポート。RAGを搭載したAIチャットボットは、製品ドキュメント、ヘルプセンターの記事、顧客履歴などを参照しながら回答できます。そのため、すべての問い合わせを人間のエージェントにルーティングすることなく、正確でパーソナライズされた回答を提供できます。
社内ナレッジ検索。従業員は自然言語で質問するだけで社内情報をすぐに取得できます。たとえば、「当社の育児休暇制度はどのようなものですか？」や「先週火曜日の全社会議で決まったアクションアイテムは何でしたか？」といった質問に対して、社内システムから情報を検索し、根拠付きの回答を返すことができます。
法務・コンプライアンス。法務チームはRAGを使用して契約書、規制当局への提出書類、判例などを検索できます。これにより調査業務を大幅に効率化できるだけでなく、回答の根拠となる情報源を確認できるため、信頼性も確保できます。
医療機関。医療従事者は、RAGシステムを使用して臨床ガイドライン、患者記録、研究文献を検索対象として活用できます。その結果、診療現場で必要な情報を迅速に取得し、根拠に基づいた判断や推奨を受けることができます。
営業支援と収益拡大支援。営業チームは、顧客との商談中に、フォルダを探しまわったり、複数のアプリを切り替えたりすることなく、適切なケーススタディ、競合比較資料、価格情報を即座に表示できます。
オンボーディングとトレーニング。新入従業員は、業務に関する疑問点を質問するだけで、社内文書から抽出された正確な回答を得ることができます。これにより、業務習得までの時間が短縮され、人事部や管理者の負担が軽減されます。特に、新入社員がすぐに直接指導を受けられない可能性があるハイブリッドワーク環境では、こうした活用が大きな効果を発揮します。

多くのエンタープライズ向けAIツールは、何十もの分散したデータソースに対してリアルタイム検索を行う仕組みに依存しています。このアプローチでは検索速度が遅く、情報が不完全で、システムにまたがるコンテキストを見逃すことがよくあります。Zoomは、これとは異なり、事前にインデックス化されたナレッジレイヤーを使用して、迅速かつ包括的な回答を提供できるようにしています。

職場全体でのエージェント型検索

Zoom WorkplaceのAIは、組織の知識に即座にアクセスできるインテリジェントなインデックスレイヤーによって支えられています。対象となるデータは、Zoomミーティング、チャット、ドキュメントなど多岐にわたり、さらにはGoogle Drive、OneDrive、SharePoint、Salesforce、ServiceNow、Confluence、Box、Zendesk、Workday、Seismicなどのサードパーティアプリとも連携できます。ユーザーが質問すると、AI Companionは単一のデータソースを検索するだけではなく、組織全体のデジタルワークスペースからコンテキストをインテリジェントに取得して統合し、包括的で正確な回答を生成します。

その裏で、Zoomの検索レイヤーは拡張スキーママッピングを使用して、断片化されたデータと構造化レコードを統一フォーマットに変換し、高精度な検索を可能にしています。さらに、差分同期によって変更されたデータのみを更新するため、コンテキストを最新の状態に保ちながら、インデックス作成のオーバーヘッドを大幅に削減します。

状況認識型インテリジェンス

関連リンクのリストを返す基本的な検索ツールとは異なり、ZoomMateの検索では、次の3つの側面を理解するコンテキストレイヤーによって実現します。3つの側面とは、関係性（誰が何を担当し、人・システム・データがどう結びついているか）、知識（ポリシー、プロセス、分野の専門知識）、履歴（過去の行動、意思決定、業務成果）です。

つまり、ZoomMateは単にドキュメントを検索するだけでなく、組織全体の背景や文脈を理解したうえで回答します。たとえば、暗黙の参照を解決（つまり「私たち」という表現が出てきた場合にどの特定の組織を指しているのかを理解）し、ロールや拠点なども考慮し、組織の実際の業務に即した回答を提供します。ITリーダーとしてプロビジョニングの問題をトラブルシューティングしている場合でも、サポートエージェントとして顧客対応チケットを解決している場合でも、アナリストとして四半期レポートのインサイトをまとめている場合でも、得られる回答は豊富なコンテキストに基づき、個々の状況に合わせて最適化され、すぐに行動に移せる実用的なものになります。

権限を考慮した安全な設計

セキュリティがすべてのレイヤーに組み込まれています。Zoomの検索では、管理者が設定した安全なコネクタを介してデータにアクセスし、すべてのステップで関係性ベースのアクセス制御（ReBAC）を利用してアクセス権限を管理します。これにより、コンテキストに合わせて権限を調整でき、従業員には「アクセスが許可されている情報のみが表示される」ことが徹底されます。また、3つの保護レイヤーが連携して機能します。ReBACは、許可されたユーザーのみにデータへのアクセスを制限し、リアルタイムで権限を動的に適応させ、最小アクセスの原則に従います。サービスアカウントは、必要最小限の権限のみ付与し、共有認証情報を使わずに、サービスレベルのアクセスを提供します。カスタムルールは、包含フィルター、除外フィルター、データセット単位の制御が可能で、柔軟なガバナンスを実現できます。

データは転送中に暗号化され、検索インデックスは組織の既存のデータ保持およびガバナンスポリシーに準拠します。

会話から業務完了まで

エンタープライズ向け検索の時代は、「検索すること」から「回答を得て行動すること」へと移行しています。従来のモデルでは、キーワード検索、検索結果の一覧、複数タブの確認、手作業での情報整理が必要でした。現在は、引用元付きの回答を返し、自動化されたアクションをトリガーする、自然言語で質問する時代へと変わってきています。

Zoomは、この変化を体現するAIエージェント機能をこれまでに導入してきました。Zoom Workplaceに含まれる一部のAI機能、ならびにZoomMateは、複数のデータソースを横断して推論し、ユーザーに代わってアクションを実行し、多段階のワークフローを自動化できるようになりました。そしてそのすべてがRAGによって支えられており、AIのすべてアクションが取得された正確な情報に基づいて行われています。

つまり、ZoomにおいてRAGは、単に答えを見つける手助けをする技術ではありません。フォローアップのメール作成から、必要だと気づいていなかったインサイトの発掘まで、業務を進める手助けをしてくれます。

中小企業にとって朗報なのは、RAGシステムをゼロから構築する必要がないことです。AI機能を搭載したZoom Workplaceのようなプラットフォームを利用すれば、チームがすでに使用しているミーティング、チャット、ドキュメントなどの業務ツールに、RAGによる高度なAI機能を簡単に導入できます。インフラを管理する必要も、専門のデータサイエンスチームを用意する必要もありません。

さらに管理者は、AIモデルそのものに手を加えることなく、コネクタを一元管理し、データの取り込みライフサイクルを管理し、データ保持ポリシーを適用できます。独自のナレッジベースやサードパーティのビジネスアプリとの連携など、より高度なカスタマイズが必要な組織向けには、さらに機能を拡張できるZoomMateが用意されています。

RAGとは一言で何かというと、AIの信頼性を高める技術です。

検索拡張生成は、大規模言語モデルの自然な対話能力と、リアルタイムでデータを検索・取得する精度を組み合わせることで、単に「賢そうに聞こえる」だけでなく、「実際に賢い」AIを実現します。RAGを活用したAIは、根拠となる情報源を示し、常に最新情報を参照でき、ビジネス固有の知識を理解しています。

AIがあらゆる業界で実験段階から実務に不可欠な段階へと移行する中、RAGは単なる知っておくべき技術用語ではありません。現在構築されている最先端のエンタープライズ向けAI体験を支える基盤技術であり、より高度な連携と文脈理解を実現するための土台です。

情報を検索するだけではなく、本当に理解することを始めましょう。検索に基づいたAIアシスタントが、職場全体をどのように的確に支援するのかをご覧ください。

Zoom AIの詳細を見る

AIにおけるRAGとは何の略ですか？

RAGはRetrieval-Augmented Generation（検索拡張生成）の略です。これは、大規模言語モデルを外部のナレッジベースと連携させ、回答を生成する前のクエリ時に関連情報を取得できるようにするAIフレームワークです。

RAGと通常のLLMの違いは何ですか？

一般的な大規模言語モデルは、トレーニング中に学習した知識のみに基づいて回答します。そのため、トレーニング後に発生した出来事や、組織固有の非公開データにはアクセスできません。一方RAGは、検索ステップでモデルを補強し、回答を生成する前に、最新かつ関連性の高い、分野固有のコンテンツを検索して取得します。その結果、より正確で最新かつ文脈に即した回答を提供できるようになります。

RAGにおけるベクトル埋め込みとは何ですか？

ベクトル埋め込みとは、テキストを数値表現として表現したものです。RAGシステムは、このベクトルを利用してユーザーのクエリとナレッジベースの情報との意味的類似性を測定します。埋め込みはキーワードを正確に一致させるのではなく、意味を捉えるので、「休暇制度について教えて」という質問に対して「有給休暇」というフレーズが使用されているドキュメントを検索できます。

RAGはAIのハルシネーションを排除できますか？

RAGは、取得した検証可能なドキュメントを根拠として回答を生成するため、ハルシネーションの発生を遅らせることができます。ただし、完全に排除できるものではありません。ナレッジベースの品質と検索メカニズムの両方にも左右されます。それでも、現在利用可能な技術の中では、AI出力の事実精度を向上させるもっとも有効な手法の一つとされています。

RAGは微調整と同じものですか？

いいえ。微調整は、自社データを使ってモデルを再トレーニングさせ、その知識をモデル内部に組み込む手法です。一方RAGは、モデル自体を変更せず、各クエリ時に動的に必要な知識を外部から取得します。一般的にRAGは導入が早く、情報更新に強いという特徴があります。また、両者を組み合わせて利用することも可能です。

RAGはどのようなデータにアクセスできますか？

RAGは、構造化データ・非構造化データを問わず、さまざまなデータソースと連携できます。たとえば、社内文書、ナレッジベース、データベース、製品マニュアル、CRMデータ、ミーティングの文字起こし、人事ポリシーなどが対象になります。重要なのは、それらのデータが検索システムによって効率的に検索できるようにインデックス化されていることです。

RAGはエンタープライズ用途で安全ですか？

はい、正しく実装されていれば、安全に利用できます。RAGは公開インターネットではなく、自社で管理するナレッジベースに接続するため、組織はアクセスコントロール、データガバナンスポリシー、コンプライアンス要件を適用できます。たとえば、Zoom Workplaceでは、従業員の権限に応じてアクセス可能な情報のみを取得する仕組みが採用されています。

RAGにおけるチャンク化とは何ですか？

チャンク化は、ドキュメントをベクトル化する前に小さなセグメントに分割する処理のことです。適切なチャンクサイズを設定することで、ナレッジベースに保存されるコンテンツの断片が、ユーザーのクエリと正確に一致するのに十分な具体性を持ちながら、同時に生成される回答の中で意味を持ち有用であるため必要な文脈も保持できます。

職場におけるRAGの活用例にはどのようなものがありますか？

代表的な例としては、AIチャットパネルで「先週のミーティングでは、プロジェクトのスケジュールについて何が決まりましたか？」と質問するケースがあります。Zoom Workplaceは、単にトレーニングデータから推測したり一般的な回答を返したりするのではなく、関連するミーティングの文字起こしを取得し、該当箇所を見つけて意思決定内容を要約します。

ZoomはRAGをどのように使用していますか？

ZoomMateは、検索拡張生成（RAG）を使用して、実際のZoomミーティング、チャット、ドキュメント、および連携しているサードパーティアプリのコンテキストに基づいたAI支援を提供しています。そのため、ZoomMateは、一般的な回答ではなく、組織内で実際に議論・決定された内容に基づいた要約、アクションアイテム、回答を生成します。さらに回答には出典や引用情報を表示して、ユーザー自身が内容を確認・検証できるようにします。