RAGとは、生成AIに外部の資料を検索させて、その内容をもとに答えさせる仕組みです。ChatGPTのようなAIは、学習していない社内情報や最新の情報を知りません。RAGを足すと、自社の文書を検索してから答えるので、知らないはずの情報にも根拠つきで応えられます。この記事では、RAGの意味、仕組み、ChatGPTとの関係、種類、導入の勘所までを順に解説します。
RAGとは何か(何の略か)
RAGとは、Retrieval-Augmented Generation(検索拡張生成)の略で、生成AIが回答を作る前に外部の資料を検索し、その内容を根拠にして答えを組み立てる仕組みです。
大規模言語モデル(LLM)は、学習したときの知識で文章を作ります。裏を返すと、学習に含まれない社内マニュアルや、学習後に更新された最新情報は答えられません。RAGは、回答の前に「まず調べる」工程を挟むことで、この弱点を補います。モデルそのものを作り直すのではなく、外から知識を渡すのがポイントです。
なぜRAGが必要なのか
LLMを業務でそのまま使うと、3つの壁にぶつかります。
- 社内情報を知らない:自社の規程や製品仕様は学習データに入っていないので答えられない。
- 知識が古い:学習した時点で知識が止まり、最新の変更に追従できない。
- それらしい嘘をつく:知らないことも自信たっぷりに作文する(ハルシネーション)。しかも根拠を示せない。
RAGは、回答のたびに自社の資料を検索して渡すので、この3つに同時に効きます。資料を更新すれば回答も最新になり、答えの出どころ(どの文書か)も示せます。
RAGの仕組み(検索から生成までの流れ)
RAGは大きく2段構えです。検索(Retrieval)と生成(Generation)を、この順につなぎます。
- 1. 準備:社内の文書を細かく分割し、意味をベクトル(数値の並び)に変換してデータベースに入れておく。
- 2. 検索:質問が来たら、その質問に意味の近い文書を検索して取り出す。
- 3. 生成:取り出した文書を質問と一緒にLLMへ渡し、その内容を根拠に回答を作らせる。
流れにすると、質問 → 関連文書を検索 → 文書を添えてLLMに渡す → 根拠つきで回答、となります。モデルの中の記憶に頼るのではなく、毎回その場で資料を引く。ここが、追加学習(ファインチューニング)との一番の違いです。
RAGで何ができるのか
- 社内文書への質問応答:マニュアル、規程、過去の問い合わせを横断して、社員や顧客の質問に答える。
- 根拠の提示:「どの資料のどこに基づくか」を回答に添えられるので、裏取りできて監査にも耐える。
- 最新情報への追従:元の資料を差し替えれば、回答もその場で最新に切り替わる。
社内ナレッジのAIを精度良く作る具体策は社内ナレッジAIの精度を上げる作り方にまとめました。
RAGの種類(ベクトルRAG・ハイブリッド・GraphRAG)
ひとくちにRAGと言っても、検索の作り方で守備範囲が変わります。
種類 | 探し方 | 得意な質問 |
|---|---|---|
ベクトルRAG | 意味の近さで文書を探す | 言い換え・表記揺れを含む単発の質問 |
ハイブリッド | 意味検索とキーワード検索を組み合わせる | 固有名詞や型番の正確さも要る質問 |
GraphRAG | 情報を関係でつないでたどる | 関係をたどる・数える・根拠を示す質問 |
ベクトルRAGとGraphRAGの違いと使い分けはGraphRAGとは?ベクトルRAGとの違いで、関係でつなぐ発注者メリットはナレッジグラフは発注者に何の得があるかで解説しています。回答精度を業務レベルに引き上げる方法は生成AIの回答精度を業務レベルに引き上げる方法を参照してください。
導入の勘所
RAGの精度は、モデルの賢さより、渡すデータの質で決まります。文書の分割の仕方、古い情報の除去、更新の運用を設計しないと、検索がずれて「それらしいだけ」の回答になります。まずは誤答すると困る一業務に絞り、小さく作って精度を確かめてから広げるのが堅実です。生成AIは以前より安く早く作れ、社内データを外に出さないVPS構成でも十分に運用できます。作り方の全体像はナレッジグラフエージェントの作り方、費用の考え方は生成AI開発の費用相場にまとめました。
よくある質問(FAQ)
Q. RAGとは何の略ですか?
A. Retrieval-Augmented Generation(検索拡張生成)の略です。生成AIが回答の前に外部の資料を検索し、その内容を根拠に答えを作る仕組みを指します。
Q. ChatGPTのRAGとは何ですか?
A. ChatGPTのようなLLMに、自社の資料を検索させて渡す仕組みを足したものです。LLM単体は学習済みの知識でしか答えられませんが、RAGを組み合わせると、社内文書や最新情報にも根拠つきで答えられるようになります。
Q. RAGとファインチューニングは何が違いますか?
A. ファインチューニングはモデル自体に追加学習させる方法で、RAGはモデルを変えずに外から資料を渡す方法です。RAGは資料を差し替えれば知識を更新でき、回答の根拠も示せます。頻繁に変わる社内情報を扱うなら、まずRAGが向きます。
Q. 社内の機密データをRAGで使っても安全ですか?
A. 設計しだいで安全に使えます。データを外部に出さないクローズドな構成(自社サーバーやVPS内で完結)にし、誰がどの情報にアクセスできるかを制御すれば、社外送信も権限外の閲覧も抑えられます。情シス目線の確認は社内文書を生成AI・RAGで扱う情報漏洩リスクと対策を参照してください。
Q. RAGの導入にはどれくらい費用がかかりますか?
A. 対象業務の広さと扱うデータ量で変わります。一業務に絞れば小さく始められ、高価な専用基盤も必須ではありません。費用の考え方は生成AI開発の費用相場を参考にしてください。
Beekleにご相談ください Beekleでは、生成AI/CDP/業務システムの企画・要件定義・開発・運用までワンストップで支援しています。「何を作れば成功か」の整理、検証フェーズの設計、本番化判断まで、発注側の判断材料が揃うように伴走します。費用感の概算だけでも歓迎です。