チャットボットが「分かりません」ばかり返すのは、多くの場合モデルが賢くないからではありません。何を覚えさせ、どう探し、どこまで答えさせるか。この設計が抜けているのが本当の原因です。答えられない状態は5つのパターンに分解できます。5つを順に潰していけば、型番や仕様のような込み入った質問にも答えるボットに変わります。
原因1: そもそも答えるためのデータが入っていない、または古い
最も多いのがこれです。FAQを数十件登録しただけで運用を始めると、現場の質問は登録済みの想定を簡単に超えます。製品マニュアル、社内規程、過去の問い合わせ履歴といった一次情報が入っていなければ、ボットは何も答えようがありません。加えて、製品改訂や規程改定のたびに元データが更新されないと、古い情報を自信満々に返す事故につながります。
対策: 一次情報を入れ、更新の担当と頻度を決める
- 入れる範囲を広げる:FAQだけでなく、製品仕様書、規程、過去チケットなど回答の根拠になる文書をまとめて取り込む。
- 鮮度を運用に組み込む:更新のオーナーと反映サイクル(改訂時や月次など)を先に決める。誰も更新しない仕組みは必ず腐ります。
原因2: 質問が言い換えられると検索がヒットしない
データは入っているのに答えない場合、検索の取りこぼしを疑います。利用者は登録済みの文言どおりには聞きません。「返品したい」と「返送のやり方」、「エラーE04」と「起動しない」のように、同じ意図でも表現が揺れます。キーワード一致だけの検索や、単一のベクトル検索だけの構成では、この揺れを吸収しきれず、関連文書があるのに拾えないことが起きます。
対策: 複数の探し方を組み合わせる
- ハイブリッド検索:キーワード検索と意味検索(ベクトル検索)を併用し、それぞれの結果を統合して精度を底上げする。
- 表記揺れを吸収する:型番の別表記や社内の略語を辞書として持たせ、言い換えを正規化してから検索する。
検索精度をどう詰めるかは社内ナレッジAIの精度を上げる作り方で技術面を詳しく解説しています。
原因3: 関係をたどる質問に弱い
「この型番に適合する部品は」「この規程の例外はどれか」「旧モデルの後継はどれで、その仕様差は」。こうした質問は、一つの文書を引くだけでは答えられません。型番から適合表をたどり、さらに後継品へ、というように複数の情報を段階的につなぐ必要があります。文書を一件ずつ探して貼り付けるだけの単純なRAG構成が最もつまずくのが、この多段の問いです。仕様や型番の質問で失敗が目立つのは、たいていここが原因になります。
対策: ナレッジグラフで関係を持たせる
- 関係を構造化する:製品、部品、適合、後継、規程、例外といった関係をナレッジグラフとして持たせ、たどれる形にしておく。
- グラフと検索を統合する:文書検索とグラフのたどりを組み合わせる(GraphRAG)ことで、多段の質問にも一貫した回答が返せる。
仕組みはGraphRAGとは?ベクトルRAGとの違いとナレッジグラフは発注者に何の得があるかで、発注検討者向けにかみ砕いています。構築の実務はナレッジグラフエージェントの作り方を参照してください。
原因4: 安全側に倒しすぎて何でも「分かりません」になる
間違った回答を防ごうとするあまり、確信が持てない質問をすべて突き返す設定にすると、今度は使えないボットになります。ハルシネーション(もっともらしい嘘)を嫌うのは正しい方向ですが、しきい値を厳しくしすぎると、根拠があるのに答えない状態が増えます。安全と実用のバランスが崩れている状態です。
対策: 答えを出しつつ根拠を添える
- 根拠提示をセットにする:回答と一緒に引用元の文書や該当箇所を必ず示す。利用者が真偽を確かめられれば、多少踏み込んだ回答も安全に出せる。
- 分からないの中身を分ける:資料に無いのか、質問が曖昧なのかを区別し、後者は聞き返して絞り込む。一律に突き返さない。
精度と実用の両立については生成AIの回答精度を業務レベルに引き上げる方法もあわせてどうぞ。
原因5: 答えられなかった質問が改善に還元されない
導入初日に完璧なボットはありません。差が出るのは、答えられなかった質問をその後どう扱うかです。未回答のログを誰も見ていなければ、同じ質問に何度でも失敗し続けます。逆に、答えられなかった問いを拾って資産に変える流れがあれば、使うほど賢くなります。
対策: 未回答を資産化するループを回す
- 未回答を集める:答えられなかった質問と低評価の回答をログとして蓄積し、定期的に棚卸しする。
- ナレッジに戻す:頻出する未回答は、不足文書の追加や関係の補強という形で元のナレッジに反映する。この往復が改善の実体です。
進め方: 小さく始めて、答えられない質問から広げる
全社の全文書を一度に取り込もうとすると、たいてい頓挫します。まずは問い合わせの多い一部門、一製品ラインに絞り、一次情報を入れて答えられる範囲を作ります。そこで出てきた未回答を見ながら、検索の調整、関係の構造化、根拠提示の順に手を入れていくと、投資を無駄にせず育てられます。自社データで閉じて動かすならVPS構成で十分安く、早く立ち上がります。問い合わせ対応そのものの自動化は問い合わせ対応を生成AIで自動化する進め方もご覧ください。
Beekleでも、実際のデータ量では通常のベクトルRAGに限界があった案件で、複数経路の検索とナレッジグラフ、回答後の根拠検証を組み合わせて精度を確保した実績があります。帝国データバンクの調査(2026年3月、有効回答1万312社)でも、生成AI活用の課題として情報の正確性を挙げた企業は50.4%で最多でした。答えの正しさをどう担保するかは、多くの現場に共通する関門です。
よくある質問(FAQ)
Q. FAQを増やせばチャットボットは賢くなりますか?
A. ある程度までは有効ですが、限界があります。利用者はFAQの文言どおりには聞かないため、件数を増やすより、製品仕様や規程などの一次情報を取り込み、言い換えに強い検索を組む方が効果的です。詳しくは社内ナレッジAIの精度を上げる作り方で解説しています。
Q. 型番や仕様の込み入った質問に答えられないのはなぜですか?
A. 型番から適合部品、後継品へと関係を段階的にたどる必要があり、文書を一件引くだけの単純なRAGでは対応しきれないためです。ナレッジグラフで関係を構造化するGraphRAGが有効です。
Q. 間違った回答(ハルシネーション)が心配です。どう防ぎますか?
A. 回答に引用元を必ず添える、資料に無いことは無いと答える、といった設計で抑えられます。ただし安全側に振りすぎると何でも分かりませんになるため、根拠提示とのバランスが重要です。生成AIの回答精度を業務レベルに引き上げる方法を参照してください。
Q. 導入したあと、精度は上がっていきますか?
A. 自動では上がりません。答えられなかった質問を集めてナレッジに戻すループを回して初めて、使うほど賢くなります。仕組みはナレッジグラフは発注者に何の得があるかやナレッジグラフエージェントの作り方で紹介しています。
Beekleにご相談ください Beekleでは、生成AI/CDP/業務システムの企画・要件定義・開発・運用までワンストップで支援しています。「何を作れば成功か」の整理、検証フェーズの設計、本番化判断まで、発注側の判断材料が揃うように伴走します。費用感の概算だけでも歓迎です。