「もう何度目かわからないんですけど」。カスタマーサポートに届くこの一文を、キーワード検索や一般的なRAG(質問に似た文書を探して読ませるAI)はどう扱うでしょうか。おそらく「何度目」という語には反応せず、製品名だけを拾って定型のFAQを返します。ですが人間のオペレーターなら、ここに強い不満と解約の予兆を即座に読み取ります。この差が、感情・常識ナレッジグラフの出番です。
顧客は自分の感情を丁寧にラベル付けして書いてはくれません。怒り・不安・あきらめ・期待は、たいてい言葉の裏に隠れています。テキストの一致だけを見る仕組みは、この言外の部分を構造的に取りこぼします。本記事では、感情と常識を関係として持つナレッジグラフが、カスタマーサポートの現場で具体的に何を変えるのかを、研究の裏づけとともに整理します。
感情・常識ナレッジグラフとは何か
ふつうのナレッジグラフは「事実」を関係でつなぎます。たとえば「製品Aは機能Bを持つ」「不具合Cは手順Dで解決する」といった、確かめられる事実の網です。これに対して、感情・常識ナレッジグラフが持つのは人の内面と、書かれていない当たり前です。
常識ナレッジグラフ:出来事から感情・意図を推し量る
常識ナレッジグラフは、「ある出来事が起きたとき、当事者はどう感じ、次に何をしそうか」という因果や意図を関係として蓄えます。代表的な常識知識ベースであるATOMICは、ある発話や状況に対して「本人がどう反応するか(xReact)」「相手がどう反応するか(oReact)」といった関係を持ちます。「注文した商品が届かない」という事実から、明示されていなくても「本人は苛立っている」「返金や催促に動きそう」を補える。これが常識の力です。
ECoK:感情の理解・推論に特化したナレッジグラフ
従来の知識グラフは事実の表現に強い一方で、感情の理解と推論には弱いという課題がありました。この隙間を埋めるために提案されたのがECoK(Emotional Commonsense Knowledge Graph)です。心理学・認知科学・言語学の理論を統合し、テキストや対話、感情分析データから感情に関する常識を抽出して構築されています。あわせて公開された生成モデルCOMET-ECoKは、感情の常識推論においてGPT-4-Turboの性能を上回ったと報告されています(出典:Zhou et al., ECoK, ACL 2024 Findings)。汎用の大規模言語モデルに任せきりにするより、感情に特化した構造化知識を持たせたほうが、感情の読み取りは正確になり得るということです。
なぜテキスト検索だけでは足りないのか
カスタマーサポートの会話には、テキスト検索が苦手とする性質が3つそろっています。
- 感情は言外にある:「わかりました、もう結構です」は、字面は了承でも中身は怒りや離脱です。表層のテキスト一致では逆の意味に取りかねません。
- 意味は文脈で決まる:同じ「まだですか」でも、3往復目と初回では温度が違います。1発話だけ切り取ると感情を読み違えます。
- 当たり前が省略される:顧客は前提を書きません。「昨日の続きです」の背後にある経緯を、常識と履歴で補えないと的外れな回答になります。
感情認識の研究でも、この課題は「機械は人間のように文脈や常識に頼れない」点にあると指摘されています。会話中の発話をグラフのノードとして表現し(返信の連なりや意味の近さを関係として結ぶ)、そこに常識知識を足すことで、言外の感情や意図まで踏み込んで推定できるようになります(出典:Chen et al., PLoS ONE, 2024)。
この研究では、会話を関係でつないだグラフと常識知識を組み合わせた手法が、感情認識のベンチマークで既存手法を上回りました。会話データセットのDailyDialogでF1スコアが0.7527から0.7630へ、Friendsの会話を使うMELDで0.3762から0.3876へと改善しています。加えて、グラフ構造を外すと約3.82%、常識知識を外すと約1.84%スコアが下がったと報告されており、「会話の関係構造」と「常識」の両方がそれぞれ効いていることが数字で示されています。
言われる前に気づく:発話前の感情予測
感情の読み取りは、起きたことを分類するだけではありません。京都大学の研究では、会話の文脈と常識ナレッジグラフを使い、ユーザーが発言する前に、その発言をするときに抱くであろう感情を予測するモデルが提案されています(出典:藤本・伊藤, JSAI 2023)。サポートに引き寄せれば、次のやり取りで顧客が不満を強めそうな兆候を先回りで捉え、対応を切り替える余地が生まれるということです。
カスタマーサポートで、具体的にどう役立つか
感情と常識を構造として持てると、サポート業務の各所に効きます。技術そのものではなく、現場のどの手間が減るかで見ていきます。
1. 優先度付けとエスカレーション
入ってきた問い合わせを、文面の感情と経緯から自動で仕分けます。強い怒り・解約の予兆・不安が高いものを上位に上げ、担当や上長へ早く回す。全件を先着順でさばくのをやめ、こじれる前の一次対応に人を寄せられます。
2. 一次回答のトーン調整
同じ内容の回答でも、相手の感情に合わせて言い方を変えるべき場面があります。苛立っている相手にいきなり手順を並べると火に油です。感情を踏まえて「まず謝意、次に事実、最後に手順」のように構成と語調を切り替える下敷きにできます。
3. 先回りの対応
会話の流れから「このままだと次に不満が噴く」兆候を捉え、確認の一言や代替案を先に差し込む。発話前の感情予測が示すのは、この受け身から先回りへの転換の可能性です。
4. オペレーター支援(感情ラベルと根拠)
オペレーターの画面に、いまの顧客の推定感情と、そう判断した根拠(どの発話・どの経緯から読み取ったか)を添える。経験の浅い担当でも、ベテランが無意識にやっている感情の読みを補助として受け取れます。
5. VOC分析(感情×原因の集計)
個別対応だけでなく、蓄積した会話を「どの原因が、どの感情を、どれだけ引き起こしたか」で集計します。「初期設定のわかりにくさが、強い不満の最大の源」のように、改善の優先順位を感情の重みつきで出せます。単なる件数集計より、どこを直せば顧客体験が上がるかがはっきりします。
感情推定を過信しない:事実の確からしさは別で担保する
ここで釘を刺しておきます。感情の推定は確率的な読みであって、断定ではありません。皮肉・冗談・文化差で外すことがあり、誤った感情ラベルのまま自動応答すると、かえって顧客を怒らせます。だから感情・常識ナレッジグラフは、人の最終判断を助ける道具として使うのが基本です。自動で完結させるのは、誤っても影響が小さい範囲にとどめます。
もう一つ大事なのは、「どう感じているか(感情)」と「何が事実か(回答の中身)」を分けて扱うことです。感情を正しく読めても、返す情報が間違っていては意味がありません。回答の正しさは、事実を関係でつないだナレッジグラフ+RAGの側で担保します。製品・不具合・解決策・根拠を構造で持ち、引用元を示しながら答え、資料にないことは断定しない。この仕組みはGraphRAGとは?ベクトルRAGとの違いと、根拠付き回答を実現する実装で詳しく解説しています。
感情の常識と、事実のナレッジグラフを組み合わせる
整理すると、カスタマーサポートで効くのは次の組み合わせです。
- 感情・常識ナレッジグラフ:顧客がどう感じ、次に何をしそうかを読む。優先度付け・トーン・先回り・VOC分析に効く。
- 事実のナレッジグラフ+RAG:何が正しい回答か、その根拠はどこかを示す。誤案内とハルシネーション(もっともらしい嘘)を抑える。
前者が「相手の状態」を、後者が「回答の中身」を受け持ちます。感情だけ読めても中身が間違えば事故になり、中身が正しくても感情を外せば信頼を損ねる。サポート品質は、この2つがそろって初めて上がります。ナレッジグラフを構造化して持たせるほどAIの判断は確かになるという考え方は、井本賢『ナレッジグラフ活用大全:構造化すれば、AIは賢くなる』でも一貫して述べられています。
関係でつなぐ発想が事実の側でどんな問いに効くかは、ナレッジグラフは発注者に何の得があるかで業務シーン別に整理しています。社内ナレッジやサポートへのAI導入でつまずく分かれ目は、社内AIアシスタントとRAGの成功・失敗パターンもあわせてご覧ください。
どこから始めるか
感情・常識ナレッジグラフを入れるなら、いきなり全自動の応答を狙わないことです。感情推定は外すことがある前提で、まずは人が最終判断を持つ用途から始めます。問い合わせの優先度付けや、オペレーターへの感情ラベル提示のように、AIの読みが外れても人が拾える工程が向いています。
そのうえで、効果と誤りの両方を評価データで測りながら範囲を広げます。回答の中身の正しさは事実側のナレッジグラフとRAGで担保し、感情の読み取りは応対の質を上げる補助に徹する。この切り分けを守れば、感情を扱うAIでも事故を抑えながら現場に載せられます。関係でつなぐ発想を事実側でどう活かすかはGraphRAGとは?ベクトルRAGとの違いと、根拠付き回答を実現する実装、社内導入の勘所は社内AIアシスタントとRAGの成功・失敗パターンで扱っています。
よくある質問(FAQ)
Q. 感情・常識ナレッジグラフは、ふつうのナレッジグラフと何が違うのですか?
A. ふつうのナレッジグラフは「製品Aは機能Bを持つ」のように確かめられる事実を関係でつなぎます。感情・常識ナレッジグラフは、それに加えて「この出来事なら本人はこう感じ、次にこう動きそう」という人の内面や省略された前提を関係として持ちます。感情に特化して構築されたECoKのような知識グラフは、感情の常識推論で汎用の大規模言語モデルを上回ったと報告されています。事実側の仕組みはGraphRAGの解説もご覧ください。
Q. カスタマーサポートで最初に効果が出やすいのはどの用途ですか?
A. 問い合わせの優先度付けとエスカレーションです。強い怒りや解約の予兆を含むものを上位に上げるだけでも、こじれる前の一次対応に人を寄せられます。自動応答よりリスクが低く、人が最終判断を持つため、感情推定を外したときの影響も小さく抑えられます。ここで手応えを見てから、トーン調整やVOC分析へ広げるのが現実的です。
Q. 感情の推定を間違えて、かえって顧客を怒らせないですか?
A. その懸念はもっともで、感情推定は確率的な読みなので皮肉や文化差で外すことがあります。だからこそ、感情に基づく処理は人の最終判断を助ける用途から始め、全自動は誤っても影響が小さい範囲にとどめます。回答の中身の正しさは、事実を関係でつないだナレッジグラフとRAGの側で別に担保し、資料にないことは断定しない設計にします。
Q. 会話の1文だけでなく、やり取りの流れを踏まえて判断できますか?
A. できます。会話の発話を関係でつないだグラフとして扱い、返信の連なりや意味の近さを構造として持たせることで、文脈を踏まえた感情の読み取りができます。研究でも、この会話の関係構造と常識知識の両方が感情認識の精度に効くと数字で示されています。さらに、次の発言で顧客が抱きそうな感情を先回りで予測する研究も報告されています。
Q. すでに社内にサポート文書のAI検索があります。感情の仕組みは後から足せますか?
A. 足せます。事実を根拠つきで返すナレッジ検索を基盤に、感情・常識の読み取りを重ねる構成が組めます。まずは優先度付けやオペレーター支援など人が判断を持つ用途から小さく試し、効果と誤りを評価データで測りながら広げるのが安全です。費用の考え方はAI受託開発の費用相場も参考にしてください。
Beekleでは、生成AI/CDP/業務システムの企画・要件定義・開発・運用までワンストップで支援しています。「何を作れば成功か」の整理、検証フェーズの設計、本番化判断まで、発注側の判断材料が揃うように伴走します。費用感の概算だけでも歓迎です。