ナレッジグラフ(KG)を全社に入れようとして止まる会社は多いです。難しいのは技術そのものより、どの切り口で、どこから手をつけ、どう組み上げるかという設計の判断です。情報を全部いっぺんにつなごうとすると、たいてい重さに負けます。
ここでは、企業でよく採られる4つの切り口と、狭い範囲から立ち上げる作り方を、工程ごとに「実際に何をするか」まで下ろして説明します。記事の終わりには、大手企業の一部門でこの手順どおりに設計したときの話を、社名や中身を伏せて添えます。
ナレッジグラフは何を「つなぐ」ものか
ナレッジグラフは、社内のデータを「誰が・何に・どう関わるか」という関係の形で持っておく方法です。文書を一つずつ探すRAG(検索拡張生成)では答えにくい問い、たとえば関係を追う、正しく数える、抜けている事実を見つける、判断の根拠を示す、といったものに応えられます。買い手の視点での基礎はナレッジグラフは発注者に何の得があるか、技術寄りの解説はGraphRAGとは?ベクトルRAGとの違いにまとめています。
企業でのナレッジグラフ、4つの切り口
企業のKGは、何をつなぐ対象にするかで大きく4通りに分かれます。自社のどの困りごとに刺さるかで選びます。
パターン1:文書をつなぐ
規程、マニュアル、議事録、仕様書といった社内の文書を読み込み、そこに出てくる人・部署・製品・用語と、それらの関わりを取り出してグラフにします。別々のファイルに散らばっていて人が気づきにくいつながりを、たどれるようにするのがねらいです。
「この規程は誰の承認が要るのか」「この言葉はどの文書で定義されているのか」といった問いに強くなります。作るときは、見出しや章の構造をそのまま取り込み、人名や製品名を用語辞書と照らして表記をそろえ、文書から定義、その改訂の履歴へと順にたどれるようにします。気をつけるのは版の扱いで、古い版を今のものと取り違えないよう、文書には有効な期間を持たせておきます。
パターン2:仕事の流れをつなぐ
申請、承認、前後関係のあるタスクなど、業務の流れをグラフに写し取ります。どこで滞っているか、ある工程の遅れが他の何を止めるのかを、目で追える形にします。
「承認が下りずに止まっている申請はどれか」「この工程が遅れると何が動かなくなるか」に答えられます。タスクから、その前提になるタスク、担当する役割、承認の条件へと線を引き、誰がいつ何を承認したかの記録を流し込みます。承認の記録がぶら下がっていない申請を、存在しない状態のままそっくり拾えるのが効きどころです。流れの定義と、実際に流れた申請のデータは、別々に持ちます。
パターン3:人と技能をつなぐ
社員の技能、携わった案件、持っている専門性をつなぎます。誰をどこに置くかの判断や、社内で手薄になっている領域の見つけ出しに使います。
「この技術が使えて、いま余力のある人は誰か」「この分野の知見が足りていないのはどこか」に応えられます。人事のデータ、案件の履歴、成果物の作成者などから技能を推し量り、本人の申告と突き合わせて確からしさを添えます。先に技能の分類(オントロジー)を決めておくことが、うまくいくかどうかを左右します。評価に直結する情報を含むので、閲覧の権限は厳しく管理します。
パターン4:障害と原因をつなぐ
起きた障害やトラブルを、その原因、打った手、関わった設備やシステムと結びつけます。原因を突き止める作業を機械に手伝わせ、同じ失敗の再発を抑えます。
「同じ原因の障害は前にもあったか」「この部品がもとで起きた事象は何件か」に答えられます。振り返りの記録や対応の記録から、事象・原因・対処を取り出してつなぎ、似たトラブルをグラフの近くから引き当てて、一次対応に根拠つきで差し出します。因果は人が確かめ、確定した因果と、まだ推測の段階のものを、線の上で区別して持ちます。相関を因果と早合点しないためです。
狭く始める、7つの工程
全社を一度にではなく、効き目の大きい1部門・1業務から立ち上げるのが定石です。工程ごとに、実際に手を動かす中身を示します。
工程1:範囲をしぼる
まず対象を1つの部門、1つの業務まで狭めます。見るのは、関係を追うことに値打ちがある業務か、データが手に入るか、外したときの損が見合うか。対象を広げすぎると、決めるべき枠組みが膨らんで、どれも生煮えになります。最初は、問い合わせが集まる規程や手順のあたりか、特定の人に頼りきりで痛い業務が向いています。
工程2:手持ちのデータを洗い出す
対象の業務に関わるデータがどこにあるかを、ひととおり並べます。Wiki、Slack、Jira、Confluence、ファイルサーバ、基幹システム。それぞれについて、整った形か生の文章か、どのくらいの頻度で更新されるか、誰が見られるか、機密の度合いはどうか、を一覧にして、使える状態かを見極めます。個人情報や機密が混ざるなら、隠す方針と閲覧権限のルールをこの段で固めます。
工程3:つなぎ方の設計(オントロジー)
どの要素を、どんな関係で結ぶのかという設計図を、現場をよく知る担当者と一緒に作ります。ここが一番の勘どころです。はじめから完全を狙わず、対象業務の主だった問いに答えられるだけの最小限の要素と関係から始めて、抜き出しながら太らせます。言葉のゆれ、たとえば同義語や略語は、辞書にまとめておきます。
工程4:LLMで抜き出す
文章、チャット、チケットといった整っていないデータから、決めた設計図に沿って要素と関係をLLMに取り出させます。プロンプトには設計図と見本を渡し、結果はJSONで受けます。契約書のように前後の意味で読み取りが変わる対象は、先に関係をつかんでから要素を決め、カタログやマスタのように文脈に左右されない対象は、先に要素を並べてから関係を後付けする、と切り替えます。取り出した中身には、どの文書のどこから来たかを必ず残します。
工程5:人の目で直す
取り出した結果は、必ず人が確かめます。とくに因果、権限、金額に関わる関係は、外すと実害につながるので念入りに見ます。全部は見きれないので、確からしさの低いものと、重みの大きいものを先に回します。見つかった間違いは、プロンプトや設計図に返して、次の抜き出しの精度を上げていきます。
工程6:探す窓口を用意する
検索の画面とAPIを整えます。実務では、背景や手順の説明は文書検索(RAG)に任せ、事実や数、根拠は関係のグラフに任せる、という役割分担が効きます。問いを受けてどの探し方を組み合わせるかを決める司令役を置き、その下で、全文検索、意味の近さで探す検索、関係をたどる検索、台帳を引くデータベースを、一つの窓口としてまとめて呼びます。答えには、たどった関係の道すじと出どころを、根拠として必ず添えます。
工程7:更新を回し続ける
新しいデータを自動で取り込む仕組みを用意します。原本は別に保管し、追加や変更が起きたら、その知らせをきっかけに、全文・ベクトル・グラフそれぞれの検索用データを順に作り直します。こうしておけば鮮度を保てます。規程やデータが変わっても、関係の側を直せば答えがその場で新しくなります。あわせて、どこともつながっていない要素や、重複した要素を見つける点検も回します。
参考:探し方を束ねる全体像
工程6と7を絵にすると、次のような形になります。特定の製品に縛られない一般的な組み方です。
- 司令役:問いを読み解き、どの探し方をどう混ぜるかを決める
- まとめ役:全文検索、ベクトル検索、グラフ検索、データベースを一つの窓口としてまとめて呼ぶ
- 原本置き場:文書のオリジナルを別に保管する
- 変更への追従:原本が増えたり変わったりしたら、その通知で各検索用データを順に作り直す(グラフも同時に更新)
クラウドのマネージド検索とグラフDBを合わせる作り方もあれば、VPS1台に全文・ベクトル・グラフを載せて安く始める作り方もあります。規模と、どれだけ止められないかで選びます。この線引きは生成AIシステムのインフラはVPSで十分かで整理しています。
事例:大手企業での導入の一例
大手企業での導入の一例です。ある部門で、文書に残らず個人に貼りついている業務のやり方を、誰でも引ける形にする目的でナレッジグラフを設計しました。守秘のため社名や中身は伏せますが、進め方はこの記事の7工程に沿っています。
いきなり全社ではなく、1つの部門、1つの業務に範囲をしぼりました。その業務の文書と仕事の流れから要素と関係を洗い出し、つなぎ方の設計を現場の担当者と一緒に固めます。整っていないデータからLLMで抜き出し、確からしさの低い関係と重みの大きい関係を人手で直して、精度を上げました。
ねらいは、まず1つの業務を、AIが根拠つきで答えられる状態にして動かし、そこで固めた設計を横へ移すこと。全社一斉の大がかりな構築は避け、効き目を確かめながら対象を広げる進め方にしています。
やりすぎないための線引き
4つの切り口を全部いっぺんに作る必要はありません。背景や手順を知りたいだけの業務なら、文書検索(RAG)のほうが安く速く済みます。関係を追う、数える、抜けを探す、根拠を示す、が自社の問いに混ざってきたときに、ナレッジグラフを足す値打ちが出ます。まず1部門・1業務で手応えを確かめ、そこから広げるのが堅い進め方です。回答の精度そのものを上げる話は生成AIの回答精度を業務レベルに引き上げる方法で扱っています。
よくある質問(FAQ)
Q. 4つのパターンのどれから始めるべきですか?
A. 効き目が見えやすく、データが取れる業務から選びます。問い合わせが集まる規程や手順まわりなら文書をつなぐ形、承認や申請の滞りが痛いなら流れをつなぐ形、人の配置に困っているなら人と技能をつなぐ形、障害対応が特定の人頼みなら障害と原因をつなぐ形です。最初は1つにしぼります。自社の問いが向いているかはナレッジグラフは発注者に何の得があるかで確かめられます。
Q. つなぎ方の設計(オントロジー)は何から手をつければよいですか?
A. その業務で「答えたい問い」を10個ほど書き出し、それに答えるのに要る要素と関係だけを、最小限で決めます。はじめから網羅を狙わず、抜き出しながら育てます。言葉のゆれは辞書に集め、現場の担当者と一緒に進めるのが前提です。
Q. LLMが抜き出した結果はどこまで信用できますか?
A. そのままでは業務に使えません。とくに因果、権限、金額に関わる関係は、人の確認が欠かせません。抜き出す際は出どころを必ず残し、確からしさの低いものから見ます。精度を上げる考え方は生成AIの回答精度を業務レベルに引き上げる方法で詳しく扱っています。
Q. マネージドサービスとVPS自前、どちらで作るべきですか?
A. 規模と、どれだけ止められないかで決めます。運用の手間を減らしたい、高い可用性が要るならマネージド、安く小さく始めるならVPS1台でも十分に作れます。判断の軸は生成AIシステムのインフラはVPSで十分かにまとめています。
Q. 社内AIアシスタントにナレッジグラフを組み込むと何が変わりますか?
A. 「それっぽいのに使えない」で止まりがちな社内AIが、根拠つきで正しく答えられるようになります。うまくいく案件と行き詰まる案件の分かれ目は社内AIアシスタント導入の成功と失敗パターンで整理しています。
Beekleの取り組み
Beekleは、ナレッジグラフの設計を、どの切り口で、どこから、どう組むかという入り口から一緒に決めます。全社を一度につなぐ大がかりな構築ではなく、効き目の大きい1部門・1業務に範囲をしぼり、つなぎ方の設計から、LLMでの抜き出し、人手の確認、探す窓口の用意、更新の継続まで、通して引き受けます。RAGとグラフの組み合わせ方はRAGシステム構築で、まずは小さく試したい方は初期費用0円のゼロスタートからご相談ください。
Beekleでは、生成AI/CDP/業務システムの企画・要件定義・開発・運用までワンストップで支援しています。「何を作れば成功か」の整理、検証フェーズの設計、本番化判断まで、発注側の判断材料が揃うように伴走します。費用感の概算だけでも歓迎です。