「生成AIっていくらかかるの?」に即答できない理由
「ChatGPTを社内の業務に使いたい」「うちの会社の資料を読んで答えてくれるアシスタントが欲しい」――こういった相談を受けて最初に出る質問は、ほぼ100%「いくらかかりますか?」です。
ですが、率直に言うとこの質問に最初から具体的な金額で答えるのは難しいです。生成AIは「何を作るか」よりも「どこまで作るか」で予算が大きく変わるからです。
予算規模を決める3つの軸
- どこまで作るか: お試し検証で終わるのか、社内全員が毎日使う本番システムまで作るのか
- 社内データを使うか: ChatGPT に質問するだけか、自社の資料・データベースも参照させるのか
- 使う人と要求水準: 一部の担当者の試用か、全社員が使うか、お客様向けに公開するか
本記事では、この3つの軸を踏まえて、生成AIの開発を発注するときの費用相場と、見積もりを比較するときに確認すべきポイントを整理します。
3つのフェーズと費用の目安
中堅企業(社員数100〜2000名規模)が社内向けに生成AIを導入する場合、典型的な進め方は次の3段階です。
フェーズ | 期間目安 | 費用レンジ | 主に何を作るか |
|---|---|---|---|
① 検証(PoC) | 1〜2か月 | 80万〜250万円 | 「実現できそうか」を試す。簡単な動くものと、社内で使えるかの評価レポート |
② 試作(プロトタイプ) | 2〜3か月 | 200万〜600万円 | 限られた人数が実際に試せる動くシステム |
③ 本番運用 | 3〜5か月 | 500万〜1,500万円 | 日常業務で使える本番システム。利用ログ・セキュリティ設定・サポート体制まで |
運用継続 | 毎月 | 月20万〜100万円 | 追加機能・精度改善・問い合わせ対応 |
※ 社内向けの想定です。お客様向けに公開する場合や、画像・音声を扱う場合はさらに大きくなります。
見積もりに含まれる費用の内訳
1. 検証フェーズで削られがちな「評価」の費用
検証フェーズで一番省かれやすいのが、「業務で本当に使えるかを判断する評価作業」です。「ChatGPTっぽいものが動いた」だけでは本番化の判断ができません。
本来この段階で必要になるのは次の作業です。
- 業務担当者と一緒に「よくある質問と正しい答え」のリストを作る(30〜100件程度)
- そのリストを使って、回答精度を数値で測る
- 「答えられない」「間違える」パターンを分類しておく
これを省いた検証は、「動いた/動かない」しか分からないまま終わります。本番化の判断もできず、検証費用だけ消えるパターンに陥ります。
2. 試作・本番運用フェーズで大きい3つの費用
① 社内データを参照させる仕組みづくり
「うちの会社の資料を読んで答えてほしい」というケースは、社内文書を生成AIが検索して回答に使う仕組みが必要になります。文書をどう取り込むか、どの粒度で検索するか、機密文書をどう扱うかなどの設計で、開発工数の3〜5割を占めます。「資料を入れれば賢くなる」ものではありません。
② ログイン管理・利用ログ・権限設定
業務利用するなら、「誰がいつ何を質問したか」のログ、部門ごとの参照範囲制御、機密情報の自動マスキングは必須です。これだけで100〜300万円規模の追加工数になります。
③ 回答品質を上げるチューニング作業
「動く」と「業務で使える」の差は、回答品質の調整作業に集約されます。本番運用フェーズの2〜3割は、ここに使われるのが標準です。
意外と見落とされる「運用ランニングコスト」
生成AIには、開発費用とは別に、毎月かかるランニングコストがあります。最大のものは OpenAI(ChatGPT)や Anthropic(Claude)に支払う利用料 です。
「ChatGPT は無料で使えるのに?」と思われがちですが、業務システムに組み込んで使う場合は、利用量に応じた従量課金になります。利用量がそのままお金に直結する仕組みです。
月額利用料の目安(2026年時点)
- 社員100名が1人1日10回利用 → 月3万〜8万円
- 社員500名が1人1日20回利用 → 月15万〜40万円
- 大量の文書を一括要約・分類で処理(月100万件) → 月20万〜80万円
見積もりで「利用料は実費」と書かれている場合、この月額がそのまま御社負担になります。試算が出てこない見積もりは、後から請求で揉める典型パターンなので注意が必要です。
見積もりチェックリスト10項目
複数社の見積もりを比較するとき、必ず聞くべき項目です。
発注前に必ず質問すべきこと
- 検証フェーズに「評価作業」が工数として含まれているか
- 使う予定の生成AI(ChatGPT/Claude/Geminiなど)の名前が見積もりに書いてあるか
- 毎月の利用料は誰が払うか、月額の試算は出ているか
- 社内資料を扱う場合、データの保存先・取り扱い方針が明記されているか
- 誰がいつ何を質問したかの記録(利用ログ)が含まれているか
- 部署ごとに参照範囲を分ける機能は含まれているか
- 「分からないことは分からないと答える」設計になっているか(誤った回答を防ぐ仕組み)
- 運用フェーズの月額費用と、含まれる作業範囲が明確か
- 使う生成AIが将来廃止された場合の移行費用はどう扱うか
- 本番化判断の基準(検証フェーズで何が満たされたら次に進むか)が事前に決まっているか
特に重要なのは 2番と3番です。「生成AIを使います」だけで具体名が出てこない、または月額試算ができないという場合、設計が固まっていない可能性が高いです。
「異様に安い見積もり」が抱える典型リスク
複数社見積もりで、1社だけ極端に安いケースがあります。生成AI開発で安すぎる見積もりに共通するパターンです。
- 検証と試作が一括: 評価作業が省かれており、本番化で作り直しになる
- 古い世代の生成AIが前提: 当時は安価だが、業務利用に耐える精度が出ない
- プロンプト1本書いて終わりの構造: 業務利用には精度・網羅性が足りない
- 毎月の利用料が見積もりに含まれていない: 後から「実費精算」で大きく追加請求
「生成AIだから安く・早く」というセールストークは、検証フェーズなら成立します。ただし本番運用するなら同じ理屈は通用しないので注意が必要です。
発注前に決めておくべき3つのこと
見積もりの精度を上げるために、発注者側で事前に決めておくべきことは次の3つです。
- どのフェーズの予算か: 検証だけか、本番運用までか
- データ範囲: 何を生成AIに参照させるか、機密情報の扱い方針
- 成功基準: 「業務で使える」とは何が満たされた状態か(精度・速度・運用負荷)
この3つが言語化されていれば、各社の見積もりが揃って比較しやすくなります。逆に、ここが曖昧なまま見積もり依頼すると、各社の前提がバラバラで比較できなくなります。
Beekleにご相談ください
Beekleでは、生成AI/CDP/業務システムの企画・要件定義・開発・運用までワンストップで支援しています。「何を作れば成功か」の整理、検証フェーズの設計、本番化判断まで、発注側の判断材料が揃うように伴走します。費用感の概算だけでも歓迎です。