「AIエージェントを作りたい」と言ったときに最初に決めること
AIエージェントの導入を検討する企業から「とりあえず作ってください」と相談を受けることがありますが、これだと検証で終わるパターンに高確率で陥ります。作る前に決めるべきことがあります。
本記事では、AIエージェントを業務に組み込むまでの「作り方」を、設計・実装・運用の各フェーズに分けて、発注担当者が押さえるべきポイントを整理します。AIエージェント自体の概要は AIエージェントとは を参照してください。
フェーズ1: 設計 — 何を任せるか決める
1. 1ユースケースに絞る
「全業務を自動化」を目指すと必ず頓挫します。明確な1ユースケースから始めます。
良い1ユースケースの例:
- 営業の提案書ドラフト作成(過去案件検索 + テンプレ展開 + 初稿出力)
- 競合動向の毎週レポート(Web巡回 + 自社データ照合 + Slack配信)
- 問い合わせメールの一次回答案作成(履歴参照 + 製品情報引用 + 下書き作成)
2. 入力・出力・成功条件を数値化する
「AIエージェントが何を受け取って、何を出すか」を仕様として明文化します。曖昧なまま発注すると、出来上がっても評価できません。
項目 | 例 |
|---|---|
入力 | 「営業担当の名前と案件名」 |
出力 | 「過去類似案件3件 + 提案書ドラフト(PDF or Google Docs)」 |
成功条件 | 「営業担当の80%が、出てきた下書きをそのまま叩き台に使える」 |
応答時間 | 「指示から完成まで5分以内」 |
失敗時の挙動 | 「該当案件が見つからない場合は、その旨をSlackに通知」 |
3. つなぐシステムを洗い出す
AIエージェントが動くためにアクセスする必要があるシステムを全部リストアップします。
- データソース(Salesforce、BigQuery、Google Drive、Notion等)
- 出力先(Slack、メール、CRMの新規レコード等)
- 連携用の認証情報(誰の権限で動くか)
ここでつなぐシステムが多すぎると、初期構築費が跳ねます。初期は2〜4システム程度に絞るのが現実的。
フェーズ2: 実装 — 構成と技術選択
1. 使う生成AIの選定
AIエージェントの「脳」として使う生成AIは、用途で選びます。
用途 | 推奨 | 理由 |
|---|---|---|
複雑な推論・コード生成 | Claude Sonnet系 / GPT-4o | 長文理解と論理性に強い |
大量バッチ処理(要約・分類) | Claude Haiku系 / GPT-4o-mini | 低コストで高速 |
業務システム連携が前提 | Claude | MCP対応が早い、ツール呼び出し精度 |
選定の詳細は 生成AIをどう選び、どう契約するか を参照。
2. 連携方式(MCP or 自前実装)
業務システムとの連携は次の2パターン。
- MCP(Model Context Protocol): 標準仕様で繋ぐ。対応サービス(Salesforce、BigQuery、Slack、Drive等)が多く、構築工数が小さい。推奨
- 自前実装: 各システムのAPIを直接呼び出す独自プログラム。MCP対応していないシステムや、特殊なロジックが必要な場合
2026年時点ではMCP対応サービスが急速に増えているので、まずMCPで繋げないかを検討するのが効率的です。
3. 実行環境
AIエージェントを動かす場所も判断が必要です。
- OSSフレームワーク + 自社サーバー: 自由度高いが運用負荷が大きい(LangGraph、Mastra等)
- SaaS型エージェント基盤: 構築が早いが、ベンダーロックインのリスク
- クラウドAI基盤(AWS Bedrock、Vertex AI等): 既存クラウド資産との親和性、企業契約のしやすさ
中堅企業の最初の1ユースケースなら、SaaS型かクラウドAI基盤での構築が立ち上がりが早いです。
フェーズ3: 運用設計 — 失敗を許容する仕組み
1. 人間レビューの組み込み
AIエージェントの出力を業務影響の大きさで分類し、レビューフローを設計します。
業務影響 | 推奨フロー |
|---|---|
大(顧客向け回答、契約変更等) | AI下書き → 人間100%レビュー → 送信 |
中(社内向け要約、提案書ドラフト等) | AI下書き → 担当者の使用判断 |
小(情報収集レポート等) | AI完全自走、結果をSlackに投稿 |
2. 監査ログ
「誰がいつ何を依頼し、AIがどのシステムにアクセスし、何を出力したか」を全件記録します。問題発生時の調査・改善のための原資料になります。
3. コスト制御
AIエージェントは1タスクで複数回のAI呼び出しが発生するため、利用料が暴発しやすい構造です。
- 1タスクあたりの呼び出し回数上限を設定
- 1ユーザーあたりの月間タスク数上限を設定
- 月額アラート(Slack通知)を必ず設定
- テスト環境と本番環境のAPIキー・予算を分離
4. 継続改善の体制
AIエージェントは リリース後に改善し続けるシステムです。次の改善ループを回す担当者が必要です。
- 毎週: 失敗ケースをレビュー、原因分析
- 毎月: 成功率・コスト・利用頻度をダッシュボードで確認
- 四半期: 指示文(プロンプト)の改善、つなぐシステム追加検討
よくある落とし穴
1. 「全業務を自動化」を最初から狙う
5〜10ステップ以上を連続で正しく実行させるのは2026年時点でも難しい。1タスクあたり3〜5ステップに絞った設計が現実解。
2. つなぐシステムが多すぎる
初期から「全社データを横断アクセス」を狙うと、権限設計と連携工数で頓挫します。初期は2〜4システムに絞る。
3. 失敗時の挙動を設計していない
AIエージェントは必ず失敗します。「失敗したらSlackで通知して人間にエスカレーション」のフォールバックを必ず実装。
4. 利用料の見積もりが甘い
「軽く動かしてみよう」と本番環境に繋いだら月50万円の請求が来た、という事故が実際に発生します。本番投入前に1か月分の予測コストを必ず試算。
構築期間とコストの目安(中堅企業・1ユースケース)
フェーズ | 期間 | 費用 |
|---|---|---|
設計(要件定義・成功条件設計) | 3〜4週間 | 50万〜150万円 |
実装(連携・プロンプト設計・初期テスト) | 1〜2か月 | 200万〜600万円 |
運用設計・限定リリース | 1〜2か月 | 100万〜300万円 |
本番運用(月額) | 継続 | 月15万〜60万円(AI利用料+運用保守) |
合計初期費用は 350万〜1,050万円、年間運用は 180万〜720万円程度が中堅企業の現実的レンジです。
発注先選定で確認すべきこと
AIエージェント開発を外部委託する場合、発注先に必ず確認すべき項目です。
- 過去の本番運用中のAIエージェント案件の事例(業界・規模・運用期間)
- 使う生成AIの選定理由と、月額利用料の試算
- つなぐシステムの権限設計と監査ログの仕組み
- 失敗時のフォールバック設計
- 運用フェーズで誰が何を担うか(社内 vs 委託先の役割分担)
- 使う生成AIが世代交代したときの移行費用
まとめ
AIエージェントの「作り方」は、技術的なコードを書く前の 設計と運用設計が9割です。
- 1ユースケースに絞る
- 入出力・成功条件を数値化する
- つなぐシステムは初期2〜4個に絞る
- 人間レビューを業務影響に応じて組み込む
- 失敗時のフォールバックを設計する
- 継続改善の体制を最初から計画する
これらが揃っていれば、検証フェーズで終わらず本番運用に進める確率が大きく上がります。
Beekleにご相談ください
Beekleでは、生成AI/CDP/業務システムの企画・要件定義・開発・運用までワンストップで支援しています。「何を作れば成功か」の整理、検証フェーズの設計、本番化判断まで、発注側の判断材料が揃うように伴走します。費用感の概算だけでも歓迎です。