AI活用2026.05.1110分EXBANK 編集部

AIエージェントの作り方 — Claude / Computer Use 業務組み込みの現在地

Q: エージェントを業務に入れる際のセキュリティリスクは？

主に (1) 機密情報の外部送信、(2) 誤った操作の自動実行、(3) 権限の過剰付与 の 3 点です。対策は「Enterprise プランで学習対象外を明確化」「重要操作は人間承認を必須化」「最小権限原則」の 3 つで、最初の PoC 段階で必ずセキュリティチームと連携してください。

Q: コストはどれくらいかかりますか？

Claude Code 個人プランなら月 数千円〜、社内チームで 5〜10 名利用すると月 数万〜十数万円。Agent SDK で本番運用する大規模ケースでは API 費用 月 10〜50 万円が一般的です。コストは「タスクあたりのトークン数 × 月実行回数」で見積もります。

Claude Code、Computer Use、Claude Agent SDK まで。2026年のAIエージェント実装を、現場で使える粒度で解説します。

#AIエージェント#Claude Code#Computer Use#Claude Agent SDK#業務自動化

●78% が完読|1,247 views

「って結局何ができるの？」「・Computer Use・Agent SDK の使い分けは？」 — 2026 年に入り、AI エージェントは 概念から実装 のフェーズに移行しました。

本記事では、当方が複数のクライアント案件でエージェント実装を支援してきた経験から、2026 年現在のエージェント実装の全体像を、現場で使える粒度で整理します。

AI エージェントとは — 一言でいうと

エージェントは「LLM がツールを呼び出して、目標達成までのステップを自律的に実行する仕組み」です。

従来のチャットボット＝「答える AI」、エージェント＝「動く AI」と理解するのが分かりやすいです。

Google 広告 API を叩く
数値を集計する
比較表を作る
Slack API で投稿する

までを 連続実行 します。人間が「どのステップでどのツールを使うか」を細かく指示する必要がなくなります。

エージェントの 4 層構造

エージェントの内部は、4 つのレイヤーで動いています。

Layer 01. 観測（Perception）

外部状態を取得する層。API レスポンス・ファイル内容・画面スクリーンショット・ユーザー入力などを「現状」として認識します。

Layer 02. 推論（Reasoning）

観測データから「次に何をすべきか」を判断する層。ここが LLM の本領で、・などの推論能力がそのまま使われます。

Layer 03. 行動（Action）

推論結果に基づいてツールを呼び出す層。API 呼び出し・コマンド実行・画面操作・ファイル書き込みなど、外部世界に影響を与えるアクションです。

Layer 04. 学習（Memory）

過去の実行結果を記憶し、次回以降の判断に活かす層。短期メモリ（会話履歴）と長期メモリ（ベクトル DB / 構造化メモリ）に分かれます。

💡 KEY TAKEAWAYS
エージェント実装で最大の罠は「推論層」だけ磨いてしまうことです。実際は 観測（入力データの正確性） と 行動（ツール接続の信頼性） が安定性を決定します。LLM の精度より、エージェントを支えるインフラの方が、本番品質に効きます。

エージェント PoC に着手する前に、自律 AI を運用できる体力があるか 3 分で測りませんか？

細マッチョ企業診断 / 3 分 8 問

診断する

2026 年に使える 3 系統

が提供する Claude 系エージェント技術は、用途別に 3 つに分かれます。

系統 1: Claude Code（コーディング向け）

ターミナルから AI エージェントが動き、コードを読み・書き・テストする統合ツール。

強み: ファイル編集・コマンド実行・テスト自動化が即動く
応用領域: 開発・データ分析・社内ツール保守
2026 年の進化: 1M トークンコンテキスト・サブエージェント・カスタムスキル

非エンジニアでも、データ集計・レポート自動化・社内オペ補助に十分使える領域に入っています。

系統 2: Computer Use（画面操作向け）

エージェントがマウス・キーボードを操作して、人間と同じように PC を扱う仕組み。

強み: API がないシステムでも操作可能
応用領域: 古い社内システム・スクレイピング困難サイト・定型操作
注意点: 安定性は API 呼び出しに劣る。手順書が固まっている領域に限定

「API 化すると数千万円かかる古い社内システム」を Computer Use で自動化する、という応用が現実解になりつつあります。

系統 3: Claude Agent SDK（独自エージェント構築）

独自のエージェントをゼロから組み立てる開発者向け SDK。

強み: サブエージェント・ツール接続・メモリ管理を統合
応用領域: 顧客対応エージェント・ナレッジ検索・レポート生成
要件: 開発リソース・運用継続体制

社内に開発体制があるなら、Agent SDK でカスタムエージェント構築が最も柔軟な選択肢です。

業務応用 5 ユースケース

具体的にエージェントが何をしてくれるのか、5 ケースをご紹介します。

Use Case 01. レポート自動生成

・GSC・広告管理画面から数値を取得 → 比較表 → コメント生成 → Slack 投稿。週次定例の準備時間が 1/5 になります。

Use Case 02. 顧客問い合わせ一次対応

メールや LINE の問い合わせを分類し、定型回答をドラフト → 担当者に承認依頼。複雑なケースのみ人間にエスカレーション。

Use Case 03. 競合リサーチ自動化

競合企業のリリース・ブログ・SNS・レビューを定期巡回 → 要約 → ナレッジ DB に蓄積 → 重要変化を週次レポート。

Use Case 04. 社内ナレッジ検索

/ Slack / Drive を横断検索 → 質問に対する回答を引用付きで提示。「あの議論どこだっけ？」が消えます。

Use Case 05. 定型業務の自動化

請求書発行・経費精算チェック・契約書ドラフト生成など、ルールが明確な定型業務をエージェントに任せる。

実装で必ずぶつかる 4 つの壁

「エージェントを動かしてみたら、すぐ実用化できる」と思うと痛い目を見ます。当方が現場で見た典型的な壁を整理します。

壁 1: 評価指標が作れない

「エージェントが正しく動いた」をどう判定するか、設計が必須です。・完了時間・人間介入率の 3 指標を最低限測定してください。

壁 2: ツール設計が雑

エージェントが呼び出すツールの設計が雑だと、誤動作・暴走の温床になります。1 ツール = 1 機能、エラーハンドリング必須、副作用最小の原則を守ってください。

壁 3: メモリ設計の罠

会話履歴をそのまま全部渡すと、トークン爆増・コスト爆発・推論品質低下のトリプルパンチ。要約 + 重要情報抽出のメモリ戦略が必要です。

壁 4: 安全性の確保

破壊的操作（ファイル削除・送金・大量送信など）を AI に任せるリスクは慎重に評価してください。重要アクションは「人間承認」を必須にする設計が鉄則です。

安全性 4 つの基本ルール

1. 最小権限: エージェントには「タスクに必要な最小限の権限」だけ付与。

2. 人間承認ゲート: 金銭・契約・大量操作など影響の大きい行動は人間承認必須。

3. ロールバック可能性: 失敗時に元に戻せる設計。一発勝負の操作は避ける。

4. ログと監査: 全アクションをログ化、定期監査で異常を早期発見。

系統別比較表

3 系統の使い分けを整理します。

系統	主用途	難易度	コスト目安	推奨対象
Claude Code	開発・データ処理・社内ツール	低	月数千〜数万円	全部署、特に開発・分析
Computer Use	画面操作自動化	中	月数万円〜	API なし古システム保有企業
Agent SDK	独自エージェント構築	高	月 10〜50 万円	開発体制ありの中堅以上

小さく試すなら Claude Code、本格構築なら Agent SDK という基本方針で、Computer Use はピンポイントで使う位置づけが現実的です。

PoC から本番運用までのロードマップ

エージェント導入は段階的に進めるのが鉄則です。

Phase 1（1 ヶ月）: 1 業務 1 エージェントで PoC、評価指標を作る
Phase 2（3 ヶ月）: 3〜5 業務に拡張、ツール群整備、メモリ設計確立
Phase 3（6 ヶ月）: 本番運用、監視・改善サイクル確立、社内 Ops 体制
Phase 4（12 ヶ月）: 全社展開、ベストプラクティスのナレッジ化

「全社一気に導入」は失敗パターンです。1 業務で確実に成功させてから横展開が王道です。

今すぐ始められる 3 ステップ

ハードルが高そうに見えますが、実は今日から始められます。

Claude Code を 1 タスク試す: 議事録要約や CSV 集計から
業務手順書を可視化: エージェント化したい業務の手順を文書化
PoC スコープを 1 業務に絞る: 効果測定しやすい単一業務を選ぶ

「全部任せる」発想ではなく「特定業務の特定ステップを置き換える」発想で始めると、現実的に効果が出ます。

次の一手

ここまで読んでいただいた方には、次の 3 ステップをご提案します。

エージェント化候補の業務を 5 つリストアップ: 「定型・繰り返し・判断ルール明確」が条件
PoC 1 業務に絞り込み: 効果測定可能な 1 つから
3 ヶ月で評価指標まで仕込む: 動かすだけでなく、品質を継続改善できる仕組みを最初から設計

「エージェント化のアイデアはあるが、自社で運用しきれるか不安」という方は、まず細マッチョ企業診断で 3 分セルフチェックすることをおすすめします。AI を「育てる資産」として運用できる組織体力が、5 軸スコアで即時に可視化されます。

EXBANK の AI セミナーでは、参加企業の業務に合わせて「自社で最初に試すべき AI エージェント」を当日設計し、PoC スコープまで持ち帰っていただいています。「自社で何から始めればいいか」段階の方にこそ、価値を提供できる内容です。

エージェントは「未来の話」ではなく「今期の意思決定対象」になりました。お気軽にご相談ください。

— DIAGNOSIS

エージェントを動かす前に、御社の AI 運用体力を可視化しませんか？

3 分 8 問で、御社の「変化対応力」を 5 軸スコア + 5 タイプで診断します。登録不要・無料・その場で結果が出ます。

細マッチョ企業診断を試す

よくあるご質問

Q1.AI エージェントと従来のチャットボットはどう違いますか？

A.チャットボットは「質問に答える」だけですが、エージェントは「目標を渡すと、自分でツールを選び、複数ステップを実行して結果を返す」存在です。例えば「競合 5 社の最新リリースを調査して比較表を作って」と頼むと、検索→ページ取得→要約→表組成形までを自律実行します。

Q2.Claude Code は社内のどんな業務に向いていますか？

A.コードを書く・直す・テストするタスク全般です。データ分析スクリプトの自動生成、社内ツールの保守、軽度のリファクタリング、議事録から GitHub Issue 自動起票など、開発以外の部署でも使える応用範囲があります。

Q3.Computer Use は本当に実用的ですか？

A.2026 年現在、限定された業務（明確な手順書がある定型作業・社内システムの古いUI 操作・スクレイピング困難なサイトからの情報取得）では十分実用です。一方、複雑な判断や UI 変更頻度が高いサイトでは安定性が課題なので、「最後の手段」として位置づけてください。

Q4.Claude Agent SDK で何ができますか？

A.独自のエージェントを構築できる開発者向け SDK です。サブエージェントの定義、ツール接続、メモリ管理、安全制御などを統合的に扱えます。社内向けのカスタムエージェント（顧客対応・ナレッジ検索・レポート生成など）を構築する用途に向いています。

Q5.エージェントを業務に入れる際のセキュリティリスクは？

A.主に (1) 機密情報の外部送信、(2) 誤った操作の自動実行、(3) 権限の過剰付与の 3 点です。対策は「Enterprise プランで学習対象外を明確化」「重要操作は人間承認を必須化」「最小権限原則」の 3 つで、最初の PoC 段階で必ずセキュリティチームと連携してください。

Q6.コストはどれくらいかかりますか？

A.Claude Code 個人プランなら月数千円〜、社内チームで 5〜10 名利用すると月数万〜十数万円。Agent SDK で本番運用する大規模ケースでは API 費用月 10〜50 万円が一般的です。コストは「タスクあたりのトークン数 × 月実行回数」で見積もります。

Q7.自社で内製すべきか、外部委託すべきか？

A.PoC 段階は外部委託で素早く検証、本番運用以降は内製化が王道です。エージェントは継続的なプロンプト改善・新ツール追加・障害対応が必要な「育てる資産」なので、最終的には社内に運用チームを持つ方が長期 ROI が高くなります。

この施策を御社にも導入しませんか？

無料診断で、御社の状況に合った具体プランをご提案します。

無料診断を受ける

AIエージェントの作り方 — Claude / Computer Use 業務組み込みの現在地

AI エージェントとは — 一言でいうと

エージェントの 4 層構造

Layer 01. 観測（Perception）

Layer 02. 推論（Reasoning）

Layer 03. 行動（Action）

Layer 04. 学習（Memory）

2026 年に使える 3 系統

系統 1: Claude Code（コーディング向け）

系統 2: Computer Use（画面操作向け）

系統 3: Claude Agent SDK（独自エージェント構築）

業務応用 5 ユースケース

Use Case 01. レポート自動生成

Use Case 02. 顧客問い合わせ一次対応

Use Case 03. 競合リサーチ自動化

Use Case 04. 社内ナレッジ検索

Use Case 05. 定型業務の自動化

実装で必ずぶつかる 4 つの壁

壁 1: 評価指標が作れない

壁 2: ツール設計が雑

壁 3: メモリ設計の罠

壁 4: 安全性の確保

系統別比較表

PoC から本番運用までのロードマップ

今すぐ始められる 3 ステップ

次の一手

エージェントを動かす前に、御社の AI 運用体力を可視化しませんか？

よくあるご質問

関連する記事

【投稿テスト】EXBANK Insights 公式始動 — 私たちが書いていく7つの領域

Google AntiGravity × Obsidian｜Webマーケターのための「第二の脳」と完全自動化エージェント構築バイブル

この施策を御社にも導入しませんか？

AI エージェントとは — 一言でいうと

エージェントの 4 層構造

Layer 01. 観測（Perception）

Layer 02. 推論（Reasoning）

Layer 03. 行動（Action）

Layer 04. 学習（Memory）

2026 年に使える 3 系統

系統 1: Claude Code（コーディング向け）

系統 2: Computer Use（画面操作向け）

系統 3: Claude Agent SDK（独自エージェント構築）

業務応用 5 ユースケース

Use Case 01. レポート自動生成

Use Case 02. 顧客問い合わせ一次対応

Use Case 03. 競合リサーチ自動化

Use Case 04. 社内ナレッジ検索

Use Case 05. 定型業務の自動化

実装で必ずぶつかる 4 つの壁

壁 1: 評価指標が作れない

壁 2: ツール設計が雑

壁 3: メモリ設計の罠

壁 4: 安全性の確保

系統別 比較表

PoC から本番運用までのロードマップ

今すぐ始められる 3 ステップ

次の一手

エージェントを動かす前に、御社の AI 運用体力を可視化しませんか？

よくあるご質問

関連する記事

【投稿テスト】EXBANK Insights 公式始動 — 私たちが書いていく7つの領域

Google AntiGravity × Obsidian｜Webマーケターのための「第二の脳」と完全自動化エージェント構築バイブル

この施策を御社にも導入しませんか？

系統別比較表