“聞けば答える”の先へ──Claude Managed Agentsでデータ運用を回すマルチエージェント

2026年6月18日

Data+AI Summit 2026 セッションレポート。登壇はAnthropicのApplied AI Architect、Jai Behl氏（前職はDatabricksに4.5年在籍し、両社を深く知る立場）。「質問すれば答える」はもう簡単。本当に難しいのは、誰も聞いていないときにもAIが自分から分析を進め、運用を回し続けること——それをClaudeを使ったマルチエージェントで実現するデモだった。

デモの舞台：FanFuelの“試合日オペレーション”

題材は架空のフードデリバリー企業「FanFuel」。年で最も忙しい日——ワールドカップ4試合・4都市、注文量は通常の2倍という設定だ。そこで4体のエージェントが「1つの共有セッション」で稼働し、シフト開始時に書いた“ミッション”だけで動く。終日、誰もプロンプトを打たない。画面の“コマンドセンター”に並ぶのは、すべてエージェントが自分で見つけて完了させた仕事である。

解く課題：「データチームに聞く」遅延ループ

誰かが質問する → データチームにSlackが飛ぶ → 回答 → 質問者が待つ。この往復の遅延のせいで、その瞬間にデータを意思決定に使えない。イベントのピーク時には、この遅れがそのまま機会損失になる。

マルチエージェントの設計：エージェント・環境・セッション

エージェントを作ること自体は簡単（プロンプトとツールを与えればよい）。難しいのは“長期運用”だ。Claudeのプラットフォームは、これを3つの抽象で整理する。

Agent（エージェント）＝能力とペルソナ：Model／Prompt／Tools／MCP servers／Skills／Guardrails。
Environment（環境）＝実行基盤とガードレール：Sandbox（クラウド or 自社ホスト）と接続リソース。どこで・どう動くかを決める。
Session（セッション）＝実行中の1インスタンス：エージェント＋環境から生成される“1回の走り（＝1タスク）”。user message → model call → tool call → tool result が実行とともに追記され、永続化・再開・実行中の操舵／中断ができる。

APIも /v1/agents・/v1/environments・/v1/sessions・/v1/sessions/:id/events の4プリミティブで構成され、セッションの状態（running／idle／要ユーザー操作／terminated）を追跡しやすい。

設計思想は「頭脳と手の分離」。頭脳（エージェントのループ）はAnthropic基盤上のマネージドサービスとして動き、1サービスで数千セッションを抱え、クラッシュにも耐える。一方“手”＝サンドボックスはツールが必要なときだけ起動し、認証情報・ファイル・コード実行はそこに置く（モデルの中ではない）。

デモ：4エージェントの協調運用

Coordinator（司令塔）：トリアージと振り分けに徹し、専門作業はしない。
Analyst（アナリスト）：SQLで質問に回答し、使ったSQLも提示する。
Data Engineer（データエンジニア）：パイプラインを保有し、障害を診断して自己修復する。
App Builder（アプリビルダー）：いま見ているプロダクト（FanFuelアプリ）を出荷・保守する。

各エージェントは独自のモデル・ツールを持ちつつ、共同ファイルシステム上で協調する。権限はスコープされ、Databricks CLIや共通カタログ（Unity Catalog）を介して動く。

メモリと“Dreaming”：2段階の学習

Memory（セッション“中”の学習・Public Beta）：エージェントが読み書きするファイルシステム。記憶は実行をまたいで永続し、過去の作業・ユーザー設定・ドメイン知識をエージェント間で共有できる。アクセス範囲は監査ログ付きで制御。
Dreaming（セッション“間”の学習・Research Preview）：セッションを定期的に振り返り、繰り返す失敗・手順・好みを抽出して記憶を整理する。記憶が増えても“濃い（high-signal）”状態を保つ。更新は自動／レビューを選べる。

エンタープライズ機能

Vaults：APIキーの管理、認証情報の作成、トークンのローテーション。
スケジュール実行：エージェントを毎日・毎月など定期実行。
ルーブリック（評価基準）：アウトカムに基づいて行動結果を評価し、反復改善する。

プラットフォームの価値は4点に集約される——Production-grade（安全なサンドボックス・メモリ・状態管理・ツール実行）／Long-running sessions（切断をまたいで自律実行）／Multi-agent coordination（自分で他エージェントを起こし並列化）／Trusted governance（スコープ権限・ID管理・実行トレース）。

成果・まとめ

顧客事例として、Harvey などがエージェント追加で大幅な高速化（登壇では最大10倍と紹介）を実現。
シングルエージェントからマルチエージェント・フリートへ移行し、並列処理と日常運用の支援が可能に。
セキュリティ・プリミティブ（権限スコーピング・環境分離）の整備こそ、信頼できる運用の土台。

持ち帰り：データ活用の現場視点

午前の基調講演（Genie・Unity Catalog・Databricks Apps）と綺麗に接続する内容だった。興味深いのは、同じ“エージェント×人間”でも、HGVが「人間を承認者に置く」設計だったのに対し、こちらはエージェント同士を協調させる“フリート”設計を見せた点。共通するのは、ガードレール・権限分離・可観測性という“土台”があって初めてエージェントは本番で信頼されるということだ。

URLをコピーしました！

URLをコピーしました！

この記事を書いた人

高好秀和