“聞けば答える”の先へ──Claude Managed Agentsでデータ運用を回すマルチエージェント

Data+AI Summit 2026 セッションレポート。登壇はAnthropicのApplied AI Architect、Jai Behl氏(前職はDatabricksに4.5年在籍し、両社を深く知る立場)。「質問すれば答える」はもう簡単。本当に難しいのは、誰も聞いていないときにもAIが自分から分析を進め、運用を回し続けること——それをClaudeを使ったマルチエージェントで実現するデモだった。

目次

デモの舞台:FanFuelの“試合日オペレーション”

題材は架空のフードデリバリー企業「FanFuel」。年で最も忙しい日——ワールドカップ4試合・4都市、注文量は通常の2倍という設定だ。そこで4体のエージェントが「1つの共有セッション」で稼働し、シフト開始時に書いた“ミッション”だけで動く。終日、誰もプロンプトを打たない。画面の“コマンドセンター”に並ぶのは、すべてエージェントが自分で見つけて完了させた仕事である。

解く課題:「データチームに聞く」遅延ループ

誰かが質問する → データチームにSlackが飛ぶ → 回答 → 質問者が待つ。この往復の遅延のせいで、その瞬間にデータを意思決定に使えない。イベントのピーク時には、この遅れがそのまま機会損失になる。

マルチエージェントの設計:エージェント・環境・セッション

エージェントを作ること自体は簡単(プロンプトとツールを与えればよい)。難しいのは“長期運用”だ。Claudeのプラットフォームは、これを3つの抽象で整理する。

  • Agent(エージェント)=能力とペルソナ:Model/Prompt/Tools/MCP servers/Skills/Guardrails。
  • Environment(環境)=実行基盤とガードレール:Sandbox(クラウド or 自社ホスト)と接続リソース。どこで・どう動くかを決める。
  • Session(セッション)=実行中の1インスタンス:エージェント+環境から生成される“1回の走り(=1タスク)”。user message → model call → tool call → tool result が実行とともに追記され、永続化・再開・実行中の操舵/中断ができる。

APIも /v1/agents・/v1/environments・/v1/sessions・/v1/sessions/:id/events の4プリミティブで構成され、セッションの状態(running/idle/要ユーザー操作/terminated)を追跡しやすい。

設計思想は「頭脳と手の分離」。頭脳(エージェントのループ)はAnthropic基盤上のマネージドサービスとして動き、1サービスで数千セッションを抱え、クラッシュにも耐える。一方“手”=サンドボックスはツールが必要なときだけ起動し、認証情報・ファイル・コード実行はそこに置く(モデルの中ではない)。

デモ:4エージェントの協調運用

  • Coordinator(司令塔):トリアージと振り分けに徹し、専門作業はしない。
  • Analyst(アナリスト):SQLで質問に回答し、使ったSQLも提示する。
  • Data Engineer(データエンジニア):パイプラインを保有し、障害を診断して自己修復する。
  • App Builder(アプリビルダー):いま見ているプロダクト(FanFuelアプリ)を出荷・保守する。

各エージェントは独自のモデル・ツールを持ちつつ、共同ファイルシステム上で協調する。権限はスコープされ、Databricks CLIや共通カタログ(Unity Catalog)を介して動く。

メモリと“Dreaming”:2段階の学習

  • Memory(セッション“中”の学習・Public Beta):エージェントが読み書きするファイルシステム。記憶は実行をまたいで永続し、過去の作業・ユーザー設定・ドメイン知識をエージェント間で共有できる。アクセス範囲は監査ログ付きで制御。
  • Dreaming(セッション“間”の学習・Research Preview):セッションを定期的に振り返り、繰り返す失敗・手順・好みを抽出して記憶を整理する。記憶が増えても“濃い(high-signal)”状態を保つ。更新は自動/レビューを選べる。

エンタープライズ機能

  • Vaults:APIキーの管理、認証情報の作成、トークンのローテーション。
  • スケジュール実行:エージェントを毎日・毎月など定期実行。
  • ルーブリック(評価基準):アウトカムに基づいて行動結果を評価し、反復改善する。

プラットフォームの価値は4点に集約される——Production-grade(安全なサンドボックス・メモリ・状態管理・ツール実行)/Long-running sessions(切断をまたいで自律実行)/Multi-agent coordination(自分で他エージェントを起こし並列化)/Trusted governance(スコープ権限・ID管理・実行トレース)。

成果・まとめ

  • 顧客事例として、Harvey などがエージェント追加で大幅な高速化(登壇では最大10倍と紹介)を実現。
  • シングルエージェントからマルチエージェント・フリートへ移行し、並列処理と日常運用の支援が可能に。
  • セキュリティ・プリミティブ(権限スコーピング・環境分離)の整備こそ、信頼できる運用の土台

持ち帰り:データ活用の現場視点

午前の基調講演(Genie・Unity Catalog・Databricks Apps)と綺麗に接続する内容だった。興味深いのは、同じ“エージェント×人間”でも、HGVが「人間を承認者に置く」設計だったのに対し、こちらはエージェント同士を協調させる“フリート”設計を見せた点。共通するのは、ガードレール・権限分離・可観測性という“土台”があって初めてエージェントは本番で信頼されるということだ。

CTA
  • URLをコピーしました!
  • URLをコピーしました!
この記事を書いた人
目次