「AGIはもう来た」—Databricksが描く“AIが働く会社”の作り方-Databricks Data+AI Summit 2026

2026年6月17日

サンフランシスコで開催中のDatabricks Data+AI Summit 2026。潜入初日の基調講演（来場31,000人超・スポンサー240社超）に参加してきました。登壇はDatabricks共同創業者兼CEOのAli Ghodsi氏、ゲストにOpenAIのGreg Brockman氏、MicrosoftのSatya Nadella氏も。

多くの新製品が一気に発表されましたが、その全体を貫く主張はひとつ——「AIはもう十分賢い。問題は、企業固有の文脈（コンテキスト＝オントロジー）をどれだけAIに渡せるかだ」。本稿は、その答えとして示された今年いちばんの目玉「Genie Ontology」を中心に、基調講演を読み解きます。

「AGIはもう来た」――それでも残る“最後の壁”

Ghodsi氏は、難関ベンチマーク（“Humanity’s Last Exam”級・約2,500問）でAIが半数以上に正答できるようになったことを根拠に、「汎用人工知能（AGI＝人間並みに幅広く賢いAI）はすでに実現している」と宣言。100体規模のAIエージェントが自律的に協働する将来像も示しました。

ですが核心はその後にあります。

「これだけ賢くなったAIが、なぜ企業の現場で使えないのか」——答えは、AIが“その会社の事情（用語・KPI・業務ルール・暗黙知）”を知らないから。残る壁は知能ではなく、コンテキスト（文脈）です。

【主役】Genie Ontology：社内の知識を“地図”にする

その壁を壊す答えが、今年いちばんの目玉「Genie Ontology」です。

そもそも「オントロジー」とは？ ITでいうオントロジーとは、ある領域の概念・用語・ルールと、それらの関係を、機械（AI）が読み取れる形に整理した“意味の地図”のこと。「“優良顧客”とは何か」「“解約”はどう数えるか」「この指標とあの指標はどうつながるか」——人間が暗黙に共有している“社内の常識”を明示的に書き出したものです。これがあると、AIは言葉の表面ではなく意味を理解して動けます。

そして「Genie」とは？ 自然言語で社内データに問いかけ・作業させられるDatabricksのAI機能群の総称。今年はその中核として、知識の土台Genie Ontology、全社の窓口Genie One、ドメイン特化のGenie Agents、エンジニアリング担当のGenie Codeが発表されました。

では、Genie Ontologyは具体的に何をするのか。社内のデータ資産と「その領域に詳しい人（エキスパート）」を関連づけた知識グラフを、バックグラウンドで継続的に構築する仕組みです。

どう作るか：3経路（①ワークスペース資産 ②パートナー連携：SharePoint等 ③Unity Catalog）から“オントロジー断片（Ontology Snippets）”を抽出。どれが信頼できる情報かを独自アルゴリズムOntoRank（WebのPageRankの企業データ版）で重み付け。画面例では450万超の断片・2,305資産・63ドメイン・733エキスパートが結ばれていました。
なぜ効くか：従来のエージェントは情報をその場で逐次探す（ライブ検索）ため遅く・高コスト。社内の“地図”を事前に持つことで、速く・正確に答えられます。

オントロジーを使う「3つのGenie」

Genie One：自然言語で社内データを扱う全社の窓口（AIコワーカー）。Slack・Teams・メールと双方向連携し、スケジュール実行・アラート・文書作成・スキル・MCPまで。モバイル（iOS／Android）対応、権限はUnity Catalogで自動適用。実データ28問の社内ベンチで初回正答率84.5%（最強の汎用コーディングエージェントは52.4%）を約2倍速で達成。（導入例：Uplight）
Genie Agents：Genie Spaces（顧客が100万超を作成）から進化したドメイン特化のエージェント。構造化・非構造化データを横断し、Genie One／Genie Codeから“ひと言”で作成・共有。（導入例：Foot Locker）
Genie Code：パイプライン構築・障害対応・本番保守を担う自律エージェント。深夜に処理が止まっても、影響範囲を特定して修正を当てます。

オントロジーを“支える土台”：データ基盤とガバナンス

Genie Ontologyが力を発揮するには、(a) 社内の全データが集まり、(b) 統制が効いていることが前提。基調講演でこの土台も同時に強化されました。

土台①：データを集め・整える（Access all the Data）

従来はKafka（＝データを流す土管）・Flink（＝流れるデータを加工）・dbt（＝分析用に整形）・Airflow（＝処理の段取り）などの寄せ集めで複雑でした。さらに「データエンジニアリングはソフトウェア開発とは性質が違う」——プログラムの不具合はすぐ表面化して直せますが、データの不具合は“静かに”混入し、誤ったまま判断に使われ、気づいた時には取り返しがつきません。

Lakeflow／Zerobus：多様なSaaSやIoT等の常時発生データを直接・低遅延で取り込む
Spark Declarative Pipelines（＋ノーコードのLakeflow Designer／実行管理のJobs）：乱立した加工ツールを1つに集約（バッチ＋ストリーミング／SQL＋Python／Real-Time Mode）
Apache Iceberg＋データを動かさず直接リアルタイム分析する新DWHLakehouse//RT（エンジン＝Reyden）。12,000クエリ/秒でも100ミリ秒未満、専用配信基盤比最大16倍
Lakebase：エージェント向け運用DB（PostgreSQL互換、ブランチ／scale-to-zero、60万ops/秒、Multi-Cloud DR）
LTAP：取引（Lakebase）と分析（Lakehouse）を1つの統制された“記録の正本”に統合
Genie ZeroOps：本番運用を自動操縦（①検知→②原因究明→③修正案→④サンドボックス検証／本番適用は人の承認必須）
Apps on Databricks Marketplace：サードパーティ製アプリを統制環境のまま購入・実行

土台②：統制する（Unity Catalog / AI Gateway）

Unity Catalog：データ・AIモデル・エージェント・MCP・スキルまで一元統制し、来歴（リネージ）も追跡する“単一の統制レイヤー”。共有用のOpenSharingも発表。
Unity AI Gateway：AIコストの可視化・上限設定・モデルの自動振り分け。トークン消費の暴発を防ぐ“関所”。

そして全社へ：Agent System of Record

あらゆる部門にAIエージェントを置き、共通基盤の上で動かす構想が「Agent System of Record」。基盤は3層で、最上層のEnterprise Context（＝オントロジー）が“頭脳”にあたります：Enterprise Context／Unified Governance／Access all the Data。Databricks自身を「全社AIの土台」に据える宣言でした。マーケ向けのエージェント型CDPCustomerLake（1日最大10億回のパーソナライズ）は、その応用例です。

導入事例：ペプシコ／マスターカード

ペプシコ（従業員約32万人・約950億ドル規模）：6年がかりで60超のデータソースを集約し、データの95%を活用。3万件超の社内レポートを50件規模に集約する計画。
マスターカード（年1,500億件超の取引）：データレジデンシー要件への対応を理由にLakebaseを採用し、約7週間で大規模適用。

持ち帰り（データ活用の現場視点）

最も示唆的だったのは「AIの課題は“賢さ”ではなく“企業固有の文脈（オントロジー）をどれだけ渡せるか”」という整理です。派手なモデル選定よりも、社内の知識を構造化してAIに渡すことこそが本丸——AIの土台は、結局のところデータの品質と信頼性、そして“企業固有の文脈（オントロジー）”にあります。