サンフランシスコで開催中のDatabricks Data+AI Summit 2026。潜入初日の基調講演(来場31,000人超・スポンサー240社超)に参加してきました。登壇はDatabricks共同創業者兼CEOのAli Ghodsi氏、ゲストにOpenAIのGreg Brockman氏、MicrosoftのSatya Nadella氏も。
多くの新製品が一気に発表されましたが、その全体を貫く主張はひとつ——「AIはもう十分賢い。問題は、企業固有の文脈(コンテキスト=オントロジー)をどれだけAIに渡せるかだ」。本稿は、その答えとして示された今年いちばんの目玉「Genie Ontology」を中心に、基調講演を読み解きます。
「AGIはもう来た」――それでも残る“最後の壁”
Ghodsi氏は、難関ベンチマーク(“Humanity’s Last Exam”級・約2,500問)でAIが半数以上に正答できるようになったことを根拠に、「汎用人工知能(AGI=人間並みに幅広く賢いAI)はすでに実現している」と宣言。100体規模のAIエージェントが自律的に協働する将来像も示しました。
ですが核心はその後にあります。
「これだけ賢くなったAIが、なぜ企業の現場で使えないのか」——答えは、AIが“その会社の事情(用語・KPI・業務ルール・暗黙知)”を知らないから。残る壁は知能ではなく、コンテキスト(文脈)です。
【主役】Genie Ontology:社内の知識を“地図”にする
その壁を壊す答えが、今年いちばんの目玉「Genie Ontology」です。
そもそも「オントロジー」とは? ITでいうオントロジーとは、ある領域の概念・用語・ルールと、それらの関係を、機械(AI)が読み取れる形に整理した“意味の地図”のこと。「“優良顧客”とは何か」「“解約”はどう数えるか」「この指標とあの指標はどうつながるか」——人間が暗黙に共有している“社内の常識”を明示的に書き出したものです。これがあると、AIは言葉の表面ではなく意味を理解して動けます。
そして「Genie」とは? 自然言語で社内データに問いかけ・作業させられるDatabricksのAI機能群の総称。今年はその中核として、知識の土台Genie Ontology、全社の窓口Genie One、ドメイン特化のGenie Agents、エンジニアリング担当のGenie Codeが発表されました。
では、Genie Ontologyは具体的に何をするのか。社内のデータ資産と「その領域に詳しい人(エキスパート)」を関連づけた知識グラフを、バックグラウンドで継続的に構築する仕組みです。

- どう作るか:3経路(①ワークスペース資産 ②パートナー連携:SharePoint等 ③Unity Catalog)から“オントロジー断片(Ontology Snippets)”を抽出。どれが信頼できる情報かを独自アルゴリズムOntoRank(WebのPageRankの企業データ版)で重み付け。画面例では450万超の断片・2,305資産・63ドメイン・733エキスパートが結ばれていました。
- なぜ効くか:従来のエージェントは情報をその場で逐次探す(ライブ検索)ため遅く・高コスト。社内の“地図”を事前に持つことで、速く・正確に答えられます。
オントロジーを使う「3つのGenie」
- Genie One:自然言語で社内データを扱う全社の窓口(AIコワーカー)。Slack・Teams・メールと双方向連携し、スケジュール実行・アラート・文書作成・スキル・MCPまで。モバイル(iOS/Android)対応、権限はUnity Catalogで自動適用。実データ28問の社内ベンチで初回正答率84.5%(最強の汎用コーディングエージェントは52.4%)を約2倍速で達成。(導入例:Uplight)
- Genie Agents:Genie Spaces(顧客が100万超を作成)から進化したドメイン特化のエージェント。構造化・非構造化データを横断し、Genie One/Genie Codeから“ひと言”で作成・共有。(導入例:Foot Locker)
- Genie Code:パイプライン構築・障害対応・本番保守を担う自律エージェント。深夜に処理が止まっても、影響範囲を特定して修正を当てます。

オントロジーを“支える土台”:データ基盤とガバナンス
Genie Ontologyが力を発揮するには、(a) 社内の全データが集まり、(b) 統制が効いていることが前提。基調講演でこの土台も同時に強化されました。
土台①:データを集め・整える(Access all the Data)
従来はKafka(=データを流す土管)・Flink(=流れるデータを加工)・dbt(=分析用に整形)・Airflow(=処理の段取り)などの寄せ集めで複雑でした。さらに「データエンジニアリングはソフトウェア開発とは性質が違う」——プログラムの不具合はすぐ表面化して直せますが、データの不具合は“静かに”混入し、誤ったまま判断に使われ、気づいた時には取り返しがつきません。
- Lakeflow/Zerobus:多様なSaaSやIoT等の常時発生データを直接・低遅延で取り込む
- Spark Declarative Pipelines(+ノーコードのLakeflow Designer/実行管理のJobs):乱立した加工ツールを1つに集約(バッチ+ストリーミング/SQL+Python/Real-Time Mode)
- Apache Iceberg+データを動かさず直接リアルタイム分析する新DWHLakehouse//RT(エンジン=Reyden)。12,000クエリ/秒でも100ミリ秒未満、専用配信基盤比 最大16倍
- Lakebase:エージェント向け運用DB(PostgreSQL互換、ブランチ/scale-to-zero、60万ops/秒、Multi-Cloud DR)
- LTAP:取引(Lakebase)と分析(Lakehouse)を1つの統制された“記録の正本”に統合
- Genie ZeroOps:本番運用を自動操縦(①検知→②原因究明→③修正案→④サンドボックス検証/本番適用は人の承認必須)
- Apps on Databricks Marketplace:サードパーティ製アプリを統制環境のまま購入・実行
土台②:統制する(Unity Catalog / AI Gateway)
- Unity Catalog:データ・AIモデル・エージェント・MCP・スキルまで一元統制し、来歴(リネージ)も追跡する“単一の統制レイヤー”。共有用のOpenSharingも発表。
- Unity AI Gateway:AIコストの可視化・上限設定・モデルの自動振り分け。トークン消費の暴発を防ぐ“関所”。
そして全社へ:Agent System of Record
あらゆる部門にAIエージェントを置き、共通基盤の上で動かす構想が「Agent System of Record」。基盤は3層で、最上層のEnterprise Context(=オントロジー)が“頭脳”にあたります:Enterprise Context/Unified Governance/Access all the Data。Databricks自身を「全社AIの土台」に据える宣言でした。マーケ向けのエージェント型CDPCustomerLake(1日最大10億回のパーソナライズ)は、その応用例です。

導入事例:ペプシコ/マスターカード
- ペプシコ(従業員約32万人・約950億ドル規模):6年がかりで60超のデータソースを集約し、データの95%を活用。3万件超の社内レポートを50件規模に集約する計画。
- マスターカード(年1,500億件超の取引):データレジデンシー要件への対応を理由にLakebaseを採用し、約7週間で大規模適用。
持ち帰り(データ活用の現場視点)
最も示唆的だったのは「AIの課題は“賢さ”ではなく“企業固有の文脈(オントロジー)をどれだけ渡せるか”」という整理です。派手なモデル選定よりも、社内の知識を構造化してAIに渡すことこそが本丸——AIの土台は、結局のところデータの品質と信頼性、そして“企業固有の文脈(オントロジー)”にあります。
関連:生成AIに「自社の文脈」を渡すサービス「Ontology Boost」
本記事の主役「オントロジー(企業固有の文脈・知識)」——これは、私たちSiNCEが新たに提供を開始したサービス「Ontology Boost」がまさに取り組む領域です。生成AI(ChatGPT・Claude・Geminiなど)が、御社固有の用語・KPI・業務ルールに沿って“根拠のある”回答を返せるよう、知識基盤(オントロジー)の構築・接続・運用まで一貫支援します。
- 参照型アプローチ:AIに丸暗記させず、外部に整えた“知識辞書”を参照させる設計
- Hearing AI:ベテランの「感覚」「判断基準」を音声インタビューから構造化・蓄積
- LLM非依存:新しい生成AIが登場しても、築いた知識資産はそのまま引き継げる
- Databricks(Unity Catalog/Genie/Vector Search)と連携——基調講演の“Genie Ontology”の世界観を御社の現場で実装
- 完璧なデータ基盤は不要。最短4週間から開始可能(提供開始:2026年6月9日)
👉 サービス詳細:since2020.jp/ontology / お問い合わせ:since2020.jp/contact・03-6822-8702

