はじめに
アンケートを実施しても、集計で終わってしまったり、欲しい切り口でデータを見るたびにエンジニアへの依頼が必要になったりと、有効活用できていないケースは多いのではないでしょうか。
本記事では、Databricks Genie を使い、自然言語でアンケートデータに質問しながらインサイトを引き出す方法をご紹介します。
Databricks Genieとは
Databricks Genieは、Databricksプラットフォーム上で提供されるAIを活用したデータ探索機能です。「先月のNPSが最も高い地域は?」のように自然言語で質問するだけで、自動的にSQLが生成・実行され、答えが返ってきます。会話形式でやり取りできるため、「その中でさらに30代に絞ると?」といった追加質問も自然に行えます。SQLの知識がなくてもビジネス担当者が自らデータを探索できる点が最大の魅力です。
使用するデータ
架空のSaaSサービスを対象とした顧客満足度調査のダミーデータを使用します。2024年1月〜12月の1,500件の回答を想定しており、NPSスコアと再購入意向・コメントには相関を持たせることで、よりリアルに近い構造にしています。
| カラム名 | 説明 | データ例 |
|---|---|---|
| response_id | 回答ID | 1 |
| response_date | 回答日 | 2024-03-15 |
| age_group | 年代 | 30代 |
| gender | 性別 | 男性 |
| region | 地域 | 関東 |
| product_category | 利用製品カテゴリ | BIダッシュボード |
| usage_period | 利用期間 | 1〜3年 |
| nps_score | NPS(0〜10) | 8 |
| satisfaction_overall | 総合満足度(1〜5) | 4 |
| satisfaction_support | サポート満足度(1〜5) | 4 |
| satisfaction_price | 価格満足度(1〜5) | 3 |
| repurchase_intent | 再購入意向 | 高 |
| free_comment | 自由記述コメント | UIが直感的で使いやすいです。 |
実験
用意したアンケートデータをDatabricksにDeltaテーブルとして登録し、Genieに対して自然言語で質問を投げかけてみます。SQLを一切書かずにどこまで答えを引き出せるか検証します。
以下の質問をGenieに順番に尋ねていきます。
Q1. 全体のNPSスコアの平均はいくつか

Q2. 地域別のNPS平均スコアを教えてほしい


Q3. 製品カテゴリ別に総合満足度の平均を比較してほしい


Q4. 年代別・性別のNPSスコアに違いはあるか


Q5. 利用期間が長いほど満足度は高いか


Q6. 再購入意向が「低」の回答者の特徴を教えてほしい


Q7. NPSスコアが低い(0〜6)回答者のコメントにはどのような傾向があるか


Q8. 月別のNPS推移を教えてほしい


終わりに
今回の実験を通じて、SQLを一切書くことなく、自然言語だけでアンケートデータから多角的なインサイトを引き出せることが確認できました。
さらにGenieはは「棒グラフで表示してほしい」「折れ線グラフに変えて」と指示するだけで、結果の可視化方法をその場で変更できるほか、昇順・降順などを予め設定してその通りに可視化することも出来ます。また、顧客マスタや製品マスタといった別テーブルとの結合も自然言語で指示できるため、「企業規模別のNPS」や「契約プラン別の満足度」といった、より踏み込んだ分析も実現できます。
データ活用の入り口を広げるツールとして、Databricks Genieはアンケートデータに限らずさまざまな場面での活躍が期待できます。

