【Databricks】アンケートデータを有効活用する

目次

はじめに

アンケートを実施しても、集計で終わってしまったり、欲しい切り口でデータを見るたびにエンジニアへの依頼が必要になったりと、有効活用できていないケースは多いのではないでしょうか。

本記事では、Databricks Genie を使い、自然言語でアンケートデータに質問しながらインサイトを引き出す方法をご紹介します。

Databricks Genieとは

Databricks Genieは、Databricksプラットフォーム上で提供されるAIを活用したデータ探索機能です。「先月のNPSが最も高い地域は?」のように自然言語で質問するだけで、自動的にSQLが生成・実行され、答えが返ってきます。会話形式でやり取りできるため、「その中でさらに30代に絞ると?」といった追加質問も自然に行えます。SQLの知識がなくてもビジネス担当者が自らデータを探索できる点が最大の魅力です。

使用するデータ

架空のSaaSサービスを対象とした顧客満足度調査のダミーデータを使用します。2024年1月〜12月の1,500件の回答を想定しており、NPSスコアと再購入意向・コメントには相関を持たせることで、よりリアルに近い構造にしています。

カラム名説明データ例
response_id回答ID1
response_date回答日2024-03-15
age_group年代30代
gender性別男性
region地域関東
product_category利用製品カテゴリBIダッシュボード
usage_period利用期間1〜3年
nps_scoreNPS(0〜10)8
satisfaction_overall総合満足度(1〜5)4
satisfaction_supportサポート満足度(1〜5)4
satisfaction_price価格満足度(1〜5)3
repurchase_intent再購入意向
free_comment自由記述コメントUIが直感的で使いやすいです。

実験

用意したアンケートデータをDatabricksにDeltaテーブルとして登録し、Genieに対して自然言語で質問を投げかけてみます。SQLを一切書かずにどこまで答えを引き出せるか検証します。

以下の質問をGenieに順番に尋ねていきます。

Q1. 全体のNPSスコアの平均はいくつか

Q2. 地域別のNPS平均スコアを教えてほしい

Q3. 製品カテゴリ別に総合満足度の平均を比較してほしい

Q4. 年代別・性別のNPSスコアに違いはあるか

Q5. 利用期間が長いほど満足度は高いか

Q6. 再購入意向が「低」の回答者の特徴を教えてほしい

Q7. NPSスコアが低い(0〜6)回答者のコメントにはどのような傾向があるか

Q8. 月別のNPS推移を教えてほしい

終わりに

今回の実験を通じて、SQLを一切書くことなく、自然言語だけでアンケートデータから多角的なインサイトを引き出せることが確認できました。

さらにGenieはは「棒グラフで表示してほしい」「折れ線グラフに変えて」と指示するだけで、結果の可視化方法をその場で変更できるほか、昇順・降順などを予め設定してその通りに可視化することも出来ます。また、顧客マスタや製品マスタといった別テーブルとの結合も自然言語で指示できるため、「企業規模別のNPS」や「契約プラン別の満足度」といった、より踏み込んだ分析も実現できます。

データ活用の入り口を広げるツールとして、Databricks Genieはアンケートデータに限らずさまざまな場面での活躍が期待できます。

CTA
  • URLをコピーしました!
  • URLをコピーしました!
この記事を書いた人
目次