意思決定のための分析に最適化されたデータ倉庫
データウェアハウスとは、企業やブランドが持つありとあらゆるデータを1箇所に蓄積するデータ倉庫のこと。Data WareHouseの頭文字をとって「DWH」と略されることが多い。
データウェアハウスという言葉は、1992年に出版されたW.H.インモン(William H. Inmon)の著書『データウェアハウス 構築編 (原題:Building the Data Warehouse)』で初めて登場する。
インモンはデータウェアハウスを「意思決定のための、目的別に編成され時系列に統合されたデータの集合体」と定義している。つまり、ただデータベースに大量のデータが保管されているのではなく、意思決定を行うことを目的として時系列に整理された状態になっていることが重要なのだ。
データウェアハウスの4つの条件
加えてインモンによれば、データウェアハウスとは下記4つの条件を満たしたデータベースのことを指す。
【データウェアハウスの定義】
1. サブジェクトごとに保管されている
2. データが統合されている
3. データが時系列で記録されている
4. データが消されたり更新されたりしない
1. サブジェクトごとに保管されている
データを目的別ではなく、サブジェクト(内容)別に分類する。
イメージとしては図書館の分類方法に似ている。たとえば販売実績を収集したデータには顧客の氏名や商品コード、商品名、価格、店舗名などの情報が入っている。それをそのまま「販売実績」として保管するのではなく、「顧客」「商品」「店舗」といった内容別に分解して保管するのがデータウェアハウスの基本である。
2. データが統合されている
様々な部署や店舗などから集められたデータをサブジェクト別に統合する。
たとえば、あるシステムでは「顧客名」とラベリングされているデータ、あるシステムでは「取引先」とラベリングされているデータ、双方は内容的には同じものだろう。これらのデータをそのまま保管するのではなく、抽象化して一つの概念に統合する作業がデータウェアハウスでは必要になる。
3. データが時系列で記録されている
データウェアハウスは情報を過去に遡れることが重要であるため、データを時系列で保管しなければならない。
4. データが消されたり更新されたりしない
基幹系システムはデータが更新され続け、過去のデータは消えてしまうことが多いが、データウェアハウスではデータの更新や削除は行わない。
ありとあらゆるデータが分析対象になるため、過去のデータを残すことはもちろん、消去や変更が行われたデータについても、「消去された」「変更された」という履歴をデータ化して保管することになる。
データウェアハウスのメリット
■欲しいデータを取り出しやすくなる
データウェアハウスには部門横断的にサブジェクト別かつ時系列にデータが整理されている状態のため、過去の情報を参照したい時にすぐに取り出せるというメリットがある。
これが整理されていない状態だと、たとえば顧客管理システムと販売管理システムといったように、複数のデータから情報を取り出さなければならず、知りたい情報を取得するのに時間がかかってしまう。
■マーケティングが加速する
上記メリットと似ているが、データウェアハウスに蓄積された情報はあらゆるマーケティング活用に役立つということ。
たとえば、最後にないを買った顧客がリピーターになりやすいといったRFM分析、どの経路から獲得した顧客がアップセルしやすいといったLTV分析、POSシステムのデータ分析やCRM改善など、様々な分析の根幹となるデータがウェアハウスに蓄積されている。
しかもそのデータは分析しやすいように整理されているため、マーケティング活動を効率的に行うことができるようになるのだ。
このように、データウェアハウスは社内のあちこちでバラバラに保管されているデータを統合し、ビジネスの意思決定に必要な判断材料を瞬時に取り出すことができる。たとえビッグデータのように大量のデータを保持していない企業でも、データウェアハウスを導入する意義は大きいと言えるだろう。