目次
データマイニングとは?
データマイニングとは?
大量のデータを統計学や人工知能などの分析手法を駆使して、「知識」を見出すための技術
DIKW
- ■データ(Data):整理されていない数値
- ■情報(Information):「データ」を整理・カテゴライズしたもの
- ■知識(Knowledge):「情報」から得られる傾向・知見
- ■知恵(Wisdom):「知識」を利用して人が判断する力
データウェアハウス(DWH)とは
データウェアハウスはデータベースとは異なり、登録されたデータの削除や更新を原則として行いません。データウェアハウスは、データを蓄積することが目的だからです。
データマイニングとデータウェアハウス(DWH)の関係
データマイニングを行う上では、データウェアハウスの存在は欠かせない
データマイニングを利用する上でデータウェアハウスが必須となるわけではない
準備その1: データマイニングの元となるデータの収集
…
準備その2: 収集したデータの加工
=クレンジング
データ形式」は、原則としていずれかに統一する必要があります
正確な結果を出すには、「正規化」などを施す必要もあります
データマイニング2つの具体的手法
…
事前に仮説を用意しない「機械学習」
- データの中からコンピュータが自分で学習しながら相関関係などを導き、人ではできない新しい分類(顧客セグメント)などを発見
- 得意分野
- 複雑な条件が絡む課題の分析や最適化
- 「個客ごとの最適なマーケティングシナリオの選定」
- 「ある事象の原因の特定」
事前に仮説をたてる「統計分析」
- 代表的な統計手法
- 回帰分析
- 主成分分析
- 因子分析
データマイニングに必要な3要素は?
大量の元データ
データマイニング用のシステム
スキルを持った人
データマイニングの分析手法
クラスタリング
- グルーピング
- 活用例:顧客のセグメント化
ロジスティック回帰分析
- YES/NO課題に有効
- 活用例:顧客はある製品を買ってくれるか否か
マーケット・バスケット分析
- =アソシエーション分析
- 相関性を見出す
- 例:ビールとおむつ