教師あり(Supervised)

1. 分類

構成要素がどのクラスに分類されるかを予測するモデルを作成する

  • 予測モデルを利用することで、新しいデータがどのグループに属するか判別できる
  • 分類基準は分析者が設定する

活用例

  • オファーへの反応見込みを予測する
  • スパムフィルタリング(迷惑メールなど)による業務効率化

代表的な解析手法

  • 決定木
  • ランダムフォレスト
  • 勾配ブースティング木
  • サポートベクターマシン(SVM)
  • ニューラルネットワーク(ディープラーニングなど)

2. 回帰

個別のデータに対して、変数の数値を予測推定する

  • 分類の分類基準がクラス(Yes,Noなどのカテゴリー)に対して、回帰は数値が対象
  • 考え方や手法は「1.分類」のものがほぼ流用できる

活用例

  • サービスの利用量を予測する

代表的な解析手法

  • 回帰木
  • ランダムフォレスト
  • 勾配ブースティング木
  • サポートベクターマシン(SVM)
  • ニューラルネットワーク(ディープラーニングなど)
  • 回帰分析(一般化線形モデル、ロジスティック回帰など)

教師なし(Unsupervised)

3. 次元圧縮

多くの変数をより少数の変数に変換する

  • 複数の変数があるデータを2次元平面(グラフ)に表現するために使用される
  • 属性間の関連性、寄与率を示す
  • 新たな属性を作成する

活用例

  • ポジショニングマップの作成(クロス集計のグラフ化)
  • データ概要(変数間の関連性)の把握

代表的な解析手法

  • 主成分分析
  • コレスポンデンス分析(対応分析)

4. クラスタリング

特定の分類基準を用いずに、類似性に従ってデータを分類する

  • グループごとにデータを集計することで、各グループの典型的な特徴を把握する
  • 非階層型の場合は、グループ数は分析者が設定する
  • 新たな属性を作成する

活用例

  • セグメンテーション、ターゲティング

代表的な解析手法

  • 階層型クラスタリング(ウォード法など)
  • 非階層型クラスタリング(k−means法など)

5. 因果モデリング

データ間に存在する関連性を分析する

  • 関連性の有無やそのつながりを分析する
  • 他に影響を及ぼす出来事や行為を定量的に把握する
  • 予測ではなくデータからの知識発見に利用されることが多い

活用例

  • レコメンドエンジン
  • 現状や課題の把握

代表的な解析手法

  • アソシエーション分析(バスケット分析)
  • 共分散構造分析(SEM)

その他

6. 最適化

特定の変数が最大値(もしくは最小値)をとる条件を解析する

  • 条件に非連続な変数が来る場合は、組み合わせを考慮するため(方程式を解くわけでないので)計算が膨大になる
  • 汎用性がある

活用例

  • オペレーションリサーチ
  • 変数選択やパラメータの自動調整

代表的な解析手法

  • ニュートン法
  • 遺伝的アルゴリズム

「データから価値を創造する」一般社団法人データマーケティングラボラトリー

Copyright© DML All Rights Reserved.