このステップでは、収集したデータを整理、分析し、目標との関連性やその制限(欠損値や情報源の偏り、データ量)を把握します。 そのために、できる限りデータを視覚化していきます。その際、次のように目的に応じてグラフを作成します。
ここでのポイントは
予測モデル作成を含むプロジェクトの場合は、予測対象とその他のデータ項目との関連性をざっくりと分析します。単純な一対一の相関などであればこの段階であたりがつきますが、複数の条件を加味する場合は、一旦予測モデルを作成しそこから逆算するなどのテクニックを使った方が効率的です。
ワーク:どのようなグラフを作成すればよいでしょうか?データ項目(グラフの種類)をあげてください。
収集したデータ項目:リピートの発生、 顧客情報(性別、年齢層)、利用メニュー、担当スタイリスト、予約タイミング、新規来店日
では、いくつか見ていきましょう。
30から40 %付近を推移しているようです。
性別:
年齢層別:
「データから価値を創造する」一般社団法人データマーケティングラボラトリー
Copyright© DML All Rights Reserved.