アソシエーション分析:頻出するアイテムの組み合わせ
概要
同時に発生するデータに基づいて、その規則性を抽出します。相関ルール(アイテム間の組み合わせ規則)ごとの評価指標を抽出します。なお、説明を簡略化するためにアイテムの組み合わせと表現していますが、条件と結果の組み合わせを分析しているため、アイテムの他に性別や年齢などの条件を入れて分析することも可能です。例えば、20代男性(条件)がよく購入する商品(結果)を抽出することができます。
主な適用場面として、同時購入の規則性を利用した商品陳列の最適化や、セット販売、オプションサービスの提案があります。また、購入履歴やページ閲覧履歴から商品やコンテンツのレコメンデーションに使われます。
■分析例:同時購入を促しやすい商品の組み合わせは?
アルゴリズム
相関ルールの例
商品Aを買うと商品Bも買う: A ⇒ B
評価指標
上記の相関ルールの例を使って説明します。
・支持度:相関ルールの出現率
特定のAとBを含むトランザクションが全体に占める比率
・確信度:相関ルールの結びつきの強さ
特定のAとBを含むトランザクション数を、条件Aを含むトランザクション数で割った値
・リフト:相関ルールの有効度(一般的に1以上で有効とされる)
確信度を支持度で割った値