テキストマイニングとは?

商品レビューや口コミ、問い合わせ、クレーム等顧客の声を分析するために、「テキストマイニング」といわれる手法があります。
テキストマイニングでは、文章などの定性的なデータを定量的なデータに変換し、様々な解析手法を適用します。

 

文章等の定性的なデータを人海戦術で処理していたものを、分析を用いて自働化・半自動化することで、業務効率向上による人件費の削減や、システム化が可能になります。

 

テキストマイニングで用いられる手法に「形態素解析」「ワードカウンティング」「共起分析」などがあります。
形態素解析は、機械が単語を認識するための手法で、文章を単語などに分けます。

 

ワードカウンティングでは、形態素解析で切り分けられた単語の各文章中における出現頻度を集計します。
アウトプットはクロス集計表をイメージしてください。この集計表では定量データに変換されているため、さまざまな解析手法を適用することができます。

 

共起分析では、単語同士のつながりを分析します。例えば、同じ文章中に出現しやすい単語をネットワークで表現します。

 

「R」に関連するTwitterを共起分析した例

テキストマイニング