データマイニングの手法を学ぶ!
前回はデータマイニングの概要について書きましたが、今回は実際に行う際の手法について述べたいと思います。
データマイニングの手法
知識発見を目的とするデータマイニングの手法は、4つの手法に体系化できます。
1.予測
ある値(連続量)の予測や Yes/No(二値)の判別を行う手法で、回帰分析やロジスティック回帰分析などが使われます。
たとえばメルマガを送った顧客が購入に至った場合を1、
そうでない場合を2とすると、
メールマガジンを送った1人単位での購入確率を算出できます。
この予測値に基づき、一定数のメルマガを送る際には、確率の高い人からメルマガ人を送るという方法が、ランダム抽出した送り先へ送信するよりも高確率で購入者を獲得できます。
2.分類
サンプルをいくつかのグループに分ける手法で、クラスター分析や決定木分析が使われます。
クラスター分析では、各データの情報をその類似性に基づいて分類する方法です。似た者同士を集め、顧客セグメントを作るときに活用できます。こうして作られたセグメントごと、行動のパターン、趣味嗜好、購入確度などのパフォーマンスに差異が見られるようになるため、それを広告やメルマガなどで活用していくことができます。
3.判別
データサンプルを分割してデシジョンツリーを作成する方法が、決定木分析です。IF THEN(もし~が発生したら、その次に~が発生する)形式で、データを分類して予測する分析方法です。
商品Aを購入した人は、一緒にBを買う、一緒にBを買った人は一緒にCを買う、と言った条件分岐でそれぞれの確率を出し、有意かどうかを把握します。
アウトプットの形はツリー構造であるため、決定木と呼ばれます。
4.相関
二つ以上の事象の関連性を探す手法で、お客さんが一緒に買う商品は何かを分析する手法がこれです。
アソシエーション分析と呼ばれるもので、たとえば化粧水を買った顧客のうち、何パーセントが美容系のサプリメントを買うかを分析し、商品間の相関性を発見するというものです。買い物かごに何と何が入っているかを分析するものをバスケット分析、時系列に時点をずらして分析した場合をシーケンス分析と呼び、化粧水とサプリメントを同時に買った顧客は、数か月後に購入した商品がどのように変わったか、あるいは併売したのかを導き出します。
データマイニングが解決すること
マーケティング上の課題を解決するヒントや、手段を発見する。データマイニングで何をするか、手法がたくさんあるため目移りしてしまうこともあります。しかし、課題解決のためのデータマイニングというブレない目的を持っていれば、おのずと何をすべきかが絞られてきます。
たとえば商品について知りたい場合
・今後力を入れるべき重点商品はどの商品か
→データの分類と抽出を行う
・どの商品とどの商品が一緒に買われているか
→データとデータの関係性を知る
・この商品は将来どの程度売れるか
→データを抽出し、性質を知ったうえで、データとデータの関係性を把握する
顧客について
・この顧客はどんな商品を買ってくれているのか
→データをグループ化する
・特定のクラスターにもっとも有効な商品は何か
→データの抽出と並べ替え、グループ化を行う
・自社の顧客は性年代別、地域別にどんな人か
→データとデータの関係性を知る
まとめ
データマイニングで利用するデータは、これからより多角的かつ大量になっていくでしょう。
現状ではサイトの閲覧履歴やカード購入履歴、購買履歴などの行動履歴データに基づくデータマイニングが主ですが、これからは見込み客の情報収集公道、コールセンターに届いたクレームや質問、顧客からの要望、ブログなどの書き込みを元データとして、より細分化された高精度の分析が展開されるはずです。
自社が持つ情報を一様にごみとして扱うことなく、いち早く顧客とのコミュニケーションデータを使い、データマイニングの手法を固めた企業が市場優位に立つ世の中になっていくのではないでしょうか。