ブログ

データマイニングとは? その定義や活用の手順、主な分析手法

インターネットが普及した情報化社会において、データをいかに分析・活用できるかが、企業活動の重要なポイントの一つといえます。
その中でデータマイニングは、膨大なデータから有用な情報を得られる技術として、近年注目を浴びています。

そこで本記事では、データマイニングの定義や活用の手順、主な分析手法など、データマイニングの基礎について解説します。
データマイニングのためのデータ収集

データマイニングとは何か?

データマイニング(Data Mining)とは、膨大なデータから新たな相関関係やパターンを採掘(マイニング)する技術のことです。
主にマーケティング戦略の策定や、経営の意思決定をスムーズにすることを目的に利用されます。

ITの活用やテクノロジーの発展が進み、データの収集・蓄積が容易な時代になりました。
しかし、膨大で雑多なデータをそのまま活用するのは難しく、人力で有用な情報を得るのも困難です。
ですがデータマイニングなら自動でデータを整理・分析し、ビジネスに役立つヒントや知見を得ることができます。

データマイニングを活用した例としては、オムツとビールはセットでよく買われるという、隠れた相関関係を見つけた話が有名です。
これはオムツの買い物を頼まれた父親が、自分へのご褒美としてビールも購入するからです。
実際には都市伝説として扱われることが多いですが、データマイニングを理解するのに好事例といえるでしょう。

他にも、

  • クレジットカードの販売履歴から、反応率の高いキャンペーンを実施
  • ECサイトで、過去の顧客層や売上傾向からオススメの商品を提案
  • SNSの投稿内容から、市場調査や顧客のインサイトを分析
    など、実はすでに身近なところでデータマイニングは活用されています。

データマイニングが求められる背景

変化の激しいビジネス環境を生き残るには、多様化する顧客のニーズに対応しなければなりません。
そのためには、データや分析結果に基づいて有効なマーケティング戦略を立てることがポイントとなります。

しかし、スマホの普及やSNSの利用者増加、数々のクラウドサービスの登場など、社会に流通するデータ量は年々増える一方です。
データマイニングは、そのような膨大なデータを高速かつ大量に処理できるとして注目が集まっています。

また、これまでデータマイニングは高額で一部の企業しか利用できませんでしたが、クラウド技術の発展により、低コストで手軽に使えるようになりました。
これにより、近年ではデータマイニングを取り入れる企業が増えつつあります。

データマイニングを行う5つの手順

実際にデータマイニングを行うにはどのような手順を踏めばよいのか、大きく5つに分けてご紹介します。

  1. 目的の明確化
  2. データを収集する
  3. 収集したデータの加工
  4. データマイング開始
  5. 得られた情報を有効活用する

データマイニングでどのような成果を得た

1 目的の明確化

いか、それをどのように活用したいかをまず考えます。
なんの目的もなくデータだけ放り投げても、良い成果は期待できません。データマイニングによって解決したい課題や、達成したい目的をはじめに明確にしましょう。

2 データを収集する

データマイニングの対象となるデータを収集します。
基本的に収集するデータは多ければ多いほど、有用な情報を得る可能性は高まります。
データマイニングに用いられるデータは、主に以下の5種類です。

商品データ
商品名、価格、カテゴリーなど
販売データ
購買価格、購買数量、購買日時など
顧客データ
顧客属性、行動履歴、ライフスタイルなど
外部データ
景気、天気、競合企業など
内部データ
広告、セール、新商品発売など

3 収集したデータの加工

次に、収集したデータを分析ソフトが扱えるように加工します(クレンジング)。
表記がバラバラな数値や記号を統一したり、不要な情報を除外したりすることで、よりデータマイニングの精度を向上させることができます。

4 データマイング開始

扱うデータを整形できたら、データマイニングを行います。
マイニングのアプローチは、主に2種類あります。

機械学習
事前に仮説を用意せず、コンピュータの機械学習で新たな知見を得る
統計分析
事前に仮説を用意して、検証のためにデータをマイニングする

5 得られた情報を有効活用する

データマイニングで得た情報を、戦略の策定や意思決定などに役立てます。
必ずしも成果が出ることを保証するものではありませんが、ビジネスのヒントとして成功確率を上げる手助けになるはずです。

データマイニングの主な分析手法

データマイニングの分析手法は複数あり、目的によって扱う手法は変わります。
その中でも代表的な手法としては、以下の3つがあります。

  1. クラスター分析
  2. マーケット・バスケット分析
  3. ロジスティック回帰分析

1 クラスター分析(分類)

類似した性質を持つデータを、「クラスタ(集団)」というグループに分ける手法です。
顧客をセグメント化するのに用いられることが多く、顧客別に適切なマーケティング施策を打ち出すことができます。

2 マーケット・バスケット分析(関連発見)

商品やサービス同士の関連性を見つける手法です。
どの商品とどの商品がセットでよく買われるなど、買い物カゴの中を分析するようなイメージのため、「バスケット」という名前が使われています。
別名として、アソシエーション分析とも呼ばれています。

3 ロジスティック回帰分析(予測)

過去のデータをもとに、特定の事象の発生確率を予測する手法です。
主にDMやキャンペーンなどのマーケティング施策を打つことで、どのくらい顧客の反応を得られるかを予測するのに用いられます。

まとめ

ITの活用やテクノロジーの進化により、データの収集・蓄積は容易になりましたが、それらを十分に活用できていない企業は少なくありません。

しかしデータマイニングを活用すれば、難しい統計学や分析手法を理解していなくても、大量のデータを自動で高速かつ正確に処理してくれます。

得られた分析結果を有効に活用すれば、最適なマーケティング戦略を練ったり、ビジネスチャンスを広げたりすることができるでしょう。