ビッグデータとは何か?

今やビジネス用語として定着しつつある「ビッグデータ」。文字通り巨大なデータをビジネスや社会に活かしていくってことだよね、というイメージはあっても、具体的にその意味をと問われたら、よくわからないという人も多いのではないでしょうか。

では、ビッグデータとは何なのでしょうか?実のところ、その概念を明確にする定義はなく、一般的には「多種多様な形式の大量のデータのことであり、またそのデータをリアルタイムで分析し、事業や社会に新たな可能性や価値を見出していくこと」を意味しています。

ビッグデータを理解するうえでよく挙げられている特性としてVolume(データ量の多さ)、Variety(データの多様性)、Velocity(頻度)という「3つのV」があるのですが、それらはもともとデータ管理の困難さを示すものでした。顧客情報や経理・販売・在庫データなど、企業がコンピュータシステム上のデータベースで管理することができる構造化データだけでなく、クラウド、モバイル、ソーシャルメディアといったIT技術の進歩によって日々膨大に増え、急速に変化し続けるウェブコンテンツや画像、動画、テキストデータ、など、既存の技術では管理することが困難な非構造化データも含めて、リアルタイムで収集・分析し、ビジネス活用を広げる資源として捉えていこうという取り組みがビッグデータなのです。

ビッグデータの種類

ビッグデータの活用が企業の成長戦略に

データ分析が重要な経営リソースであると認識され、新商品の開発や既存製品の改善など、さまざまな分野でビッグデータを活用する企業が増えてきました。その中でも特に注目されているのが、いつどの店でどんな商品がいくらで何個売れたのかがリアルタイムで収集されるPOSデータ、SNSやツイッター、ブログ、レビューサイトなどネット上に溢れる口コミ情報、コールセンターへの問い合わせやアンケートに代表される消費者の声などです。

そうしたデータには、数値によって把握できる「定量データ」と、質的な情報の「定性データ」があります。例えば、A店である新商品を購入した人を時系列や年齢、性別ごとに比較したり、商品の市場占有率や売上高を把握したり、明確な数値で可視化できるものを定量データといい、マーケティング戦略上の基本とされています。一方、なぜこの商品をA店で買うのか、商品のどこを気に入ったのか、どうだったら購入したいと思うのかといった数値では表せない消費者の購買意識などを分析するのが定性データです。

カテゴライズされたビッグデータ

テキストマイニングで、定性データを可視化

そこで、定型化されていない文章の集まりを単語やフレーズに分割し、相関関係やパターンを分析して有用な情報を掘り当てることを可能にした「テキストマイニング」という技術が登場しました。テキストマイニングとは、テキスト(text=文書)とマイニング(mining=掘り当てる)という2つの言葉を合せたもので、日本語のテキストデータを活用する技術として、これからの市場調査や顧客分析など様々な用途での活用が期待されています。

例えば、ある化粧品会社が発売した新商品について、SNSでの口コミやレビューサイトでの評価についてテキストマイニングを使って調べると、20代の消費者は価格についての話題が多く、30代では使用感についての話題が多いことが分かったとします。しかし、これだけのデータではそれが高いのか安いのか、使用感が良いのか悪いのかを読み取ることはできません。そこでさらにその言葉と関連してどんな言葉が使われているのかを見ていくことで、膨大な文字情報の山から製品の評価や顧客の要望や不満などを時系列や年齢・性別ごとに可視化することができるというわけです。

次回は、このテキストマイニングを使って定性データを活用する方法を詳しくご紹介します。


“見える化エンジン”についてのお問い合わせはお気軽に