月刊ビジネスコミュニケーションによるエキスパートブログ
HOME | ABOUT |
atom rss2.0

« previous next »

BigDataの活用動向 その1-概要・背景-

2012.07.18|新ネットワーク このエントリーをはてなブックマークに追加Yahoo!ブックマークに登録この記事をクリップ!BuzzurlにブックマークBuzzurlにブックマーク

近年の情報通信技術の発展に伴い、動画や音声、文書やログなどテキストデータを含めた世界で生み出されるデータは爆発的に増加している。IDC(International Data Corporation)の予測によると世界で生み出されるデータサイズは、2020年には35ゼタバイト(1ゼタバイト=1021バイト)に上り、今後も増加の一途をたどるといわれている。(図1-1参照)

昨年11月に石橋 聡氏が“誰でもわかるビッグデータ”にて述べられているように、データをコンピューターで処理することで、データの中に隠された複雑な法則の発見や未来の予想を行おうとする取り組みが活発になってきている。これを実現するのが所謂「ビッグデータ(以下、BigData)」技術である。

「BigData」といっても単にデータの量(Volume)だけをさすのではなく、データの多様性(Variety)やデータの変化の速さ(Velocity)などの特性を持つ一般的なRDB(リレーショナルデータベース)では取り扱えないほど大きく複雑なデータ全般を表すことが多くなっている。これらの特性は、英語表記の頭文字から3Vと称されたり、それに価値(Value)もしくは、正確性(Veracity)を加えて4Vと称されたりする。

このような簡単には取扱いができないデータに対して、「収集」「蓄積・処理」「分析・活用」の観点から様々な取り組みがなされている。今回から始まるシリーズではそのいくつかの取組について説明する。
また、今後BigDataを活用し、ビジネス化していくためには情報保護という観点が必要条件となってくる。そこで、情報の取扱いの技術でも特に「匿名化」について説明をしていきたいと思う。

【収集について】
データの収集の段階においてはスマートホンやポイントカード、FacebookやTwitter等、ハードウェアやプラットフォーム、各種サービスの整備・普及に伴い、氏名・性別・年齢・購買履歴といった情報だけにとどまらず、センサー情報や位置情報、個人の行動履歴といった、より詳細な情報が以前よりも容易に取得できるようになった。特にSNSなどのソーシャル情報の特筆すべき点は、これまで事業者等がアンケート等の手法を駆使して獲得していた情報を、ユーザー自らが主体的に発信する事で事業者はバイアスのかかっていない生の声を獲得できるところに特徴がある。

また別の切り口としては、購買履歴や氏名・年齢・性別といった個人情報など、比較的構造化されたデータに加えて、センサー情報や位置情報、コールセンターにかかってきた通話の情報など、一般的なRDBには単純に収まらないような非構造化データを中心にその大きさが増大しているというのもBigDataの大きな特徴の一つといえる。

BigDataのデータ収集フェーズの中で重要なポイントは、玉石混交の巨大なデータをまずは様々な仕組みを使って集めてくることである。それをどう構造化し、組み合わせ分析する材料に磨いていくかについては、利用用途や分析の目的により見極めが必要である。

次回からは「蓄積・処理」以降の技術について触れていく。

Latest