NTTグループのソリューションガイド
月刊ビジネスコミュニケーションによるエキスパートブログ
HOME | ABOUT |
atom rss2.0

« previous next »

BigDataの活用動向 その2-データ活用技術-

2012.07.23|新ネットワーク このエントリーをはてなブックマークに追加Yahoo!ブックマークに登録この記事をクリップ!BuzzurlにブックマークBuzzurlにブックマーク

【蓄積・処理について】
近年BigDataやその活用用途に注目が集まっている要因として、収集したデータを蓄積・処理する技術の進歩が果たした役割は大きい。処理や蓄積を行うCPUや、ハードディスクといったハードウェアがより安価に、より高性能に発達している事に加え、ソフトウェアに関しても、特にMapReduceやHadoopなどの大規模並列分散処理の技術が発達した事で、これまでデータが大きすぎて扱えなかったペタバイトクラスのデータが容易に扱えるようになった。 MapReduceやHadoopについては“分散データセンターとクラウド技術 その3-並列分散処理基盤「Hadoop」について-(2011.06.20)”の回を参照して欲しい。RDB(Relational DataBase)とHadoopの違いについては表を再掲しておく。(表2-1参照)また、技術の関連性については図2-1を参照して欲しい。

【分析・活用について】
上記、蓄積・処理の技術の進展に伴い、OSS (Open Source Software)を中心に、データを分析・活用するツールも充実してきている。代表的なものとしてはBI(Business Intelligence)ツールであるPentaho 、統計解析ツールであるR、協調フィルタリングやクラスタリングといった機械学習のライブラリであるMahoutなどがある。協調フィルタリング技術については、Amazon社等のレコメンドサービスに使われていることでもよく知られている技術である。
これらの大規模並列分散処理の技術と分析・活用ツールを組み合わせて使うことで、現在、様々な領域でBigDataの活用が始まっている。代表的なところでは、前述のAmazon社のように顧客の情報を解析し、それぞれの顧客に合わせたレコメンドを行うサービスや、クレジットカード会社がカードの利用履歴を分析し、不正利用のパターンを発見する技術など、我々の身近なところで活用されている。これまでの技術でも類似の取り組みは行われてきたが、BigData技術の進展にともない、より大きなデータを細かい頻度で高速に処理できるようになっている。
BigData技術は上記のような活用に留まらず、医療や交通をはじめとした様々な業界で活用が図られている。気象情報を分析し、最も効率的に風力発電ができるようにタービンの設置場所を割り出すといった取り組みなども行われている。

次回からは、取得したデータの利用をとりまく社会情勢や、利用の注意点について触れていく。

Latest