HadoopとSmartGrid・その4
電気にまつわる大量のデータをHadoopを使っている処理している事例を読み進めています。今回でようやく、下記の記事を読み終えました。技術的にわからない点も多々ありましたが、とても良い勉強になりました。どこの企業がどこと提携したというようなタイプのニュースよりも、こういった具体的な事例に触れる方が、自分にとっては面白いと思えるような気がしています。
http://www.cloudera.com/blog/2009/06/02/smart-grid-big-data-hadoop-tennessee-valley-authority-tva/
- PMU Data Analysis at TVA
- 分析における現時点でのニーズや要望
- 現在、MapReduceを使ったアプリケーションを書いている
- 以前よりも、より多くのパワーグリッドのデータを扱える
- 伝統的なテクニックによって、シンプルな周波数を計算する場合でも、テラバイト級のデータを扱う必要があるため、そのプロセスは退屈なものになりえた
- MapReduceは、並列化処理を可能にしてくれただけでなく、ディスク読み込みのスピードを高めてくれた
- 次は、indexing techniquesに取り組む予定
- Frequency Disturbance Recorders(FDR)のようなデバイスも利用する予定
- 速度はPMUデバイスの3/1程度
- しかし、数多くの安価なメーターが、オンラインになれる可能性を秘めている
- そうすれば、TVAが管理できるデータ量も増える
- このような追加的なデータによって、パワーグリッドに関する、より完全な実情を描き、その挙動を把握することが可能になる
- Looking Forward With Hadoop
- 改善したい分野がいくつかある
- セキュリティは最も大きな分野
- 特に、データの特性や、他機関も関わるという事情
- Hadoopのコミュニティによって、セキュリティ問題は改善されていくだろうと見ている
- 他のプロジェクトとの共存
- 同じシステム内で、様々な研究プロジェクトを共存させる道を探している
- 同じインフラを使うが、独自のプライベートなアカウントエリア内で、ジョブを実行し、結果をダウンロードできるような環境
- 研究は競争力のあるビジネスになりうる
- Cloudera
- PMUのデータ処理のオプションの一つとしてクラウド・コンピューティングの可能性を検討していた際、TVAが知りたかったことは、このエリアに“Redhat-like”な要素は存在するかということだった
- 「Cloudera」は、Hadoopの分野でこれを満たす企業だった
- http://www.cloudera.com/hadoop-support
- 多くの企業が経験がなく、多くのコンサルティングファームが適切なアドバイスを提供できない分野
- そんな環境下において、Clouderaは格別なサポートを提供していた
- ClouderaはTVAにHadoopが適していると確信させ、細かい疑問に答えてくれた
- Clouderaは、例外的にTVAをサポートして、“front line support”してくれた
- CouderaのHadoopディストリビューションと、ハードウェア購入に対するガイダンスのおかげで、コストを節約することができ、とても短い期間でHadoopによる評価を始めることができた
- http://www.cloudera.com/hadoop
- 改善したい分野がいくつかある