HadoopとSmartGrid・その3
前回のエントリーの続きです。ようやくHadoopの利用方法についての言及部分にまで進みました。「Googleを支える技術」を読んだ時は、これらにどんな利用用途があるんだろうと思ってしまったためか、ほとんど技術の深追いができませんでした。しかし、下記の部分を読んだことによって、もう一度、上記の本を読み返してみたくなりました。今日は時間がなかったので、読解量は少なめです。
http://www.cloudera.com/blog/2009/06/02/smart-grid-big-data-hadoop-tennessee-valley-authority-tva/
- The Case For Hadoop At TVA
- 最初の問題は、確実にPMUデータを保存し、いつでも利用可能な状態にするためにはどうしたらいいかということだった
- ストレージ業界には多くの解決策があったが、どれも高価で、信頼性の高いハードウェアの利用を前提としていた
- 複数のディスクにまたがるような巨大なデータを扱えば、a high mean time to fail (MTTF)を使ったとしても、システム障害が頻繁に発生してしまう
- Hadoop’s aggressive replication schemeのためのファイルシステムを持っていた
- Hadoopが、TVAのプロジェクトに適していると判断した
- 他の問題として、NERCやそれに関連する研究機関も、データにアクセスでき、処理を実行できる必要があった
- Hadoopのオープンソース・エコシステム
- Hadoopは活発なプロジェクト
- 関連する様々なプロジェクトが同時並行で進んでいる
- これは採用する側としても価値があること
- TVAにとって、Hadoop導入は一石二鳥の解決策
- 最初の問題は、確実にPMUデータを保存し、いつでも利用可能な状態にするためにはどうしたらいいかということだった