HadoopとYLUGカーネル読書会
最近話題の「Googleを支える技術」を読んだ。ぢつはちょっと前に、Google App EngineのSDKをそのままオレオレサーバに使えないかと思って、コード読んで、straceしてみたりしてた。驚愕したのがデータベースとなるファイルの扱い。データベースに1レコード追加するAPIを叩くと、
- /tmpに一時ファイルを作成
- Pythonのオブジェクトを全データ丸ごと書き込む
- その一時ファイルを本家のデータベースファイルにリネームする
なんという荒業。なんでこれが分散処理でスケールするんだよと驚愕。それからこの本を読んだので、GFSとかBigTableとか、ふむふむほげほげと楽しく読めた。
あと、後半の消費電力との戦いのあたりは、最近Googleが買収したり研究資金突っ込んだりしている分野のほとんどが、低消費電力関係だったりするらしい、というBay Areaのウワサと合致していて面白かった。
んでもって、本書でも触れられているHadoop。木になる気になると思っていたら、こんなエントリがはてブにあがってた。
⇒ 献本: Googleを支える技術
Hadoop普及の為にどっかで一回プレゼンしたいなあー。
これは是非プレゼンを拝聴したい。と、思ってid:hyoshiokさんにtwitterで投げたら「紹介してよ」って返されちゃって、アタイはただのブログの一読者ですよーと涙目だったんだけど、やっぱり是非プレゼンを拝聴したいということで、ブログのコメでYLUGのカーネル読書会の宣伝をして、プレゼンわっふるわっふるしてみた。お願いできるとうれしいなー。わっふるわっふる。