HadoopとYLUGカーネル読書会

Googleを支える技術 ?巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ)

最近話題の「Googleを支える技術」を読んだ。ぢつはちょっと前に、Google App EngineSDKをそのままオレオレサーバに使えないかと思って、コード読んで、straceしてみたりしてた。驚愕したのがデータベースとなるファイルの扱い。データベースに1レコード追加するAPIを叩くと、

  1. /tmpに一時ファイルを作成
  2. Pythonのオブジェクトを全データ丸ごと書き込む
  3. その一時ファイルを本家のデータベースファイルにリネームする

なんという荒業。なんでこれが分散処理でスケールするんだよと驚愕。それからこの本を読んだので、GFSとかBigTableとか、ふむふむほげほげと楽しく読めた。


あと、後半の消費電力との戦いのあたりは、最近Googleが買収したり研究資金突っ込んだりしている分野のほとんどが、低消費電力関係だったりするらしい、というBay Areaのウワサと合致していて面白かった。


んでもって、本書でも触れられているHadoop。木になる気になると思っていたら、こんなエントリがはてブにあがってた。
献本: Googleを支える技術

Hadoop普及の為にどっかで一回プレゼンしたいなあー。

これは是非プレゼンを拝聴したい。と、思ってid:hyoshiokさんにtwitterで投げたら「紹介してよ」って返されちゃって、アタイはただのブログの一読者ですよーと涙目だったんだけど、やっぱり是非プレゼンを拝聴したいということで、ブログのコメでYLUGカーネル読書会の宣伝をして、プレゼンわっふるわっふるしてみた。お願いできるとうれしいなー。わっふるわっふる。