HP WORLD Tokyo 2007に行ってきた

mixiの中の人がやる、MySQL Clusterの検証のセッションだけに行ってきた。


つーか、あまり面白くなかった。 あまり参考にはならんかった。


mixi内で検証したMySQL Clusterの報告ならばもっと良かったんだが、
なんか、HPから頼まれて、HPのサーバ使ってCluster構成作って、
やってみましたー、その報告ーって感じだった。


だいぶ駆け足的な内容で30分くらいで終了。


http://www-jp.mysql.com/products/database/cluster/
MySQL Clusterはココ。


まあ、いろいろ問題も多いみたい。


クエリを処理するSQLNodeはオンラインでのNode追加/削除は問題なく、16台程度追加が可能だとか。
データを蓄積するDataNodeのほうはオフラインで
Node追加/削除をやらなくてはいけないところがイケてないらしい。
64台まで増やせるらしい。


というわけで、Cluster適用箇所ってのは、

  • Cache的な利用
  • SQLのリソースが高めなとこ
  • DISK I/Oの高いとこ(これはインメモリだからという理由)
  • 消えてもそれほど支障のない箇所(インメモリなだけに揮発性が高いからという理由)

で、実際に考えれる箇所ってのは、

  • セッションDB(セッション値を保存しとくとこ)
  • ClusterをSlaveとして(詳細は失念)
  • メモリストレージ的利用(Cache的な利用、memcachedの代用)


システムの基幹部分でなく、短期保存的な部分になら、十分に導入可能だということだった。
めでたし、めでたし。


MySQL Clusterに関してはこの資料も参考になりそうだ。
http://www.scs.co.jp/mysql/docs/prezen_expo2006.pdf


で、講演終了後質問大会にて、
今、mixiはどのくらいのサーバが稼動しているの?という問いには、
アプリケーションサーバが300〜400台。DBも同程度。全体で約1000台くらいが稼動している」
とのこと。


今回の検証はディスクのほうはやっていないのか?という問いには
「今回はメモリのみで検証した」
とのこと。
(MySQL Cluster 5.1からはメモリデータベースとディスクデータベースの双方が選択できる)


また、この検証はどのようなデータを使ってやったのか?という問いには、
「現在の日記と似たような構成のデータを作ってやって、同じクエリを発行して試した」
とのことだった。