Archive

For the day 木曜日, 12月 16th, 2010

Wikipediaのdumpページ復活

No Comments

ちょろっと見たらWikipediaのdumpページが復活していた。

ということで、当初の予定通りWikipediaを使った「何か?」を作ってみようと思う。

ともあれ、Wikipediaのデータがないと話にならないので、早速このGeekWindのMySQLの中にWikipediaのデータを投入する。

と、簡単そうだが、投入するまでには長い道のりがあった。

それについてはシステム管理の方で書くとして、結構やばかったのはディスクが結構厳しくなったことである。

Wikipediaのデータを投入するまでのディスク使用量の変遷を以下に示すとこんな感じ。

 
# ダンプデータダウンロード直後
Filesystem           1K-ブロック    使用   使用可 使用% マウント位置
/dev/hda2             18222732   4076876  13205252  24% /

# 圧縮ファイル解凍直後
Filesystem           1K-blocks      Used Available Use% Mounted on
/dev/hda2             18222732   7972624   9309504  47% /

# xml2sql実行直後
Filesystem           1K-ブロック    使用   使用可 使用% マウント位置
/dev/hda2             18222732  12827100   4455028  75% /

# MySQLにデータ投入直後
Filesystem           1K-ブロック    使用   使用可 使用% マウント位置
/dev/hda2             18222732  13825992   3456136  81% /

# 不要ファイル削除後
Filesystem           1K-blocks      Used Available Use% Mounted on
/dev/hda2             18222732   7801192   9480936  46% /
 

思ったよりディスクを喰ったなぁ。

さくらのVPSもServerMan@VPSみたいにディスク容量をプラスできるといいかも。



Blue Taste Theme created by Jabox