SSブログ

RAIDアレイリビルド中・・・ [コンピュータ]

 自宅のNAS(Thecus N4100PRO)からこんなお手紙を頂きました。

Hard Disk 2 on n4100pro has an I/O error. This hard disk might have bad sectors on it. Please replace the hard disk as soon as possible.


 ふーんと思いつつ放置していたところ、メールが毎日くるようになり、NASの管理画面を見てみると「ペンディングのセクター」というのが20ほどカウントアップしていました。ペンディングセクタ(pending sector)とは壊れてるかもしれない・壊れるかもしれない危ないセクタのこと。

 HDDは読み込みが失敗したけれど、リトライやヘッドの調整を繰り返して何とか読み込めたギリギリセーフなセクタを経験すると、そのセクターをリフレッシュ(同じデータを書き込む)すると共に、データを他のセクタにバックアップし、セクタ番号をリストに登録します。そして次にそのセクターを読む機会が訪れたとき、普通に読み込めれば容疑は晴れ普通のセクターの戻ります。しかし再度読み込みに手こずったり、読み込みに失敗した場合は見事「不良セクタ」(bad sector)に出世し、そのセクタを使用禁止にします。このとき、データは以前バックアップしているので失われません。HDDって実はかなり頭がいいんですね。

 話を戻しますと、そのペンディングセクタが増加していると言うことは、何らかの原因で読み込みエラーが多発してしまっているということです。もっと簡単に言うと、HDDが壊れかけているってこと。潜在的なエラーをみるためにスキャンをかけたところ、なんと不良セクタが200カ所以上!!

 すぐにHDDを交換しなくちゃ!と思いがちですが、RAID5のリビルドはかなりの危険を伴います。残りのHDDにフルアクセスし、全てのデータを読み取り再構築を行うわけですから、HDDに負担はかかるし、眠っていたエラーを起こしてしまう事になりかねません。半年ほどまえ、某NTT Data が HDD6台で構成されたRAID5アレイを壊して、バックアップもまともに機能していなかったために、ユーザーが書き込んだ5年分全ての blogデータを損失してしまったという事故がありました。いまどき信じがたいずさんな運用です。でも専門のシステムエンジニアですらRAID5の危険性を十分に理解していない事が少なかったりします。

 バックアップを取っていない我が家では、リビルドの失敗は「即死」を意味します。慎重に行わなくてはなりません。まず残りのHDDのベリファイとセクタスキャンを行い、正常性を確認します。特に問題なかったのでディスクを交換。新しいディスクのスキャンを行い、リビルドを実行。ドキドキです。

 でこのリビルド。非常に時間がかかることは知っていますが、本当に遅い・・・。開始から30時間たっているのに40%しか終わっていません。しかも管理画面には「あと2万分」(約2週間)とかでてるし・・・。

おお、こわいこわい。
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:パソコン・インターネット

nice! 0

コメント 0

コメントを書く

お名前:[必須]
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。

Facebook コメント

トラックバック 0

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。