DELL製PERC 4e/DCで自動リビルドが走った

以前、DELL製RAIDカードでのRAID設定方法 という記事を書いたが、その端末でリビルドが走ったため、その時の流れをメモ。

環境

 

状況

1.ビープ音発生

サーバーよりビープ音が発生。サーバーを停止させると音が消えた。イベントログには何も残っておらず。

2.PERC BIOS Configuration Utilityの確認

サーバーのランプを確認したところ、緑色であるが点滅していることに気づく。
サーバーを起動し、Ctrl + M にて、PERC BIOS Configuration Utilityを起動、RAIDの状況を確認。

 
Objectsより、以下の内容を確認。

  • Adapter
    • 異常は見受けられず。
  • Logical Drive
    • 「View/Update Prameters」より、Stat:DEGRADEDになっていることを確認。
  • Physical Drive
    • ドライブ状況を見ると、今までRAIDを組んでいたドライブのうち、片方が「READY」に。
    • 「View Drive Infomation」にて確認すると、「Other Errors」が "1" になっていた。


エラーの意味は、

BIOS 設定ユーティリティの Media Error and Other Error(メディアエラーとその他のエラー)オプションを表示するには、Objects(オブジェクト)―> Physical Drive(物理ドライブ)メニューで物理ドライブを選択したあと、を押します。
Media Error(メディアエラー)とは、データ転送時に発生するエラーです。
その他のエラーとは、デバイス故障、誤ったケーブル接続、ターミネータの不良、信号ロスなどにより、ハードウェアレベルで発生したエラーです。


Dell PowerEdge 拡張 RAID コントローラ 4/SC、4/DC および 4e/DC ユーザーズガイド - トラブルの解決 その他の起こりうる問題

とのことで、原因として一番可能性があるのはディスク障害の模様。

 
別のサポートページには、

確認されたエラー内容(Media ErrorおよびOther Error)は、お手数ですが弊社テクニカルサポートへご連絡頂きますようお願いいたします。


Dell サポート - LSI PERC BIOSユーティリティ上でのエラー確認方法 - JPFAQ_195190

とのことだが、サポート期間が過ぎていたので、どうしようもなく。

 
また、ホットスペアのうちの一つが「REBUILD」になっていたため、「View Rebuild Progress」にて確認すると、リビルド中の模様。

 
以上より、何らかの原因でRAID1のうちの一つのディスクが壊れ、リビルド中であることがわかった。

 
リビルド中であれば何もできることがないため、ひたすら待つ。ただ、ビープ音がうるさいため、以下の手順で一時的に消音しておく。

Objects > Adapter > AlarmControl > 「Silent Alarm」


なお、Enabled/Disableとの違いについては、正直、よくわからず。DELLの別のところでは、以下の様な説明があった。

Silence Alarmは、一時的なスイッチとして機能します。アラームからブザー音が出ているときに、アラームを停止させます。アラームからブザー音が出ていないときは、機能しません。


Dell PowerEdge Expandable RAID コントローラ (PERC) Console Plus ガイド - Alarm Control(警告音制御)

 

3.リビルド後

まずはAlarmControlが「Enable」となっていることを確認(Silentの場合、終了後には自動的にEnableになっていた模様)。

RAIDのステータスが元に戻り、ビープ音も消えたため、Windowsを起動。

 

エラーに関する資料

メディアエラーについて調べてみたが、PERC 4e/DCについての資料は見当たらず。

PERC2では、

The error count displays at the bottom of the properties screen. If you feel that the number of errors is excessive, you should probably format the disk drive. If more than 32 media errors were detected, PERC 2/DC automatically puts the drive in FAIL state. This occurs even in a degraded RAID set. The errors are displayed as they occur. In cases such as this, formatting the drive can clear up the problem.


PERC 2/DC BIOS Configuration Utility: Dell™ PowerEdge™ Expandable RAID Controller 2/DC User's Guide - Formatting Physical Drives

とのことで、32以上であればFAILにするように見えたが、PERC4e/DCではそうでは無さそう(実際のところ、手元のサーバーは32以上になっていた)。