RAIDコントローラが故障した際の復旧方法

RAIDコントローラが故障した際の復旧方法

RAIDを構成しているファイルサーバーが起動しない・データにアクセスができなくなった等、RAIDコントローラが故障してしまったことによってトラブルが発生することがあります。RAIDを構成しているNASやファイルサーバーは会社や学校、家などでデータを共有する場所やバックアップ要素で運用していることが多いもので、一旦、トラブルが生じると一人だけでなく複数の人に影響が出てしまうことも懸念されます。ここでは、RAIDコントローラが故障した際に生じる症状や考えられる原因、復旧方法を紹介していきます。

RAIDとは

RAIDとは、複数のHDD(ハードディスク)やSSDを組み合わせによって1つのドライブのように認識できる・表示が可能になる技術のことです。正式名称はRedundant Array of Inexpensive Disks(リダンダント・アレイ・オブ・インエクスペンシブ・ディスクズ)で略してRAID(レイド)と呼ばれています。管理者がNAS(ネットワークHDD)やサーバーにRAID構成の設定を行うと機器の内部でパリティが生成されてRAIDが構築されます。パリティとは、データを記録/受け渡しを行う際に誤りを感知/訂正ができるように算出される符号のことで自動生成されるものです。RAIDを導入するメリットは①RAIDの種類・モードによってHDD(ハードディスク)やSSDが故障してしまってもデータの復旧やデータへのアクセスが可能になる点②データの書き込み/アクセスなどの処理の高速化が見込める点③データを記録できる量を増やすことが出来る点が挙げられます。

RAIDコントローラとは

RAIDコントローラとは、複数のHDDやSSDなどの記録媒体を束ねて仮想的に1つのドライブ/1つの装置のように運用・制御を行うディスクアレイ/RAIDシステムのことでディスクおよびデータの管理を行っています。RAIDコントローラは別名アレイコントローラとも呼ばれています。

問い合わせ

RAIDコントローラの故障によって生じる症状

  1. NASやサーバーなどの起動ができなくなる
  2. HDDの認識ができなくなる
  3. RAID構成情報の損傷
  4. ハードディスクの故障
  5. HDDの誤動作
  6. RAID構成情報の初期化

1.NASやサーバーなどの起動ができなくなる

RAIDコントローラはRAID機能の構成/運用/制御を行っている部品のため、この部品が故障してしまうとNASやファイルサーバーなどRAIDを構成している機器が起動できなくなってしまいます。

2.HDDの認識ができなくなる

RAIDコントローラが故障してしまうとRAIDを構成しているHDDと通信ができなくなり、結果、認識できなくなってしまいます。

3.RAID構成情報の損傷

RAID構成情報はRAIDコントローラ内のメモリやRAIDを構成しているハードディスク内に保存されています。RAIDコントローラが故障してしまうとRAID構成情報が損傷してしまうことに繋がってしまいます。

・HDDにRAID構成情報が保存される理由

構成情報がRAIDコントローラ内にのみ保存される仕様だった場合、コントローラが故障してしまった時に安全に部品の交換ができなくなってしまいます。そのため、構成情報はコントローラだけではなくハードディスク内にも保存されRAID構成やHDD構成の変化の検出と正誤チェックが可能となり、正しい情報でRAIDアレイの構築ができるようになります。

4.ハードディスクの故障

RAIDに関する障害やトラブルが発生してしまう原因の多くはハードディスクの故障によるものです。RAIDを構成しているハードディスクが故障してしまうと中のデータへのアクセスができなくなる・データが無くなってしまう・データが消えてしまうことが起こりえます。HDDは記録面(プラッター)の磁力が低下するとデータの読み込みができない/書き込みができないといったトラブルが生じるセクター不良の発生へと繋がります。セクター不良が発生した結果、RAIDコントローラはディスクの損傷があると認識し、通信エラーやディスクとNASやファイルサーバーとの接触異常が生じることにも繋がります。

5.HDDの誤動作

誤動作などによってRAIDの切り替えが正常にできないといったトラブルが発生することもあります。

6.RAID構成情報の初期化

上記のように誤動作によってRAIDの正しい切り替えができなかった状態のまま再起動が行われRAID構成情報が初期化されてしまうケースもあります。初期化されてしまうと何もデータが入っていない状態に戻ってしまいます。

RAIDコントローラが故障してしまう原因

  1. 経年劣化
  2. 異物の付着
  3. 衝撃
  4. 熱暴走

1.経年劣化

長い期間、使っている場合など経年劣化によって壊れてしまうことがあります。

2.異物の付着

ホコリや塵、タバコの煙などの異物/微粒な粒子が付着してしまうことによって不具合や異常が発生してしまうケースもありえます。機器にホコリや塵などが積もらないように日頃から定期的に掃除を行うことも重要なことです。

3.衝撃

引っ越しや模様替え等で機器を移動させる際には衝撃が加わらないように注意しましょう。

4.熱暴走

室内が高温となってしまわないようにも気をつけましょう。特に猛暑日などで室内に冷房が入らない環境下の場合、トラブル発生のリスクが高まってしまいます。

問い合わせ

RAIDコントローラの故障が起きた際に注意したいこと

  1. 電源の入り切り/再起動を繰り返す
  2. リビルド/データの再構築
  3. HDDの交換/順番の入れ替え
  4. HDDを取り外して単体で接続
  5. RAIDコントローラカードの交換

1.電源の入り切り/再起動を繰り返す

トラブルや症状が発生している際には電源の入り切りを繰り返す/再起動を何度も繰り返すなどの動作は避けておいた方が良いものです。状態や状況が悪化してしまうケースも多いためです。

2.リビルド/データの再構築

リビルドとは、故障したHDD内のデータを再構築(リビルド)する作業の事を指します。リビルド(再構築)をおこなうことで下記の症状が生じてしまうリスクが高まります。
①壊れたディスクが1本から複数本に増えてしまう
②データの再構築に失敗してしまった際には状態や状況が悪化してしまう
③ディスクが壊れてしまった際に構成情報やデータの再構築、再設定を行ってしまうとデータが消える/無くなる/初期化されてしまう

3.HDDの交換/順番の入れ替え

RAIDは、複数のHDDやSSDを1つのドライブのように認識できる技術のことでディスク上にデータを書き込む際にも規則性があります。そのため、HDDの交換/入れ替えを行った場合に順番を間違える・元の位置と違う位置に入れてしまう等のミスをしてしまうとシステムや書き込みの規則性が乱れてしまいデータが破損してしまいます。その状態で運用を続けるとデータが破損した状態で上書きが進んでしまいます。上書きが進むとデータの復旧が難しくなってしまうケースも起こりえます。トラブルが発生した際には慌ててしまうことも多いものです。まずは深呼吸をして電源を切りましょう。

4.HDDを取り外して単体で接続

NASやファイルサーバー等からディスクを取り出して単体でPCに繋いでもデータへアクセスはできません。アクセスができないだけではなく、ディスク内のシステムやデータが破損してしまうリスクもあります。また、PCに繋ぐと「フォーマットしますか?」とメッセージが出る事もあり、「はい」を押さないように気をつけましょう。誤ってフォーマットしてしまうとデータが消えてなくなってしまいます。フォーマットしてしまうと取り出したディスクを元の位置に戻しても構成情報も消えてしまっているためデータの読み込みもできなくなってしまいます。

↓フォーマットしますか?とメッセージが出た際の解決方法はこちら

5.RAIDコントローラカードの交換

コントローラカードに不具合や故障が発生してしまったことによってディスクが認識できなくなってしまった/アクセスができない状況となった時には注意が必要です。コントローラカードは特殊なものが多く互換性のあるものを探す事やコントローラカード自体の確認、交換には専門知識も必要となります。万が一、互換性の無いコントローラカードに交換、RAIDの再構築を行ってしまった際にはデータの規則性が乱れます。結果、データにアクセスができなくなるだけでなく、データの復旧自体も難しくなるケースもあるため、コントローラカードの交換は避けておいた方が良い作業となります。

RAIDコントローラ故障の特定と復旧方法

・故障の特定と障害状況を確認

RAIDコントローラが故障してしまったことが懸念される場合、下記を確認しましょう。
①BIOSのブートオプション→RAIDのBIOSが表示されない/RAIDアレイが表示されない場合にはコントローラが壊れてしまっていると考えましょう。
②マザーボードが壊れた際にも①と同じ現象が起きます。マザーボードが壊れることはまれですが、同様の状況が起きる為、注意が必要です。
③コントローラには付属でRAID構成ユーティリティがついているため、ユーティリティを確認しましょう。HDDが1本、壊れている時には「劣化」、RAID構成が機能していない/止まっている時には「非アクティブ」等で表示が出ます。
④CPUやメモリなどの部品が壊れてしまっている時には電源が入らない/電源を入れた際にピーピー音が鳴る等、①~③とは違う現象が起こります。

・RAIDコントローラ故障の復旧方法

不具合の原因がコントローラにあると特定できた場合、壊れたコントローラカードを正常に動作するカードへ交換を行う事は復旧が見込める方法の一つです。しかしながら、コントローラカードの交換には下記の様な懸念点があります。
①互換性のあるコントローラカードの入手自体が難しい
②コントローラカードの交換作業には専門知識が必要
③クリーンルームなどの環境下での作業が好ましい
④全てのコントローラが構成情報をディスク内に保存しているわけではない(保存の有無が不明な場合も有り)
⑤コントローラに不具合が生じた際に構成情報も破損してしまっている事もありえる
⑥コントローラだけではなく障害が発生した際の原因の特定自体が難しい
⑦カードの設定を変更する際にはデータが無くなる/消えてしまう危険性がある
⑧RAID障害が発生した際の復旧には高度な技術力が必要になる
等が挙げられます。
データが大事な方は無理に作業を進めずに専門の復旧業者に相談することを優先しましょう。プロに任せた方が失敗も無く、余計な部品を買ってしまうことや状態を悪化させることなくデータの救出が可能となります。

問い合わせ

まとめ・それでも困った時は余計なことをせずに復旧会社へ

NASやファイルサーバーなどの起動ができない・中に入れているHDDの認識ができないなどRAIDコントローラの故障が疑われる際には機器の使用を一旦止めてプロの復旧業者に相談することを優先しましょう。トラブルが発生している時に無理に作業を進めてしまうと状況が悪化してしまい、データが失われてしまうリスクも高まります。RAID障害によって生じた症状の対応やデータの復旧作業には高度な技術力も必要となる為、技術力のある業者を選ぶ事も大事なことです。業者を探す時にはAI技術を持っているかをチェックしましょう。技術力の高い業者かを判別することができます。アドバンスデータ復旧はAI技術を持っており、RAIDトラブルに関する復旧や機器の修理も数多く実績があります。万が一、困った際にはお問い合わせください。相談も無料です。

NAS、サーバカテゴリの最新記事

アドバンスデータ復旧
/* Schema.org追加 */