LANDISKによるネットワークストレージ構築とトラブルシューティング

ホーム / Hardware

更新:08/02/12 | IOデータLanDisk(HDL4-G)によるネットワークストレージ構築 | Hardware

テラバイト級のNASソリューションが10万円を切る価格で一般家庭にも導入できる時代になりました。ネットワーク環境もギガビットイーサや802.11nといった高速な環境が整備されてきました。
あらゆるデータをNASに統合することで、データのメンテナンスとハードウェアトラブルとの切り分け、再利用の利便性アップに役立てることが出来ます。

テラバイトNAS

LANに直接接続できるNASののメリットとしては、次のようなメリット・用途が考えられます。

これに加えて、テラバイト級NASに見られる特長としては次のようなポイントが見られます。

これらの特長は、HDD容量が大きくなることによって耐障害性向上のために容量を避けるようになった。必然的に故障したHDDを交換できる製品が多くなった。と見ることが出来ます。

BUFFALOとIOデータ

手ごろな価格でテラバイト級NASを導入しようとすると、BUFFALOやIOデータが目に付きます。

バッファローのテラバイト級NASソリューション

IOデータのテラバイト級NASソリューション

個人的には、デザインやサイズを考えてIOデータのLanDisk(HDL4-G)を導入することにしました。価格も手ごろな2Gタイプを購入しました。

HDL4-Gの特長

IO-data LanDisk
HDL4-GはWindows、Mac対応を謳っており両方のプラットフォームからストレス無く接続することが出来ます。
Windowsからは\\Landiskなどとして接続を掛け、Macからはafs://landiskに接続を掛けるだけでDisk1という共有フォルダに接続することが可能です。

主に次のような特長があります。

  1. Raid5、又はストライピングに対応。4台中の1台が故障してもデータを維持することが可能。
  2. 24時間運用が可能。メーカーのQ&Aで謳われています。
  3. 温度センサーやHDDのヘルスチェックが可能。メールでの通知も可能。
  4. 非常に省スペース。

ただ、注意すべきポイントもあります。

  1. コントローラーが故障すると、モードに寄らずデータが全て失われる。
  2. Read/Write速度はそれほど速くない。
  3. ハードディスクの回転は休止するが、ファンは停止しない。
  4. Raid5などを使用すると、使用できる容量は実質3/4になる。

といったポイントです。
容量が大きいだけに、データが失われた際のダメージも大きいので、本当に重要なデータは更に異なるNASなどに定期的にバックアップすることをお勧めします。

ここで、RAIDについてまとめておきます。
RAID(レイド)=Redundant Arrays of Inexpensive
Disksは、1987年カリフォルニア大学バークリー校のDavid A.Patterson氏、Garth Gibson氏、Randy
Katz氏の3人によって提唱された外部記憶装置の耐障害性を意識したテクノロジーで、データを複数の外部記憶装置に分散して記録するため、高速化や継続運用性などの向上も期待できます。
実装方法にはご多分に漏れず、専用のハードウェアを使う方法とソフトウェアで実現する方法があります。

RAID 0: 耐故障性の無いディスクアレイ (ストライピング)

通常1系統の外部記憶装置を複数用意して同時に書き込みを行うため、見かけ上のアクセス速度が向上するものです。

長所:アクセス速度の向上。
短所:冗長性はない。

RAID 1: 二重化 (ミラーリング)

同じ内容を異なる外部記憶装置に書き込み・場合によっては読み込みを実施するため障害時に速やかに切り替えが可能です。

長所:コントローラの故障に対応する冗長構成が可能。
短所:見かけ上、半分以下の容量しか使用できない。

RAID 1+0、RAID 0+1といった組合わせも可能です。これによって、互いに速度と耐障害性を補完し合わせることが可能になりますが、最低4系統の外部記憶装置が必要で必要以上に冗長的になる場合も考えられます。

RAID 2: ビット単位での専用誤り訂正符号ドライブ (ECC)

ハミングコードによる強力なデータ修復が可能な形態です。RAID 2は外部記憶装置の信頼性を考えると実用性があまりなく、製品は市販されていないようです。
それほどまでに冗長性を高めたいのであれば、恐らく多数の外部記憶装置を用いたミラーリングを選択することが多いのではないでしょうか。

長所:全RAIDレベルの中で最高の耐障害性を持つ。
短所:ハミングコード計算コストが大きく、ビット格納に使われる容量も大きい。つまり効率が悪い。

RAID 3: ビット/バイト単位での専用パリティドライブ

RAID 2の誤り訂正符号を排他的論理和によるパリティに変更し、演算コストを低減したものです。RAID 2の廉価版と言ったところでしょうか。
現在は、RAID 5が選択されることが殆どのため、やはり製品としては入手不可能に近いようです。

RAID 4: ブロック単位での専用パリティドライブ

RAID 3のI/O単位をブロックに拡大し、I/O効率の改善を計ったものです。
RAID 3の改良版と言ったところでしょうか。
やはり、RAID 5が選択されることが殆どのため、やはり製品としては入手不可能に近いようです。

RAID 5:ブロック単位でのパリティ分散記録

複数の外部記憶装置に誤り訂正符号データと共に分散させて記録することで、RAID 3、RAID 4のボトルネックを回避したものです。

長所:パリティは均等に分散して格納されるため、RAID 3やRAID 4のようなパリティドライブがボトルネックとならない。
短所:読み出しは高速であるが書き込みは低速である。
2つ以上のドライブが同時に故障すると回復できない。
障害発生時の復元作業が遅い。

RAID 6:ブロック単位・複数パリティ分散記録

RAID 6はRAID 5の弱点である2台以上の外部記憶装置の故障に対応するため、パリティを2つ記録します。

と言うわけで、現在ではあまり使われなくなったRAID 2, 3,
4を除くとストライピング、ミラーリング、パリティ分散の概ね3手法に集約されているということになります。
ミラーリングは見かけ上使用できる容量が1/2以下になってしまうため、一般向けの製品での採用には向かないということになります。
そうなると、結果的に複数のドライブを一つに見せかけるストライピングか、耐障害性要素も兼ね備えたRAID 5を実装するというのは妥当ということが分かります。

テラバイト級の外部記憶装置が故障した場合、ダメージも甚大となる場合が多いため、1/4の容量を犠牲にしてもRAID 5を選択する場合の方が多いでしょう。
そこで、RAID 5についてもう少し掘り下げてみます。特に、LanDiskのRAID 5仕様を元に情報をまとめてみました。

注意すべき点:

・読み書き速度が遅くなる傾向がある。ある程度の覚悟は必要。
・2台以上の外部記憶装置の故障が発生するとデータを復旧できない。全てのデータが失われる。
・RAIDコントローラーが故障すると全てのデータが失われる。
・4/1以上の容量がパリティ用に犠牲(見かけ上、容量が減る)となる。

データが失われる場合に、一部ではなく全てが失われてしまう点に疑問を感じますが、そういう仕様になっていると考えるしか無さそうです。

障害時のシミュレーション

LanDiskは4台のHDDで構成されています。
これらのHDDの内、2台が同時期に故障する確率は低いように思われます。
ただ、HDD4台は密着した状態で併設されている訳で、熱や衝撃、水害(湿気)などの影響は同時に受けることになります。
そのため、数学的に「個々の障害率が独立している」とは一概に言えないのです。

・そのため、本当に重要なデータは全く異なる外部記憶装置に定期バックアップを取っておくことが必要です。

・最低でも週に1度はヘルスチェックが行われるように、スケジュールを登録しておきます。
・必ず、問題が見つかった際にはメールで通知をする設定にしておきます。

・万一、障害が発見された場合、基本的には直ちに仕様を中止します。
・代替ドライブを入手し、用意された手順に従って故障したHDDと交換をします。
・システムが失われたデータをパリティから復旧するのを待ちます。(この時、LanDiskはスタンドアローンで動作させる)
・データの復旧を確認して、運用再開。

RAID 5の耐障害性の最大のメリットは、全自動でリアルタイムに耐障害機能(パリティ)を付加できることです。
しかし、完全なバックアップではなくパリティを内包しているに過ぎません。
重要なデータは必ず別系統の外部記憶装置に待避することが最も重要ではないでしょうか。

・交換ドライブ

交換用に推奨されているドライブの主な諸元は次の通りです。
これ以外のドライブを利用すると、動作保証対象外となります。
HDI-SA500H7(2TBの場合)→大きいものを使ってもコントローラーで容量制限されます。
ディスク回転速度 7,200rpm
転送速度 Serial ATA II:300MB/s
使用温度範囲(℃) 5〜35
使用湿度範囲(%) 20〜80(結露なきこと)
保証期間 1年保証

ここで気になるのは、使用温度範囲(℃) 5〜35という部分です。
LanDiskの詳細設定から、動作状況を確認すると
筐体内温度 47℃
FAN 通常回転(タイミングによって高速回転)
と表示されています。47℃を超えると高速回転して冷却する仕様なのかも知れません。
つまり、通常回転で充分と判断されている温度が47℃とも判断されますが、その温度がHDDそのものの仕様温度範囲を大きく超えているのです。
このまま使用し続けると早期にHDDそのものに問題が発生するのではないかと想像されます。

また、LanDisk自体の使用環境条件を確認すると、
使用温度範囲(℃) 5〜35
使用湿度範囲(%) 10〜85(結露なきこと)
となっています。

因みに、IOデータの別シリーズLANDISK TERAでは35℃程度で24時間稼働している実績があるようです。
ただ、一般的にはHDDの動作保証温度は0〜55℃の範囲とされているようです。
そう考えると、47℃でも問題はないようにも思えます。
それでも、HDDのMTBFは一般的に35℃で40万時間、45℃で30万時間程度とされているため、寿命は3/4になっている見込みです。
しかし、ここでこの比例を否定するデータが現れました。
2007年02月19日 00時00分00秒のGigazine記事によると、「Googleの分析では、ハードディスクは温度や使用頻度に関係なく故障する」というのです。
Googleは言わずと知れた検索エンジンの第一人者であると同時に、大量の検索データを維持するために大規模な記憶装置を駆使するユーザーでもあります。
Googleは10万台以上の民生用ハードディスクドライブを使用した調査を行って、
・温度
・アクセス頻度
・S.M.A.R.Tの結果
と、故障の間に関係がないことを結論づけているとの事です。
例外として、ハードディスクの温度が50度を超えるような環境であれば、故障率は如実に上昇しているとの事で逆に50℃に達していなければ何度でも構わない共考えられます。
果たしてこの記事が偽り無いものか、実際の報告書を読んでみることにしました。
http://labs.google.com/papers/disk_failures.pdf

・HDDの信頼性

Googleの分析によれば、2年目以降故障率が4〜5倍程度増しているようです。
HDDメーカーが1年保証と言っているのはこの辺りの関連性があるのでしょうか。
重要なデータを保存するHDDであれば可能な限り、延長保証などには言っておいた方が良いと思われます。

アクセス頻度については、個人的には影響がないとは言えないように思えます。
使われなさすぎてもAFR(Annualized failure rates)が若干高くなるようです。
アクセス頻度が高い場合、最適な状態に比べて最大5倍程度の故障率に上がっているように見えます。

肝心な温度との相関関係ですが、意外に温度が低すぎても良くないようです。車に似ていますね。
最適なのは35℃〜45℃での動作時に見えます。
ただ、注意すべきは3年目以降のHDDにおける高温域です。
3年を過ぎると、突如として40℃異常での運用時に故障が発生するように見えます。
最小でも15%ほど、40℃以下での運用に比べて故障率が増すようです。
但し、個体差と比べるとあまり重要な差異ではないと見ることも出来そうです。

・速度と騒音について

読み書き速度は、パリティを制御するオーバーヘッド分だけ増すため遅くなる傾向にあります。
ただ、LanDiskの場合SerialATA II、流体軸受けのドライブを採用しているため、現実的なレベルで問題を最小限化しています。
気になる方もいるようですが、速度に問題があるとすればコントローラー部分のオーバーヘッドと思われます。

騒音について気になる方もいるようですが、現状の仕様では限界と思われます。
ストライピングにすれば、4台のHDDに同時書き込みをしなくなるので、騒音面からは有利と思われます。
また、ファンは自動制御されるため、冷所に設置すればファンの騒音をある程度押さえられるかも知れません。
HDDの自動停止設定は最短の10分間で運用することをお薦めします。

関連リンク

BUFFELOのHD-LANで手軽にNASソリューション

 
お勧めリンク
ダウンロード
ストリーミング関連
Macintosh関連
Windows関連
メディアなど
 
ハードウェア
ソフトウェア/サービス/開発SDK
デジタル一眼レフカメラ
テクニカル記事
趣味関連
ゲーム 〜楽しいゲームの紹介や攻略法
RoverMNI(ローバーミニ) 
雑記
その他
コメント・フィードバック
©1998 CNXGROUP. このページの全部あるいは一部を無断で利用(コピー)することを禁じます。
>