サーバは複数のクライアントから利用されるため、サーバが提供するサービスの停止は多くのクライアントのユーザの作業に影響します。サーバが停止する原因は、ハードウェアの故障やソフトウェア上の不具合等、様々なケースが考えられますが、通常サーバでは、ハードウェアの障害が発生した場合に、サーバが継続して動作できるように様々な工夫が施されています。
350シリーズ以上のHP ProLiantサーバは、サーバを構成するコンポーネントを多重化することで、単一のコンポーネントに障害が発生しても、継続して動作できるように設計されています。また、障害発生後の復旧に関しても、コンポーネントのホットプラグ機能により、OSを停止させずに正常なコンポーネントへ交換できます。さらに、一部のコンポーネントは自己監視機能を備えていますので、専用のデバイスドライバと連携して、致命的な障害が発生する前にその予兆を管理者へ通知することができます。
以下に、HP ProLiantサーバで提供される耐障害性向上機能を紹介します。(一部の機種でのみサポートされている機能もありますので、各機能の対応については、HP
ProLiantサーバ製品ホームページの製品仕様をご確認ください。)
- ASR(自動サーバ復旧)
ハードウェアやソフトウェア(OS)に重大なエラーが発生したときに、HP ProLiantサーバを自動的に再起動するハードウェアベースの機能です。現行のHP ProLiantサーバでは、ASRはiLOの機能として実装されているため、ProLiant Support PackでインストールされるiLO Advanced Server Management Controller
Driver(ヘルスドライバ)と連携して動作することでASRの全機能が利用できるようになります。ASRの主な機能は以下の通りです。
- サーバ内部の高温状態の復旧
- プロセッサボード障害の復旧
- Insightマネジメントエージェントを利用して、管理者にサーバの復旧完了の通知
- ファン障害時に強制シャットダウンを行い、コンポーネントを保護
| ※ |
ASRは、HP ProLiant 100シリーズを除く現行のHP ProLiantサーバでサポートされています。 |
- リダンダントファン
リダンダントファンは、複数のファンにより冷却を確実に行う機能です。リダンダント構成のファンが1つ故障した場合でも、システムを即座に停止する必要はありません。一部の機種では、ホットプラグ対応のリダンダントファンが実装されており、システムを停止せず故障したファンを交換する事が可能となっています。
- リダンダントパワーサプライ
リダンダントパワーサプライは、正常稼動時は各パワーサプライで負荷分散を行って稼動します。1つのパワーサプライに障害が発生すると正常に動作する残りのパワーサプライで、サーバの稼動を継続させます。ホットプラグ対応リダンダントパワーサプライの場合は、サーバを稼動させた状態で、障害の発生したパワーサプライを交換することができます。
- ネットワークチーミング
ネットワークアダプタを複数まとめてチームとして設定することで、コントローラ、ケーブル、およびスイッチやハブのポートなどの故障時に、チーム内の正常なネットワークアダプタに自動的に処理が引き継がれるようにします。
詳細は、「2.3.2. HP ProLiantサーバのメリット・その2 ― 高性能なデバイスドライバ」の「ネットワークの可用性を向上 − ネットワークチーミング」を御覧ください。
- Smartアレイコントローラ(ハードウェアRAID)
SmartアレイコントローラによるハードウェアRAIDと、ホットプラグ対応ユニバーサルディスクの組み合わせにより、ハードディスクの障害からデータを守ります。フォールトトレランスを提供するRAIDレベルを選択してある場合、システムの稼働中に故障したハードディスクの交換を行うことが可能になります。故障したハードディスクの代わりに新しい交換用のハードディスクを挿入すると直ぐにRAIDの再構築が自動的に行われます。また、オプションのバッテリバックアップ付きキャッシュメモリを追加すると、不慮の電源障害時に、キャッシュメモリの内容をバッテリにより保持することで、未書き込みデータの損失を防ぎ、データの不整合を回避できます。
- アドバンストメモリプロテクション
HP ProLiantサーバで採用されているメモリでは、アドバンストECCが標準で採用されており、上位の機種では、オンラインスペアメモリやミラーメモリといった、より高い信頼性を提供するアドバンストメモリプロテクション技術が実装されています。(アドバンストメモリプロテクションについては、「1.2.4. HP ProLiantサーバのハードウェア・その4 ― メモリ」の「アドバンストメモリプロテクション」を御覧ください。)
また、一部の機種で提供されているホットプラグメモリ機能により、サーバの可用性が向上します。複数搭載されている各メモリバンクはホットプラグ可能なメモリボードになっており、サーバの稼動中にメモリの交換や追加(ホットアド)が可能です。(ホットアドの機能を使うには、OSがメモリのホットアド機能に対応している必要があります。)
|