まず、高信頼性システムの基本となるのが、ハードウェアの信頼性です。HPでは様々な側面から信頼性向上に取り組んでいます。稼動条件に十分な余裕を持たせたシステムデザインを採用している点や、厳しい品質要求を満たすコンポーネント・サプライヤの選択や、ASICやCPUジャンクションの温度を適正に維持する大容量冷却ファンの採用なども、信頼性に大きな貢献を果たしています。
また、いくら信頼性の高いコンポーネントを使用しても、全く故障を起こさないということはあり得ません。ここで重要になるのが、障害発生時にどのように対処するのか、つまり耐障害性の実装です。HP Integrity サーバでは、電源モジュールや冷却ファンなど、物理的に冗長化しておくことによって一つのコンポーネントに障害が発生しても運用が継続できるような構成が可能です。また、障害発生後もオンラインで追加・交換が可能であり、システム停止時間を極力減らしています。また、CPUキャッシュやデータバスなどにおける ECC保護や、メモリのチップスペア機能などにより、内部的なシングルビット、およびマルチビットのデータエラー発生の際にも運用を継続することが可能です。 |