Jump to content 日本-日本語
日本HPホーム 製品 & サービス サポート & ドライバー ソリューション ご購入方法
≫  お問い合わせ
日本HPホーム
製品とサービス  >  ソフトウェアとOS  >  HP- UX Developer Edge

「コストの裏にはバリューがある」
―HP Integrityサーバに隠された価値

HP-UX/Integrityサーバー お問い合せ
コンテンツに進む
「コストの裏にはバリューがある」―HP Integrityサーバに隠された価値
HP Integrityサーバの最大の特徴は、高可用性や高信頼性といったカタログ・スペックには表れにくい高い潜在能力にある。今回、米国HPでハイエンド・サーバの開発を統括するグレッグ・ハフ(Greg Huff)氏にインタビューする機会を得た。同氏が語るのは、カタログや製品仕様の背後に隠されたHP Integrityサーバの本当の“バリュー”だ。
「コストの裏にはバリューがある」―HP Integrityサーバに隠された価値
HP sx1000チップセットが生まれた理由
サーバ・コンソリデーションがもたらすバリュー
2004年9月
テクニカルライター 吉川和巳

HP sx1000チップセットが生まれた理由


HP Integrityサーバを一般的なx86サーバと比べたとき、気づく点がひとつある。それは、高可用性や高信頼性といったカタログ・スペックには表れにくい能力を高めるために、目に見えない多くの労力を費やしていることだ。たとえば、同サーバのハイエンド/ミッドレンジ・モデルで採用されているHP sx1000チップセットの構成図を見てみよう。

  図1:HP sx1000チップセットの構成
図1:HP sx1000チップセットの構成
 
  インタビューに答える
グレッグ・ハフ氏
このsx1000チップセットは、Intel® Itanium®プロセッサやメインメモリ、PCIバスなどのすべてを統括する役割を担う。この図だけを見れば、インテルが提供する標準のItanium対応チップセットとの大きな違いはない。では、なぜHPは、チップセットの自社開発に多大な投資を行う必要があったのだろうか。

ハフ氏によると、図1の構成図の中に、10数か所にわたって高可用性のためのメカニズムが組み込んでいるということだ。それらの中には、HP独自の技術や特許技術も数多く含まれる。たとえばsx1000チップセットでは、プロセッサー・バスやI/Oバス、クロスバー・リンク、メモリのアドレス・バスや制御バスがすべてECCもしくはパリティによって保護されている。

とりわけ目を引くのが、sx1000チップセットによるメモリやプロセッサーの耐障害性機能である。たとえば、障害の発生したプロセッサーを瞬時に切り離しスペアと交換するDPR(Dynamic Processor Resilience)や、シングルビット・エラーが多発したメモリを自動的に交換するDMR(Dynamic Memory Resilience)を実装する。さらには、1ワードのデータを1ビット単位で分割し、すべてを別々のメモリチップに分散させることでメモリ障害の確率を2桁以上改善する「メモリチップスペア」機能を実装している。

HPによるsx1000 チップセットの自社開発は、こうした徹底した高可用性のためのメカニズムを実装するために避けられない選択であったわけだ。ちなみに、DPRやDMR、チップスペアは、Integrityサーバの全モデルでサポートされている。

半導体物理からエア・フローまでを検証


とはいえ、他社のローコストなサーバやx86サーバを扱っているITエンジニアからすれば、これらの仕掛けはいささか大げさのようにも見えるかもしれない。メモリやプロセッサーが壊れることなど本当にあるのだろうか? DPRやDMRは、ある意味マーケティング的なシンボルに過ぎないのではないか? といった見方もあるだろう。実のところ、メジャーな商用UNIXサーバでさえ、これらに相当するメカニズムをまったく搭載しないものが少なくないのだ。

だがハフ氏は、「HPではコンポーネントの故障率について独自の計算モデルを持っており、(高可用性機能は)そうした厳密な統計に基づくものだ」と説明する。「たとえばキャッシュ・メモリのソフト・エラーの発生確率は、メモリチップの設計をはじめ、個々のメモリ・セルのサイズ、動作電圧をベースに計算する。具体的には、(大気圏外から降り注ぐ)アルファ線が個々のセルに当たる確率や、当たった場合に影響を受けるセル上の半径、セルの酸化膜の厚さ、そしてアルファ線で生じる絶縁破壊電圧と動作電圧の差など、半導体物理レベルの検証を行う。その一方で、ソフト・エラーの確率は動作温度に比例して上昇するので、Integrityサーバ内部のエア・フローや動作温度も考慮に入れる。HPには、そうしたすべての検証を行うためのチームが揃っている」(同氏)

 
半導体物理からエア・フローまでを検証
 
事実、HP社内の統計データによれば、一般的なITシステムにおける障害のおよそ50%は、メインメモリもしくはキャッシュ・メモリのエラーが原因であるという。こうした科学的事実をふまえれば、sx1000チップセットによる幾重ものECC保護や障害対策は、メインフレームを代替するようなミッションクリティカル用途ではむしろ必然と言えるだろう。ハフ氏が言うとおり、コストの裏にはバリューがあるのである。
トップへ     次のページへ

本ページの内容は執筆時の情報に基づいており、異なる場合があります。

お問い合わせ

ご購入前のお問い合わせ


ご購入後のお問い合わせ

オンラインサポート
製品の標準保証でご利用いただける無償のサービスです。

ショールーム

ショールーム 導入をご検討のお客様へ
業務アプリケーションの継続・標準化・開発性とシステム担当者様、システム開発者様が抱える悩み・疑問に対する解決策実体験して頂けます。
印刷用画面へ
プライバシー ご利用条件・免責事項 ウェブマスターに連絡