東芝の半導体設計基盤における運用実績から
ブレードを中核としたHP ProLiantのサーバ群を採用
 |
 |
東芝ソリューション株式会社
プラットフォーム
ソリューション事業部
東芝グループソリューション部
セミコングループ担当
参事
増本 浩文 氏 |
 |
 |
| イメージ写真 |
 |
|
セミコンダクター社のDFMシステムのハードウェア基盤を構成しているのが、HPのHP BladeSystemを中核としたHP ProLiantのサーバ群である。
鈴木氏は「もともとHPとは長い付き合いがあり、ハードウェアの高い品質や充実したサポート体制、発注から短期間での納品など、あらゆる面で信頼をおいてきました」と、その選択の理由を語る。
数年前から、EDA(Electronic Design Automation:電子回路設計の自動化ツール)の分野では、Linux対応への流れが顕著なものとなっており、設計現場に急速に浸透してきている。HPはこのニーズの変化を最も早い時期からキャッチアップしてきた。
事実、HP BladeSystemを中核としたHP ProLiantは、EDA分野の業界標準サーバとしての地位を確立している。また、Linux搭載x86プラットフォームでも、多くのEDA分野のISVにおいて評価検証機種として採用されている。これにより、2007年のx86ハイパフォーマンスコンピューティング国内市場において、HPは39.0%のシェアで第1位(出典:IDC
Japan, 5/2008 「国内ハイパフォーマンスコンピューティング市場2007年の分析と2008年〜2012年の予測」[J8010105])となった。
セミコンダクター社は、こうしたEDA分野の専門ノウハウを持つHPのプラットフォームを長年にわたって導入・運用しており、その延長線上で大規模なDFMシステムを構築することになったわけだ。
半導体の製造プロセスに目を向けると、メーカーには半導体デバイスの高密度集積化による生産歩留まりの低下を防ぎ、1枚のウェハからより多くのチップを得ることが求められる。そこで、製造プロセスを考慮した設計すなわちDFMが重要な役割を担うのである。
その処理には膨大なデータの高速処理が要求される。セミコンダクター社のDFMシステムでは、HP BladeSystemによって高密度に実装された大量のプロセッサのコア上で同時並行的に計算処理を行うHPCC(High
Performance Cluster Computing)によって、必要とするパフォーマンスを確保するという方法をとっている。しかしながら、先に述べた半導体の製造プロセスの微細化および高密度集積化が進めば進むほど、設計における計算量は爆発的に増えていき、より多くのプロセッサのコアを必要とすることになる。
このため、「ほぼ1〜2年ごとに世代を重ね、処理能力を数倍に高めながら、DFMシステムの増強を図ってきました」と鈴木氏は言う。今回構築され、2008年2月に本格始動を開始したDFMシステムは、先に述べた43nmプロセスのNAND型フラッシュメモリの量産垂直立ち上げに対応するもので、4世代目にあたる。
クラスタ管理ユーティリティHP-CMUを活用し高度なシステム管理基盤を構築
今回のDFMシステム構築プロジェクトでは、HPがハードウェア(HP ProLiant、HP BladeSystem)ならびに管理系ソフトウェアを提供。一方で東芝ソリューションが半導体設計に関する豊富なノウハウに基づいてシステムインテグレーションを行うという役割分担と緊密な連携がとられた。
また、東芝ソリューションとHPは共同で、「HP-CMU(HPCluster Management Utility)」を利用したリモート管理とネットワーク関連のシステム構築にもあたった。HP-CMUとは、多数のLinuxサーバを効率的に構築・運用・監視するためのクラスタ管理ユーティリティ(ソフトウェア)である。
昨今、より大規模なHPCクラスタの普及にともない、多数のサーバの監視や設定変更、ソフトウェアインストール、障害時のシステム復旧など、さまざまな運用コストの増大に対応するため、専用の管理ソフトウェアの利用は必須条件となっている。HP-CMUは、HPC
クラスタ用に最適化された機能により、LinuxやHPCクラスタの経験が少ない管理者でもシンプルなGUIで簡単に操作することができる。一方で経験のある管理者は、使い慣れたコマンドラインからHPCクラスタを効率的に管理できる。こうして安定稼動のための日常的な監視を可能とするのだ。
東芝ソリューションプラットフォームソリューション事業部東芝グループソリューション部セミコングループ担当参事の増本浩文氏は、このHP-CMUを次のように評価する。
「システムインテグレーションを担当する当社は、セミコンダクター社に対して、その時点で最も優れたソリューションを提案する義務があります。大量のコンピュータのコアが正常に機能しているかどうかを人間が1つ1つ手作業でチェックし、管理するのは現実的に不可能であり、直観的に操作できるユーザーインタフェースを備えた高い管理性を重視してHP-CMUを選択しました。特に高く評価したのは、DFMシステムを構成するさまざまなハードウェアにトラブルが起きた際に、その状況を即座に把握してメンテナンスにつなげ、ダウンタイムを極小化できることです。このHP-CMUと高い親和性を持っているという観点から、ブレードサーバを含めたHPのハードウェアが最良であると判断しました」
具体的にHP-CMUは、次のような機能を提供する。
・運用管理機能
日々の運用管理における、複数の演算ノードに対するファイル操作・編集、コマンド発行、ブート、シャットダウン、リブートや電源のオン/オフなどの処理を一括で実行する。また、目的のノードアイコンをクリックするだけで、そのノードに簡単にログインすることが可能。
・クローン機能
初期の構築時や増設時に簡単なマウス操作により、1台の演算ノードのシステムディスクを他のノードに複製することが可能。また、クローンイメージとして管理ノードに保管しておくことにより、演算ノードのディスク障害時にも簡単に復元できる。HP-CMUは、実際に1000ノード以上のクラスタ構築にも使われている。
・モニタ機能
各演算ノードの負荷状況などさまざまなモニタ項目を、グラフや表で一覧できる。また、しきい値の設定により、異常時などに分かりやすく警告表示する。これにより管理者は、サーバを個別に調べる必要はなく、クラスタ全体を1つのシステムとして視覚的に把握することが可能となる。 |