 |
≫ |
|
|
 |
 |
スケーラビリティの結果
|
 |
 |
 |
| |
| HPは、HP ProLiant DL585システムが多様なサーバ環境でどのように拡張できるかを示すために、いくつかの代表的な分野についてテストを実行しました。テストには、エンタープライズ
リソース プランニング アプリケーション(SAP® ソリューション等)、メッセージング(MMB3)、サーバベースコンピューティング、CPU処理(SPEC)、およびオンライントランザクション処理があります。 |
|
|
 |
 |
ここでは、プロセッサを追加した場合の効果を示す3つのテストの結果を説明します。具体的には、Two-tier SAP Sales and Distribution(SD)標準アプリケーション作業負荷、サーバベースコンピューティング(SBC)作業負荷、およびSPEC CPU 2000作業負荷です。
【SAP】 SAP SD作業負荷は、エンタープライズ リソース プランニングなどのアプリケーションを表したものです。テストは、どちらかといえばプロセッサおよびメモリ集中型で、I/O集中型ではありません。
テストで使用されたHP ProLiant DL585システムには4つのプロセッサボードが含まれています。3つ以下のプロセッサのパフォーマンスを調べるために、エンジニアはオペレーティングシステム(Microsoft®
Windows® Server 2003 Enterprise Edition)を使用してシステムで1、2、または3つのプロセッサのみを使用するように制限しました。テストは、合計で16GBのPC2100メモリを搭載した2.2GHzプロセッサを使用して実行されました。各テストでは、使われているプロセッサが1つか4つかに関わらず、16GBメモリを使用しました。それぞれの事例でNUMAメモリ構成を使用し4
、バンクインタリーブが使用可能でした。
プロセッサ数を2倍にすると、このSAP作業負荷のパフォーマンスは比例して増大しました。4-Wayシステムは、2-Wayシステムに比べてパフォーマンスが88パーセント高くなり、2-Wayシステムは単一プロセッサシステムに比べて85パーセント高くなりました。2.4GHzプロセッサを使用すると、同じようなすばらしいスケーラビリティが実現します。この結果は、CPUバウンドアプリケーションでHP
ProLiant DL585がほぼ完璧なリニアスケーリングを実現していて、それがAMD Opteron™ プロセッサの統合メモリコントローラと低レイテンシのインターコネクトによるものであることを示しています。
図3. SAP SD作業負荷を使用した1、2および4プロセッサでのプロセッサスケーリング
(2.2GHzプロセッサ、16GB PC2100メモリ) |
 |
 |
【サーバベースコンピューティング】
SBC環境でサポートされる最適ユーザー数を判断するために、4 GBのPC2100メモリを搭載した4P HP ProLiant DL585サーバを使用してMicrosoft®
Windows® Server 2003 Enterprise EditionとMicrosoft® Office
XPを実行しました。図4に、テスト環境を示します。すべての常駐クライアントアプリケーションは、ターミナルサービスを実行しているHP
ProLiant DL585サーバ上に常駐しており、サーバ上で実行されました。
| 図4. SBCテスト環境 |
 |
 |
2つのプロセッサを使用したテストと4つのプロセッサを使用したテストを実行しました。各テストでは、プロセッサボード間で4GBのメモリを均等に共有しました。2つのプロセッサのみを使用したテストでは、プロセッサボード3および4は物理的に分離されていて、ソフトウェアを使用してプロセッサを制限していません。
ターミナルサービス環境では、プロセッサ数を2倍にするとサーバがサポートできる「ヘビー」ユーザーが57パーセント増加しました(図5)。詳細なテスト結果で言及しているように、
5ターミナルサービスのシステムパフォーマンスを最適化するには、十分なメモリが必要不可欠になります。64ビット版Windows®
Server 2003のリリース時には、HP ProLiant DL585サーバは4GBの物理メモリに直接アドレス指定できるようになります。これによって、HP
ProLiant DL585サーバのパフォーマンスが大幅に増強されることになるはずです。
図5. HP ProLiant DL585サーバは、SBC環境でプロセッサの数を2倍にすると
パフォーマンスが50パーセント以上向上 |
 |
 |
【SPEC CPU 2000】
SPEC CPU 2000テスト6 は、整数コンポーネント(CINT2000 )
(英語)および浮動小数点コンポーネント(CFP2000 )
(英語)を含むCPU集中型のベンチマークセットです。テストされたすべてのモジュールでは、SuSE Linux Enterprise Server 8
for AMD64 SP3のオペレーティングシステムを実行しました。2-Wayシステムから4-Wayシステムへ変換するのに、プロセッサボードが物理的に追加されました。ノード毎のメモリ総数は、PC2700メモリで8GBと一定でした。SPECテストを使用した今までの調査では、メモリ総数がベンチマークスコア全体にそれほど影響しませんでした7 。従って、このテストはプロセッサ数を増やした場合の影響を評価するのに使用できます。
図6は、2-Wayから4-Wayシステムへ移行するとパフォーマンスが約87パーセント向上することを示しています。これは、SAP作業負荷の結果ですでに説明した、プロセッサ数を2倍にするとパフォーマンスが88パーセント改善したという内容と一致します。
図6. HP ProLiant DL585システムのプロセッサ数を増やした場合の
SPECint rate base 2000およびSPECfp rate base 2000の結果 |
 |
 |
|
 |
2-Tier SAP SD作業負荷およびMicrosoft® Exchange MAPI Messaging
Benchmark (MMB3)の2つのテストで、プロセッサ周波数の増加の影響を示しています。
【SAP】
このグループのSAPテストでは、HP ProLiant DL585サーバに2.2GHzまたは2.4GHzのプロセッサボードが4つ含まれていて、合計16GBのメモリを使用しています。正規化した結果では、プロセッサ周波数が9パーセント向上するとパフォーマンスが6パーセント向上したことがわかります(図7)。つまり、このアーキテクチャでは周波数が向上すると60パーセント以上のスケーラビリティが実現します。
図7. プロセッサ周波数が9パーセント向上すると
SAP SD作業負荷を
使用した
パフォーマンスが6パーセント向上 |
 |
 |
【MMB3】
Microsoft®では、一般的な企業の環境における単一サーバのメッセージングスループットを測定するために、MMB3作業負荷を設計しました(プロファイルはMedium
LoadSim Userと呼ばれています)。8 HPでは、MMB3結果を4-Way HP ProLiant DL585サーバで測定し、最初に2.2GHzプロセッサを使用し次に2.4GHzプロセッサを使用しました。いずれの構成でもMicrosoft®
Windows® Server 2003 Enterprise EditionおよびMicrosoft® Exchange
Server 2003 SP1を使用し、メモリは4GBで、秒あたりのメッセージ数は同一(6000 MMB3)です。
図8で示しているように、プロセッサ周波数が向上するとCPUの利用率が52パーセントから48パーセントに低下し、CPUの利用率が7パーセント変化しました。プロセッサ周波数の向上による変化は9パーセントのみだったので、このことは、統合メモリコントローラを搭載して外部フロントサイドバスを省いたことが、Micorosoft®
Exchangeなどのメモリの影響を受けやすいアプリケーションのパフォーマンス面で大きなメリットとなっていることを示しています。
このテストでは32ビットWindows®が直接アドレス指定できる4GBのRAMに制限されていたので、今後64ビット拡張を使用し、より大きなメモリサイズに直接アドレス指定ができるようになると、さらにパフォーマンス面の恩恵を受けることが期待されます。
図8. MMB3ベンチマークでは、CPU周波数が9パーセント向上すると、
それに比例してCPUの利用率が7パーセント低下(CPU利用率は低い方がよい) |
 |
 |
|
 |
一般的なオンライントランザクション処理(OLTP)負荷と4-Way HP ProLiant DL585サーバを使用していくつかのテストを行いました。OLTPベンチマークは、顧客履歴、嗜好、クレジットカード情報、保管番号、保管在庫などを大規模なデータベースから引き出してくるオンライン発注システムなどのシステムに相当するものです。システム構成は以下の通りです。
- Microsoft® Windows® Server 2003, Enterprise Edition
SP1
- 2.4GHzプロセッサ×4
- メモリ構成は、8、12、16、24、32、48、および64GBでPC2100とPC2700メモリを使用(PC2100は48GBまで)
- ノードインタリーブはすべての状況で有効
- バンクインタリーブは、16GB、32GB、および64GB構成で使用可能
- 4つのプロセッサボードで均一にメモリを割り当て
図9は、8GBのメモリを使用するベースラインシステム構成に比べてパフォーマンスが改善していることを示しています。システムメモリが2倍になると、パフォーマンスはそれに比例して向上しています。PC2700メモリはPC2100よりも高速なため、予想通りPC2700メモリを追加した場合の方がパフォーマンスの向上幅がわずかながら大きくなります。
| 図9.メモリ容量の増加に比例したOLTPパフォーマンスの向上 |
 |
 |
 |
| *バンクインタリーブは16GB、32GB、および64GB構成で使用可能です。 |
これらのOLTPテストでは、4-Wayシステムにメモリを追加すると、追加するメモリの量に応じてパフォーマンスが50パーセント向上することを示しています。バンクインタリーブの効果については、このテスト条件ではパフォーマンスへの影響はそれほど見られませんでした。 |
 |
同じOLTPテスト構成を使用して、PC2700とPC2100メモリのパフォーマンスの違いを調べることができます。図10は、PC2700メモリの相対パフォーマンスがPC2100メモリを超えることを示しています。PC2700メモリは平均で約2.25パーセント向上します。このテストを8GBおよび12GB構成で行ったときは、I/Oサブシステムが過負荷になりプロセッサがI/O要求で待機していました。この場合、プロセッサの能力が100パーセント活かされません。16GBのメモリでは、I/Oとプロセッサとの差異が釣り合うようになり、24GBのメモリでそれが大幅に改善されます。8GBおよび12GB構成を割り引いて考えた場合、PC2700メモリを使用するとパフォーマンスは平均して2.9パーセント向上します。
| 図10.OLTP作業負荷を使用した場合のPC2700メモリの相対パフォーマンス |
 |
 |
これは、PC2700を使用した場合PC2100メモリと比較してパフォーマンスが2.9パーセント改善したSAPテストと同じような結果になりました(図11)。SAPテストでは、4-Wayの2.4GHzシステムを使用し、メモリは12GBのPC2100または12GBのPC2700でした。いずれの場合もバンクインタリーブは使用していません。
| 図11.SAPテスト結果での高速メモリの効果 |
 |
 |
|
|