 |
≫ |
|
|
 |
 |
 |
日本最大のアクセスを誇るYahoo! JAPANを運営するヤフー株式会社から、Webサービス・サーバのアクセスログ解析サーバとして、64ビット超高性能UNIXサーバHP AlphaServer GS160を受注し、このほど稼働しました。 |
|
 |
 |
HP AlphaServer GS160 は、Yahoo! JAPAN
が提供するウェッブサイト上のバナー広告掲載状況のログファイルを収集し、解析を行うものです。これまではYahoo! JAPAN
では同業務をIA サーバで処理していましたが、アクセス数の増大に対応するため、大量データを短時間で処理できるHP AlphaServer
にリプレースしたものです。
Yahoo! JAPAN は現在、フロントエンドで約800台のWeb サーバを使ってWeb
サービスを提供しており、閲覧者(ユーザ)はこのサーバのいずれかにアクセスすることになります。その全体のアクセス数は1日最大4億200万ページビューに上り、そのログファイルのデータ量は圧縮しても1日当たり50GB
に達します。
HP AlphaServer
GS160はこの膨大なログファイルを各サーバから収集してその解析を行うもので、これによってバナー広告の掲載状況などを分析します。 |
 |
|
 |
|
 |
 |
Yahoo! JAPAN はその重要な収入源である広告収入を増大するため、Web
サービス・サーバへのアクセスログを分析、その結果を広告主に翌日に報告しています。しかし、広告はYahoo! JAPAN が提供している各Web
ページに静的に貼り付いているのではなく、掲載数を動的に変更されるため、その解析には多大な手間がかかっていました。
また、広告主の要求によっては特定の条件に合致したときに広告を掲示したり、また閲覧者(ユーザ)の属性や、閲覧者(ユーザ)が打ち込むキーワードによって広告を掲示するなど、広告掲載には一定の条件が加えられています。さらに、ある期間で達成しなければならないページビューの数が指定されることもあり、こうした場合は優先的にその広告を表示する必要があります。
Yahoo! JAPAN はこうした複雑な広告に対する掲載の状況をこれまでIA サーバで解析していましたが、アクセス数の増大によって1日では解析不可能という状況に陥りつつありました。また、IA
サーバでは800台に上るWeb サービス・サーバから自動的にログファイルを報告させていましたが、これでは報告漏れの可能性があるため、解析サーバ側が各Web
サービス・サーバに強制的にログファイルを収集する必要がありました。さらに、正確な解析を行うため、1日に2度解析を行うだけのサーバのパフォーマンスも求められていました。 |
 |
|
 |
| |
Yahoo! JAPANはこうした問題を解決するため、HPの64ビット超高性能UNIX サーバ、HP AlphaServer GS160 を導入しました。
同システムは16CPU構成で、ディスク容量は4TB、オペレーティングシステムは HP Tru64 UNIX を採用しています。HP AlphaServer GS160は、約800台のWeb サービス・サーバのWebアクセスログ解析を行うセントラル・サーバとして、各サーバにア クセスし、
確実にログファイルを収集します。また、HP AlphaServer GS160ではログファイルの解析時間を大幅に短縮し、翌日には広告掲載状況を広告主に報告できるとともに、膨大なログファイルを分析して広告掲載状況から新たな傾向を割り出すデータマイニングも
可能になります。
また、HP AlphaServer は拡張性に優れており、今後のシステム拡大にも柔軟に対応できます。特にHP Tru64 UNIX は最大16TBの単一ボリュームサイズまで実現可能であるため、今後のデータ量増大に対してもオンラインでディスクを追加するだけで対応可能です。 |
 |
|
 |
 |
本ページに記載されている情報は2004年4月時点のものになります。
閲覧される時点で変更されている可能性がありますので、予めご了承下さい。 |
 |
 |
|