Jump to content 日本-日本語
日本HPホーム 製品 & サービス サポート & ドライバー ソリューション ご購入方法
お問い合わせ

製品とサービス  >  ソフトウェアとOS  >  HP-UX   >  Knowledge-on-Demand

逆引きUNIXメンテナンス・ガイド

〜こんな時、どうするの?Solaris経験者もこれで安心〜
システム対策編
HP-UX/Integrityサーバー お問い合せ
コンテンツに進む
逆引きUNIXメンテナンス・ガイド - システム対策編 -
日常の管理をしていく際、「あれ?ここはどうすればいいんだろう?」と首をひねることは、ないでしょうか?
前回に引き続き、逆引き形式で日々のメンテナンスのためのヒントを列挙しました。今回のテーマは「システム対策」です。システムに何らかのトラブルがあったとき、誰しも早く解決したいと焦るものでしょう。Solarisなど他のUNIXからHP-UXに移行してきた場合など、以前使っていたOSと同じように対処しようとしてできず、とまどうこともあるかと思います。そんなときに本稿を解決の一助としてください。
逆引き
UNIXメンテナンス・ガイド
- システム管理編 -
パーティションや
論理ボリュームの管理
ユーザー管理
- システム対策編 -
障害を検出する
トラブルを解決する
2009年12月
テクニカルライター 米田 聡
ページ: 1   2   |   次へ 

障害を検出する

ディスクの障害を早期に発見するには?

一口にディスクの障害といっても、論理的に壊れる場合からハードウェア的な故障まで幅広い。ハードウェアの不調に起因する論理構造の破壊という複合的なケースもあるなど複雑だ。

ハードウェアのエラーであれば、ioscanコマンドで検出できるケースも少なくない。

# ioscan -fknC disk

論理ボリュームの情報をチェックするlvdisplayでも、ディスクに異常が生じていれば手がかりが得られるだろう。

# lvdisplay -v vol_name

これらのコマンドを定期的に実行するスクリプトを作成して走らせておけば、ディスクに関連する障害を早めに検知できるはずだ。
さらに詳細にチェックを行いたい場合には、WEBベースのシステム管理ツール群であるHP System Management Homepage(SMH)に含まれるSystem Falut Management(SFM)がある。SFMは、サーバーの状態を監視やハードウェア情報を取得など行えるWBEMベースの障害管理ツールで、プロセッサーやメモリ、シャーシ(ファン・電源・温度・電圧など)、そしてファームウェアといったハードウェア・コンポーネントから情報を収集できる。

また、現状のハードウェアの診断を行いたい場合には、オフライン・ツールとしてODE(Offline Diagnostic Environment)、オンライン・ツールとしては、STM(Support Tool Manager)があり、ハードウェアの診断からファームウェアのアップデートまで行える。

参考

強制的にコアを吐かせてエラーの原因を調べたい

動作に問題が生じているプロセスを調べるためにコアを吐かせたいということがある。HP-UXも他のUNIX系OSと同様、プロセスに特定のシグナルを送ることでプロセスを停止させると同時にコアダンプを出力させることが可能だ。

$ kill -SIGABRT pid

pidの部分に停止させたいプロセスIDを指定しよう。プロセスが停止し、その時点でのコアイメージがダンプされる。

スワップが発生しているか調べたい

スワップの情報はswapinfoコマンドを使って得ることができる。

$ swapinfo -d
             Kb      Kb      Kb   PCT              Kb
TYPE      AVAIL    USED    FREE  USED   START RESERVE  PRI  NAME
dev     8388608 2766816 5621792   33%       0       -    1  /dev/vg00/lvol2

スワップが発生しているのなら、USEDの欄に値が表示されるはずだ。スワップの発生頻度などを知りたいのであれば、cronなどを使ってswapinfoを定期的に実行させてログを取っておくのがもっとも簡単な手段になるだろう。

スワップ関連のコマンド

システムのスワップ領域の情報を表示 swapinfo
システムのスワップ領域の管理および構成 swapctl
バイトのスワップ swab
スワップを有効にする swapon

システムの負荷を調べたい

UNIX系OSでは一般的なsarを用いて調べるのがもっとも簡単だろう。

$ sar 1 5
HP-UX hpvm612 B.11.31 U ia64    12/07/09
13:11:33    %usr    %sys    %wio   %idle
13:11:34       5      42      44      10
13:11:35       8      48      31      13
13:11:36       3      12      85       0
13:11:37       0       1      34      65
13:11:38       0       4       0      96

Average        3      21      39      37

sarコマンドを用いてシステム負荷を過去にさかのぼって調べることもできるので、どういう状況で負荷が生じているか知りたい場合には、このコマンドが役に立つはずだ。
なお、他のUNIX系OSではsarでメモリ関連の情報を取ることができる場合があるが、HP-UXではメモリ関連の情報はvmstatという別のコマンドを使って取得する。

$ vmstat
$     procs        memory                page                        faults       cpu
  r   b   w    avm   free   re   at   pi  po   fr   de   sr   in    sy    cs  us sy id
  2   1   0  58922  41424    0    0   10   0    0    0   13  427  8517   201   2  4 95

この例のように、vmstatは仮想メモリの統計情報を取ることができる。他のUNIX系OSから乗り換えたユーザーは、CPU負荷はsarを使いメモリはvmstatを使うというふうに覚えておいてほしい。

また、システム負荷を管理するツールに、HP-UX WorkLoad Manager(WLM)がある。データを収集する仕組みのデータコレクター(Data Collector)により、CPU使用率などのシステム・イベントからOracle データベース、WebLogic Serverなどの様々なアプリケーションの情報を収集できる。

システム負荷関連のコマンド

CPU統計情報を表示 sar
仮想メモリ統計情報を表示 vmstat

参考

その他のツール

システムがクラッシュした原因を探るには?

HP-UXはシステムがクラッシュすると、クラッシュダンプデバイスに設定されているデバイスにクラッシュダンプを作成する。クラッシュの原因を究明するもっとも基本的な方法は、このクラッシュダンプを標準のadbなどのデバッガを使って解析するというものだ。

adbでクラッシュダンプを調べる

$ adb /var/adm/crash/crash.0
hostname   : vh1
model      : ia64 hp server rx2660
mem size   : 0
panic mesg : SafetyTimer expired, INIT, IIP:0xe000000001d71a30 IFA:0xe00000013440ca80
dumptime   : 1260152671 Mon Dec   7 11:24:31 JST 2009
savetime   : 1260152891 Mon Dec   7 11:28:11 JST 2009
release    : @(#) $Revision: vmunix:    B.11.31_LR FLAVOR=perf
modules    : 24
vhpt       : 0xe000000138840000
vhpt size  : 8192
page size  : 10000 (65536)
[hssn] [hpvmntdvr] [hvsd] [hpvmdvr] [rng] [gvid_info] [gvsd] [btlan] [procsm] [c8xx]
[cdfs] [igssn] [fcd] [td] [gelan] [iether]
[iexgbe] [igelan] [lvmp] [nadv] [ciss] [sasd] [mpt]
adb> $c
             send_INIT_monarch + 0x70
              Send_Monarch_TOC + 0x90
             safety_time_check + 0x260
             per_spu_hardclock + 0x100
                     clock_int + 0x3b0
            external_interrupt + 0x4b0
                    bubbledown
                                 0xe000000157939440
adb: error: No load module descriptor for IP '0xe000000157939440'.
adb> 

その他に、Integrityサーバーが備えるファームウェアiLOのログがクラッシュの原因究明に役立つ場合もある。特に、ハードウェアに問題が生じてクラッシュしているようなケースでは、iLOのログに何らかの原因が記録されている場合が多い。原因不明のクラッシュに見舞われた場合には、iLOのログを参照してみるのもよいだろう。

iLOのログを表示

Enter menu item or [Ctrl-B] to Quit: q
   MP MAIN MENU:
         CO: Console
        VFP: Virtual Front Panel
         CM: Command Menu
      SMCLP: Server Management Command Line Protocol
         CL: Console Log
         SL: Show Event Logs
         HE: Main Help Menu
          X: Exit Connection
[vh1] MP> SL
Event Log Viewer Menu:
       Log Name            Entries    % Full      Latest Timestamped Entry
---------------------------------------------------------------------------
   E - System Event          420        60 %      07 Dec 2009 02:27:34
   F - Forward Progress     4000       100 %
   B - Current Boot           74        24 %
   P - Previous Boot          74        24 %
   C - Clear All Logs
   L - Live Events
Enter menu item or [Ctrl-B] to Quit: E
       Log Name            Entries    % Full      Latest Timestamped Entry
---------------------------------------------------------------------------
   E - System Event          420        60 %      07 Dec 2009 02:27:34
Event Log Navigation Help:
   +       View next block     (forward in time,  e.g. from 3 to 4)
   -       View previous block (backward in time, e.g. from 3 to 2)
       Continue to the next or previous block
   D       Dump the entire log
   F       First entry
   L       Last entry
   J       Jump to entry number
   H       View mode configuration - Hex
   K       View mode configuration - Keyword
   T       View mode configuration - Text
   A       Alert Level Filter options
   U       Alert Level Unfiltered
   ?       Display this Help menu
   Q       Quit and return to the Event Log Viewer Menu
   Ctrl-B  Exit command, and return to the MP Main Menu
MP:SL (+,-,,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >L
#  Location|Alert| Encoded Field    |  Data Field    |   Keyword / Timestamp
-------------------------------------------------------------------------------
419   HPUX 0   2  0x54801C2F00E02680 0000000000001001 HP-UX_BOOT_COMPLETE
                                                      07 Dec 2009 02:27:34
418   SFW  0   2  0x40801CBB00E02660 0000000000000000 BOOT_SWITCH_INSECURE_MODE
                                                      07 Dec 2009 02:26:10
417   SFW  0   2  0x5480006300E02640 0000000000000000 BOOT_START
                                                      07 Dec 2009 02:25:53
416   SFW      2  0xC14B1C67B1022630 FFFF000A001D0300 CPU_START_BOOT
                                                      07 Dec 2009 02:25:53
415   BMC      2  0x204B1C67AD022620 FFFF027000120300 SOFT_RESET
                                                      07 Dec 2009 02:25:49
414   HPUX 0  *7  0xF4801C3100E02600 000000000019100C HP-UX_OS_CRITICAL_SHUTDOWN
                                                      07 Dec 2009 02:24:32
413   SFW  0  *7  0xF480007900E025E0 0000000000000000 INIT_INITIATED
                                                      07 Dec 2009 02:24:31
412   SFW     *7  0xC14B1C675F0225D0 003FA36F00130300 INIT_INTERRUPT_INITIATED
                                                      07 Dec 2009 02:24:31
411   HPUX 0   2  0x54801C2F00E025B0 0000000000001001 HP-UX_BOOT_COMPLETE
                                                      07 Dec 2009 02:15:28
MP:SL (+,-,,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) > 

ログの表示コマンド

ファームウェアやOSが出力するエラーやステータスのイベントの表示 evweb
ファームウェアが生成するログ情報をEFIシェルから表示 errdump

参考

最初に戻る ページ: 1   2   |   次へ  次のページへ
本ページの内容は執筆時の情報に基づいており、異なる場合があります。

関連情報

先行きの見えない今、Solarisからの移行は必然。乗り遅れる前に、HPが最短ルートをお知らせします。

Solarisで使用するコマンドとHP-UXで使用するコマンドを比較したものです。

特集

PDFファイルをご覧いただくには、Adobe® Reader® が必要です。
アドビシステムズ社のウェブサイト より、ダウンロード(無料)の上ご覧ください。

お問い合わせ

ご購入前のお問い合わせ


ご購入後のお問い合わせ

オンラインサポート
製品の標準保証でご利用いただける無償のサービスです。

ショールーム

ショールーム 導入をご検討のお客様へ
業務アプリケーションの継続・標準化・開発性とシステム担当者様、システム開発者様が抱える悩み・疑問に対する解決策実体験して頂けます。
印刷用画面へ
プライバシー ご利用条件・免責事項 ウェブマスターに連絡