ルータ : Cisco ASR 1000 シリーズ アグリゲーション サービス ルータ

Cisco ASR 1000 シリーズ アグリゲーション サービス ルータ クラッシュのトラブルシューティング

2009 年 8 月 21 日 - ライター翻訳版
その他のバージョン: PDFpdf | 機械翻訳版 (2013 年 8 月 21 日) | 英語版 (2009 年 3 月 17 日) | フィードバック

目次

概要
前提条件
      要件
      使用するコンポーネント
      表記法
Cisco ASR 1000 シリーズ アグリゲーション サービス ルータのクラッシュ
      クラッシュのタイプ
      クラッシュ情報の取得
      Crashinfo ファイル
      コアダンプファイル
IOSD クラッシュ
SPA ドライバークラッシュ
Cisco IOS XE プロセスクラッシュ
Cisco Quantum Flow Processor マイクロコードクラッシュ
Linux カーネルクラッシュ
TAC のサービスリクエストをオープンする場合の情報の収集
関連するシスコ サポート コミュニティ ディスカッション
関連情報

概要

この文書は、Cisco® ASR 1000 シリーズ アグリゲーション サービス ルータにおけるクラッシュのトラブルシューティングについて説明しています。

前提条件

要件

この文書に関する特別な要件はありません。

使用するコンポーネント

この文書の情報は、以下のソフトウェアおよびハードウェアバージョンに基づいた情報です。

  • ASR 1002、1004、1006 を含む全ての Cisco ASR 1000 シリーズアグリゲーションサービスルータ

  • Cisco ASR 1000 シリーズ アグリゲーション サービス ルータをサポートする全ての Cisco IOS® XE ソフトウェアバージョン

この文書の情報は、特定のラボ環境にあるデバイスに基づいて作成されています。この文書内で使用されているデバイスはすべて、クリアな状態(デフォルト)から設定作業を始めています。対象のネットワークが実稼動中である場合には、すべてのコマンドによる潜在的な影響について確実に理解しておく必要があります。

表記法

文書表記の詳細は、『シスコテクニカルティップスの表記法』 を参照してください。

Cisco ASR 1000 シリーズ アグリゲーション サービス ルータのクラッシュ

クラッシュのタイプ

Cisco ASR 1000 シリーズ アグリゲーション サービス ルータは、ソフトウェア アーキテクチャとして Cisco IOS XE ソフトウェアを導入しています。Cisco IOS XE ソフトウェアは、Cisco IOS ソフトウェアをベースとして Route Processor(RP; ルート プロセッサ)、Embedded Services Processor(ESP; エンベデッド サービス プロセッサ)、SPA Interface Processor(SIP; SPA インターフェイス プロセッサ)に搭載された Linux カーネル上で動作するモジュラー型オペレーティングシステムです。IOS デーモン(IOSD)および他の IOS XE プロセスは、その Linux カーネル上で動作しています。そのため Cisco ASR 1000 シリーズアグリゲーションサービスルータでは、『表1』 に示されるようにいくつかのクラッシュのタイプがあります。

表1 – クラッシュのタイプ

クラッシュのタイプ

モジュール

説明

IOSD クラッシュ

RP

Cisco IOS ソフトウェアが IOSD として RP の Linux カーネル上で動作しています。

SPA ドライバークラッシュ

SIP

SPA を制御するために、SIP 上で限定された Cisco IOS ソフトウェアが動作しています。

Cisco IOS XE プロセスクラッシュ

RP

ESP

SIP

いくつかの Cisco IOS XE プロセスが Linux カーネル上で動作しています。例えば、シャーシマネージャー、フォワーディングマネージャー、インターフェースマネージャーなどが RP 上で動作しています。

Cisco Quantum Flow Processor(QFP)マイクロコードクラッシュ

ESP

マイクロコードが QFP 上で動作しています。QFP は ESP 上で動作するパケットフォワーディング ASIC です。

Linux カーネルクラッシュ

RP

ESP

SIP

Linux カーネルは、RP、ESP、SIP 上で動作しています。

クラッシュ情報の取得

期待されないモジュールの再起動に遭遇した場合、コンソール出力や Crashinfo ファイルディレクトリやコアダンプファイル ディレクトリがトラブルシューティングに有効であるかを確認する必要があります。原因を特定するための最初のステップは、可能な限り問題に関する十分な情報を集めることです。以下の情報は問題の原因を特定するために必要となります。

  • Console ログ — 詳細については 『コンソール接続用ターミナル エミュレータの正しい設定』 を参照してください。

  • Syslog 情報 — syslog サーバへログを送信する設定にしている場合は、クラッシュ時に何が発生したかに関する情報を取得することができます。詳細については 『Resource Manager Essentials と Syslog Analysis:手引き』 を参照してください。

  • show platformshow platform コマンドは、RP、ESP、SIP、SPA、電源に関する状態を表示します。

  • show tech-supportshow tech-support コマンドは、show version および show running-config を含む多くの異なるコマンドを集めたものです。ルータが問題に遭遇したとき、シスコ テクニカルアシスタンスセンター(TAC)エンジニアは通常問題解決のためにこの情報を求めます。再起動もしくは電源 OFF/ON を実施する前に show tech-support の出力を収集する必要があります。なぜならこれらの行為は問題に関する情報の不足を引き起こす原因になりうるからです。

    注: show tech-support コマンドは show platformshow logging コマンドを含みません。

  • ブートシーケンスの情報 — ルータがブートエラーに遭遇した場合の完全なブートシーケンス。

  • Crashinfo ファイル(ファイルがある場合)— Crashinfo ファイル セクションを参照してください。

  • コアダンプファイル(ファイルがある場合)— コアダンプファイル セクションを参照してください。

  • トレースログファイル(ファイルがある場合)— Cisco ASR 1000 シリーズアグリゲーションサービスルータでは、Cisco IOS XE プロセスのトレースログが RP上の harddisk:tracelogs(ASR 1006 または ASR 1004)もしくは bootflash:tracelogs(ASR 1002)配下に生成されます。Cisco IOS XE プロセスがクラッシュした場合、Cisco TAC エンジニアは通常、問題解決のためにこの情報の取得を求めます。

Crashinfo ファイル

IOSD もしくは SPA ドライバーがクラッシュした場合、Crashinfo ファイルは 『表2』 に示す場所に生成されます。

表2 – Crashinfo ファイルの生成場所

モデル

クラッシュのタイプ

Crashinfo ファイルの生成場所

ASR 1002

IOSD クラッシュ

SPA ドライバークラッシュ

bootflash:

ASR 1004

ASR 1006

IOSD クラッシュ

bootflash:

SPA ドライバークラッシュ

harddisk:

表3』 は Crashinfo ファイル名を示しています。

表3 – Crashinfo ファイル名

クラッシュのタイプ

Crashinfo ファイル名

IOSD クラッシュ

crashinfo_RP_SlotNumber_00_Date-Time-Zone

crashinfo_RP_00_00_20080807-063430-UTC

SPA ドライバークラッシュ

crashinfo_SIP_SlotNumber_00_Date-Time-Zone

crashinfo_SIP_00_00_20080828-084907-UTC

コアダンプファイル

プロセスがクラッシュした時、コアダンプファイルは『表4』に示す場所で確認できます。コアダンプファイルはプロセスのメモリイメージの完全なコピーです。トラブルシューティングが完了するまでコアダンプファイルを保存しておくことが推奨されます。これはコアダンプファイルが Crashinfo ファイルよりもクラッシュの問題についてより多くの情報を含んでいるためです。そしてそれはより深い調査に必要とされます。Cisco ASR 1002 ルータの場合は、harddisk デバイスを持たないため、コアダンプファイルは bootflash:core/ に生成されます。

表4 – コアダンプファイルの生成場所

モデル

コアダンプファイルの生成場所

ASR 1002

bootflash:core/

ASR 1004

ASR 1006

harddisk:core/

RP 上のプロセスのコアダンプファイルだけでなく、ESP や SIP 上のプロセスのコアダンプファイルも同じ場所に生成されます。Cisco ASR 1006 ルータの場合は、スタンバイ RP の同じ場所も確認する必要があります。なぜならば、RP スイッチオーバーのために、現在のスタンバイ RP は問題が発生した時はアクティブ RP であった可能性があるためです。

表5 – コアダンプファイル名

クラッシュのタイプ

コアダンプファイル名

IOSD クラッシュ

hostname_RP_SlotNumber_ppc_linux_iosd-_ProcessID.core.gz

Router_RP_0_ppc_linux_iosd-_17407.core.gz

SPA ドライバークラッシュ

hostname_SIP_SlotNumber_mcpcc-lc-ms_ProcessID.core.gz

Router_SIP_1_mcpcc-lc-ms_6098.core.gz

IOS XE プロセスクラッシュ

hostname_FRU_SlotNumber_ProcessName_ProcessID.core.gz

Router_RP_0_fman_rp_28778.core.gz

Router_ESP_1_cpp_cp_svr_4497.core.gz

Cisco QFP クラッシュ

hostname_ESP_SlotNumber_cpp-mcplo-ucode_ID.core.gz

Router_ESP_0_cpp-mcplo-ucode_042308082102.core.gz

Linux カーネルクラッシュ

hostname_FRU_SlotNumber_kernel.core

Router_ESP_0_kernel.core

IOSD クラッシュ

IOS デーモン(IOSD)は RP 上で Linux プロセス(ppc_linux_iosd-)として動作します。デュアル IOS モード(Cisco ASR 1002 ルータおよび Cisco ASR 1004 ルータのみ)では、2 つの IOSD が 1 つの RP 上で動作します。

IOSD のクラッシュと特定するためには、コンソール上の以下の例外出力を確認してください。デュアル IOS モードを用いない Cisco ASR 1002 ルータもしくは Cisco ASR 1004 ルータのクラッシュの場合、その機器は再起動されます。デュアル IOS モードを用いた Cisco ASR 1002 ルータもしくは Cisco ASR 1004 ルータのクラッシュの場合、IOSD はその RP 上でスイッチオーバーします。Cisco ASR 1006 ルータの場合、RP はスイッチオーバーされ、新しいスタンバイ RP は再起動されます。

Exception to IOS Thread:
Frame pointer 2C111978, PC = 1029ED60

ASR1000-EXT-SIGNAL: U_SIGSEGV(11), Process = Exec
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d  
   :10000000+29ED60 :10000000+29ECB4 :10000000+2A1A9C 
:10000000+2A1DAC :10000000+492438 :10000000+1C22DC0 
   :10000000+4BBBE0 

Fastpath Thread backtrace: 
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d  
   c:BC16000+C2AF0 c:BC16000+C2AD0 
iosd_unix:BD73000+111DC pthread:BA1B000+5DA0 

Auxiliary Thread backtrace: 
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d  
   pthread:BA1B000+95E4 pthread:BA1B000+95C8 
c:BC16000+D7294 iosd_unix:BD73000+1A83C 
   pthread:BA1B000+5DA0 

PC  = 0x1029ED60  LR  = 0x1029ECB4  MSR = 0x0002D000
CTR = 0x0BD83C2C  XER = 0x20000000
R0  = 0x00000000  R1  = 0x2C111978  R2  = 0x2C057890  R3  = 0x00000034
R4  = 0x000000B4  R5  = 0x0000003C  R6  = 0x2C111700  R7  = 0x00000000
R8  = 0x12B04780  R9  = 0x00000000  R10 = 0x2C05048C  R11 = 0x00000050
R12 = 0x22442082  R13 = 0x13B189AC  R14 = 0x00000000  R15 = 0x00000000
R16 = 0x00000000  R17 = 0x00000001  R18 = 0x00000000  R19 = 0x00000000
R20 = 0x00000000  R21 = 0x00000000  R22 = 0x00000000  R23 = 0x00000001
R24 = 0x00000001  R25 = 0x34409AD4  R26 = 0x00000000  R27 = 0x2CE88448
R28 = 0x00000001  R29 = 0x00000000  R30 = 0x3467A0FC  R31 = 0x2C1119B8

Writing crashinfo to bootflash:crashinfo_RP_00_00_20080904-092940-UTC
Buffered messages: (last 4096 bytes only)

IOSD がクラッシュした場合、Crashinfo ファイルとコアダンプファイルが RP 上に生成されます。

Router#dir bootflash:
Directory of bootflash:

bootflash:crashinfo_RP_00_00_20080904-092940-UTC


Router#dir harddisk:core
Directory of harddisk:core/

3620877  -rw-    10632280   Sep 4 2008 09:31:00 +00:00  
   Router_RP_0_ppc_linux_iosd-_17407.core.gz

SPA ドライバークラッシュ

SPA ドライバーは SPA を制御するために限定された IOS の機能を持ちます。そして SPA ドライバーは SIP 上で mcpcc-lc-ms プロセスとして、Cisco IOS XE プロセスの一つとして動作します。もし mcpcc-lc-ms プロセスのダウンを確認した場合、それは SPA ドライバーのクラッシュと特定できます。SPA ドライバーがクラッシュした後は、SPA は再起動します。

Aug 28 08:52:12.418: %PMAN-3-PROCHOLDDOWN: SIP0: 
   pman.sh:  The process mcpcc-lc-ms has been helddown (rc 142)
Aug 28 08:52:12.425: %ASR1000_OIR-6-REMSPA: 
   SPA removed from subslot 0/0, interfaces disabled
Aug 28 08:52:12.427: %SPA_OIR-6-OFFLINECARD: 
   SPA (SPA-1X10GE-L-V2) offline in subslot 0/0
Aug 28 08:52:13.131: %ASR1000_OIR-6-INSSPA: 
   SPA inserted in subslot 0/0
Aug 28 08:52:19.060: %LINK-3-UPDOWN: SIP0/0: 
   Interface EOBC0/1, changed state to up
Aug 28 08:52:20.064: %SPA_OIR-6-ONLINECARD: 
   SPA (SPA-1X10GE-L-V2) online in subslot 0/0

SPA ドライバーがクラッシュした時、Crashinfo ファイルとコアダンプファイルが RP 上に生成されます。

Router#dir harddisk:
Directory of harddisk:/

   14  -rw-      224579  Aug 28 2008 08:52:06 +00:00  
   crashinfo_SIP_00_00_20080828-085206-UTC

Router#dir harddisk:core
Directory of harddisk:/core/

4653060  -rw-     1389762  Aug 28 2008 08:52:12 +00:00  
   Router_SIP_0_mcpcc-lc-ms_6985.core.gz

Cisco IOS XE プロセスクラッシュ

Cisco IOS XE プロセスは RP、ESP、SIP の Linux カーネル上で動作します。『表6』 は主な Cisco IOS XE プロセスをリストしたものです。クラッシュが発生した場合、そのモジュールは再起動する可能性があります。

表6 – 主な Cisco IOS XE プロセス

タイトル

プロセス名

モジュール

Chassis Manager

cmand

RP

cman_fp

ESP

cmcc

SIP

Environmental Monitoring

emd

RP, ESP, SIP

Forwarding Manager

fman_rp

RP

fman_fp_image

ESP

Host Manager

hman

RP, ESP, SIP

Interface Manager

imand

RP

imccd

SIP

Logging Manager

plogd

RP, ESP, SIP

Pluggable Service

psd

RP

QFP Client Control Process

cpp_cr_svr

ESP

QFP Driver Process

cpp_driver

ESP

QFP HA Server

cpp_ha_top_level_server

ESP

QFP Client Service Process

cpp_sp_server

ESP

Shell Manager

smand

RP

cpp_cp_svr プロセスが ASR 1006 ルータの ESP 上でクラッシュした場合、以下のメッセージがコンソール上に表示されます。

Jan 24 23:37:06.644 JST: %PMAN-3-PROCHOLDDOWN: 
   F0: pman.sh:  The process cpp_cp_svr has been helddown (rc 134)
Jan 24 23:37:06.727 JST: %PMAN-0-PROCFAILCRIT: F0: pvp.sh:  
   A critical processcpp_cp_svr has failed (rc 134)
Jan 24 23:37:11.539 JST: %ASR1000_OIR-6-OFFLINECARD: 
   Card (fp) offline in slot F0

harddisk:core/ 配下にコアダンプファイルを確認することができます。

Router#dir harddisk:core
Directory of harddisk:/core/

1032194  -rw-    38255956  Jan 24 2009 23:37:06 +09:00  
   Router_ESP_0_cpp_cp_svr_4714.core.gz

プロセスのトレースログは有用な出力を含んでいる可能性があります。

Router#dir harddisk:tracelogs/cpp_cp*
Directory of harddisk:tracelogs/

4456753  -rwx       24868  Jan 24 2009 23:37:15 +09:00  
   cpp_cp_F0-0.log.4714.20090124233714

Cisco Quantum Flow Processor マイクロコードクラッシュ

Cisco Quantum Flow Processor は、ハードウェアとソフトウェアの両方を包括するアーキテクチャとして設計されました。現バージョンの QFP では、2 つのシリコンが使用されています。今後のバージョンでは、ここで説明する同じソフトウェア アーキテクチャに基づき、シングル チップ ソリューションが採用される可能性があります。「Cisco Quantum Flow Processor」という呼称自体が、ネットワーク プロセッサのハードウェアおよびソフトウェアを包括するアーキテクチャを表しています。

QFP マイクロコードがクラッシュした場合 ESP は再起動します。QFP マイクロコードのクラッシュを特定するために、以下のコンソール上の出力もしくは cpp-mcplo-ucode のコアダンプファイルを見つけてください。

Dec 17 05:50:26.417 JST: %IOSXE-3-PLATFORM: F0: 
   cpp_cdm: CPP crashed, core file /tmp/corelink/
   Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz
Dec 17 05:50:28.206 JST: %ASR1000_OIR-6-OFFLINECARD: 
   Card (fp) offline in slot F0

harddisk:core/ 配下にコアダンプファイルを確認することができます。

Router#dir harddisk:core
Directory of harddisk:core/

3719171  -rw-     1572864  Dec 17 2008 05:50:31 +09:00 
   Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz

Linux カーネルクラッシュ

Cisco ASR 1000 シリーズでは、Linux カーネルが RP、ESP、SIP 上で動作しています。Linux kernel がクラッシュした時、そのモジュールはコンソール出力なしに再起動します。そのモジュールが再度起動した後、もし Linux カーネルのコアダンプファイルを確認できた場合、Linux カーネルクラッシュと特定できます。カーネルのコアファイルのサイズは、100 MByte 以上になります。

Router#dir harddisk:core
Directory of harddisk:/core/

393230  ----   137389415  Dec 19 2008 01:19:40 +09:00  
   Router_RP_0_kernel_20081218161940.core

TAC のサービスリクエストをオープンする場合の情報の収集

上記のトラブルシューティング手順を実行した後も、依然としてサポートが必要で、Cisco TAC でサービス リクエストをオープンする必要がある場合は、ルータ クラッシュのトラブルシューティングに必要な次の情報を必ず収集してください。

  • サービス リクエストをオープンする前に実行したトラブルシューティング

  • The show platform 出力

  • show logging 出力もしくはコンソールのキャプチャ

  • show tech-support 出力

  • Crashinfo ファイル(ファイルがある場合)

  • コアダンプファイル(ファイルがある場合)

収集したデータは、圧縮しないプレーンなテキスト形式(.txt)でサービス リクエストに添付してください。情報をサービス リクエストに添付するには、TAC ServiceRequest tool 登録ユーザのみ)を使用してアップロードします。TAC Service Request Toolにアクセスできない場合は、メッセージの件名の行にお客様のサービスリクエスト番号を記入し、attach@cisco.com にメッセージを送信することによって、お客様のサービスリクエストに関連情報を添付できます。

注: ルータ クラッシュのトラブルシューティングに必要でない限り、上記の情報を収集する前にルータを手動で再起動したり、電源のオフ/オンを行わないようにしてください。問題の原因の判断に必要な、重要な情報が失われます。


関連するシスコ サポート コミュニティ ディスカッション

シスコ サポート コミュニティは、どなたでも投稿や回答ができる情報交換スペースです。


関連情報


Document ID: 109723