概要
この資料に記述されています ASR5K-PSC-32G (パケット サービス カード 2 (PSC2)識別する方法を)のメモリ問題を そして ASR5K-PSC-64G (パケット サービス カード 3 (PSC3)) カード。 問題が時見られる現象ことカードリセット自体はです。 トラブルシューティングに必要なすべての情報が利用できます示しますサポート 詳細(SSD)を。
前提条件
要件
Cisco は集約 サービス ルータ 5000 (ASR5K)の CLI の基本的な知識があることを推奨します。
使用するコンポーネント
このドキュメントは、特定のソフトウェアやハードウェアのバージョンに限定されるものではありません。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。 このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。 ネットワークが稼働中の場合は、コマンドが及ぼす潜在的な影響を十分に理解しておく必要があります。
メモリの問題
パケット サービス カード 2 (PSC2)は、パケット サービス カード 3 (PSC3) 「カーネル クラッシュ」か「抜けているハートビートに」よるエーテルをクラッシュするかもしれません。
カーネル クラッシュ
カーネル クラッシュはカードが複数の「修正可能な記憶誤 りか単一「修正不可能 な 記憶誤 りを」経験するとき起こる場合があります。 問題がカーネル クラッシュ識別するために下記に記載されているステップに従って下さい:
- SSD では、チェックは「カーネル クラッシュのためのクラッシュ リスト」を表示します:
<snip>
******** show crash list *******
== =================== ======= ========== =========== ================
# Time Process Card/CPU/ SW HW_SER_NUM
PID VERSION SMC / Crash Card
== =================== ======= ========== =========== ================
86 2012-Jun-07+18:28:21 sessmgr 15/0/04453 12.2(42876) PLB30103469/PLB40098624
87 2012-Jun-15+04:02:34 kernel 16/0/NA 12.2(NA) PLB30103469/PLB39098500
88 2012-Jun-15+04:50:38 sessmgr 02/0/04372 12.2(42876) PLB30103469/PLB40098609
<snip>
カーネル クラッシュのためのクラッシュ数が確認されたら、クラッシュ数があるようにクラッシュ詳細をの「表示しますクラッシュ リスト」を確認して下さい。 上の例では、クラッシュ 87 はカード 16 で起こりました。
<snip>
********************* CRASH #87 ***********************
2.6.38-staros-v3-hw-64 #1 SMP PREEMPT Wed Apr 18 14:32:38 EDT 2012 1 0 PLB39098500 428760, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52569.305831] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52569.314566] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52579.321273] edac_mc_handle_fbd_ce: 449 callbacks suppressed
<4>[52579.326820] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
????..
<0>[52668.605978] [Hardware Error]: CPU 0: Machine Check Exception: 4 Bank 8: fe0000000001009f
<0>[52668.614014] [Hardware Error]: TSC 66946ea1b05a ADDR 44f307280 MISC 4c43688800045941
<0>[52668.621767] [Hardware Error]: PROCESSOR 0:106a5 TIME 1339732830 SOCKET 0 APIC 0
<0>[52668.629028] [Hardware Error]: Machine check: Processor context corrupt
<0>[52668.635520] Kernel panic - not syncing: Fatal Machine check
<snip>
「EDAC MC0: CE 行 0、チャネル 0、ラベル"": 訂正されたエラー」と共にか。カーネル パニックか。 クラッシュはメモリ障害がおよび RMA が必要となることを示します。
検出する メモリ
PSC2/PSC3 ラインカードは「抜けているハートビート」の示す値によってリブートするかもしれません。 1 つの原因はシステムが悪い DIMM を検出することです。 悪い DIMM が検出する場合、カードは「オフ・ライン」状態に入る前に複数回をリブートすることを試みます。
出力の PSC2 カードに関しては、か。デバッグ コンソール カード X CPU 0 か。 SSD で見つけられて、次のエラーは見られます。
1338537199.891 card 6-cpu0: ERROR: Memory size 24576 MB for cpu0 not matching with value 32768 MB in IDEEPROM 1338537199.891 card 6-cpu0:
1338537199.891 card 6-cpu0: ERROR: Bus 255 CPU 0 Chan 0 DIMM 0 NotPresent
また syslog は次のエラーと読み込まれます:
The Packet Services Card 2 with serial number SAD154403TT in slot 6 has failed and will be brought down and brought back online. (Device=CPU_0, Reason=CARD_BOOT_TIMEOUT_EXPIRED, Status=[CPU0 MB: CFE_FAILURE] [CPU1] [CPU2] [CPU3] [GPIO_IN: 00,ff,ff,ff] [GPIO_OUT: 01,ff,00,ff]
SSD で見つけられた出力の PSC3 カードに関しては、「デバッグ コンソール カード X CPU 0' は次のエラー見られます:
1412147713.299 card 7-cpu0: WARNING: Memory size 49152 MB for cpu0 not matching with value 65536 MB in IDEEPROM
この問題に直面するカードは取り替えられる必要があります。