はじめに
このドキュメントでは、Cisco IOS® XRルータ内のインターフェイスで巡回冗長検査(CRC)エラーをトラブルシューティングする方法について説明します。
前提条件
要件
Cisco IOS XRプラットフォームに関する知識があることが推奨されます。
注:Cisco IOS XRおよびadmin CLIのアクセス権が必要であることを推奨します。
使用するコンポーネント
このドキュメントの情報は、次を含むCisco IOS XRプラットフォームに基づいています。
- Cisco ASR 9000シリーズルータ(ASR 9006やASR 9010など)
- Cisco NCS 540 シリーズ ルータ
- Cisco NCS 560 シリーズ ルータ
- Cisco NCS 5500 シリーズ ルータ
- Cisco NCS 5700 シリーズ ルータ
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
背景説明
CRCは、伝送中に生データが誤って変更されたことを検出するために、デジタルネットワークおよびストレージデバイスで使用される基本的なエラー検出コードです。通信チャネルのノイズや干渉によって発生する可能性がある破損を特定することで、データの整合性を確保します。
CRCの仕組み
CRCは、データブロックをバイナリ多項式として処理することによって動作します。送信側の最後では、数学的アルゴリズムによって、このデータ多項式がジェネレータ多項式と呼ばれる定義済みの固定除数多項式で除算されます。この多項式除算の残りの部分は、CRCチェックサム(またはチェック値)と呼ばれる短い固定長のバイナリシーケンスです。 このチェックサムは、元のデータに付加されて一緒に送信されます。
データを受信すると、受信側は受信したデータに対して同じCRC計算を実行します(追加のチェックサムを含む)。 データがエラーなしで送信された場合、この除算の残りはゼロでなければなりません。剰余がゼロ以外の場合は、送信中にエラーが検出されたことを示し、データは破損していると見なされます。CRCは、バーストエラー(連続した複数の破損ビット)など、多くの通信チャネルで広く使用されている一般的なエラーの検出に特に効果的です。
問題
Cisco IOS XRプラットフォームは、リンクの信頼性を維持するために、物理インターフェイス(イーサネット、光インターフェイスなど)でCRCチェックを活用します。CRCエラーカウンタなどのインターフェイス統計情報を提供する。CRCエラー数が多い場合は、通常、ケーブル、コネクタ、トランシーバなどの物理層の問題が考えられます。Cisco IOS XRの診断コマンドでは、エンジニアがCRCエラーをリアルタイムで監視し、他のインターフェイスエラーと関連付けることで、包括的なトラブルシューティングを行うことができます。CRCエラーデータはCisco IOS XRテレメトリおよびロギングシステムに統合され、予防的なネットワークヘルスモニタリングを可能にします。
NCS 5500/5700シリーズやASR 9000シリーズなどのプラットフォームでは、ダウンタイムを最小限に抑えるために、CRCエラーの傾向によってアラームや自動化されたワークフローがトリガーされる場合があります。
インターフェイスCRCエラーの特定
トラブルシューティングの最初のステップは、特定のインターフェイスでCRCエラーが実際に発生しており、増加していることを確認することです。
ステップ 1:Cisco IOS XR CLIでルータにログインし、インターフェイスのCRCエラーカウントが増加しているかどうかを識別するために次のコマンドを実行します。
コマンド出力例:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show interfaces Te0/0/0/26
Mon Jul 21 19:50:25.842 WIB
TenGigE0/0/0/26 is up, line protocol is up
Interface state transitions: 39
Dampening enabled: penalty 0, not suppressed
half-life: 1 reuse: 750
suppress: 2000 max-suppress-time: 4
restart-penalty: 0
Hardware is TenGigE, address is xxx.xxx.xxx (bia xxx.xxx.xxx)
Description: 10G:
Internet address is Unknown
MTU 9212 bytes, BW 10000000 Kbit (Max: 10000000 Kbit)
reliability 255/255, txload 0/255, rxload 6/255
Encapsulation ARPA,
Full-duplex, 10000Mb/s, 10GBASE-LR, link type is force-up
output flow control is off, input flow control is off
Carrier delay (up) is 2000 msec, Carrier delay (down) is 100 msec
loopback not set,
Last link flapped 1w4d
Last input 00:00:00, output 00:00:00
Last clearing of "show interface" counters 01:35:40
30 second input rate 249013000 bits/sec, 27739 packets/sec
30 second output rate 34886000 bits/sec, 11563 packets/sec
152403495 packets input, 172646518724 bytes, 0 total input drops
0 drops for unrecognized upper-level protocol
Received 0 broadcast packets, 84723 multicast packets
13 runts, 0 giants, 0 throttles, 0 parity
3731 input errors, 3718 CRC, 0 frame, 0 overrun, 0 ignored, 0 abort
66477366 packets output, 24050248792 bytes, 0 total output drops
Output 0 broadcast packets, 77461 multicast packets
0 output errors, 0 underruns, 0 applique, 0 resets
0 output buffer failures, 0 output buffers swapped out
0 carrier transitions
input errorsの下にあるCRCカウンタを探します。この値が増加している場合は、CRCエラーの存在を確認します。
ステップ 2:Cisco IOS XR CLIでルータにログインし、次のコマンドを実行して、インターフェイスのCRCエラーカウントが増加しているかどうかを確認し、より詳細な統計情報を表示します。
コマンド出力例:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D# show controllers Te0/0/0/26 stats
Mon Jul 21 19:50:56.139 WIB
Statistics for interface TenGigE0/0/0/26 (cached values):
Ingress:
Input total bytes = 173638989945
Input good bytes = 173638989945
Input total packets = 153271045
Input 802.1Q frames = 0
Input pause frames = 0
Input pkts 64 bytes = 1332238
Input pkts 65-127 bytes = 14101870
Input pkts 128-255 bytes = 9711091
Input pkts 256-511 bytes = 4850242
Input pkts 512-1023 bytes = 4395212
Input pkts 1024-1518 bytes = 117306517
Input pkts 1519-Max bytes = 1577617
Input good pkts = 153271045
Input unicast pkts = 153185898
Input multicast pkts = 85158
Input broadcast pkts = 0
Input drop overrun = 0
Input drop abort = 0
Input drop invalid VLAN = 0
Input drop invalid DMAC = 0
Input drop invalid encap = 0
Input drop other = 0
Input error giant = 0
Input error runt = 13
Input error jabbers = 0
Input error fragments = 9
Input error CRC = 3729
Input error collisions = 0
Input error symbol = 370
Input error other = 0
Input MIB giant = 0
Input MIB jabber = 0
Input MIB CRC = 3729
Egress:
Output total bytes = 24170362757
Output good bytes = 24170362757
Output total packets = 66833308
Output 802.1Q frames = 0
Output pause frames = 0
Output pkts 64 bytes = 10113
Output pkts 65-127 bytes = 35246624
Output pkts 128-255 bytes = 14254990
Output pkts 256-511 bytes = 2888642
Output pkts 512-1023 bytes = 3779102
Output pkts 1024-1518 bytes = 10642390
Output pkts 1519-Max bytes = 11455
Output good pkts = 66833308
Output unicast pkts = 66755447
Output multicast pkts = 77865
Output broadcast pkts = 0
Output drop underrun = 0
Output drop abort = 0
Output drop other = 0
Output error other = 0
Input error CRCカウンタとInput MIB CRCカウンタによって、CRCエラーがわかりやすく示されます。
インターフェイスCRCエラーの一般的な原因
Cisco IOS XRおよびその他のネットワークデバイスでのCRCエラーの一般的な原因は、通常、物理層の問題や設定ミスに起因します。最も頻度の高い根本原因は次のとおりです。
- 破損または動作不良のある物理メディア:これには、銅ケーブル、光ファイバケーブル、または直接接続ケーブル(DAC)が含まれます。
- 障害が発生したり、破損したトランシーバ/光ファイバ(SFP、SFP+、QSFPなど)が劣化したり、障害が発生したりする可能性があります。
- 不良パッチパネルポート:パッチパネル上のコネクタが損傷したり汚れたりすることがあります。
- 欠陥のあるネットワークデバイスハードウェア:これには、ラインカード、ラインカードASIC、メディアアクセスコントロール(MAC)、またはファブリックモジュール上の特定のポートが含まれる場合があります。
- 接続されたホスト/デバイスのネットワークインターフェイスカード(NIC)の誤動作:リモートエンドのハードウェアに障害がある可能性があります。
- 設定の不一致:デバイス間での最大伝送ユニット(MTU)サイズの不一致など。これにより、大きなパケットが誤って切り捨てられ、CRCエラーが発生する可能性があります。
Cisco IOS XRルータのインターフェイスCRCエラーを解決する手順
CRCエラーが特定されたら、体系的にトラブルシューティングを行って問題を解決するために、次の手順を実行します。
ステップ 1:インターフェイスカウンタのクリア
トラブルシューティングに進む前に、インターフェイスカウンタをクリアして新しいベースラインを取得し、CRCエラーが増加し続けるかどうかを確認します。Cisco IOS XR CLIでルータにログインし、次のコマンドを実行してインターフェイスカウンタをクリアします。
# clear counter interface
例:
# clear counter interface Te0/0/0/26
クリアした後、show interfaces <interface>およびshow controllers <interface> statsを使用して、インターフェイスを再びモニタして、CRCエラーが増え続けているかどうかを確認します。
ステップ 2:設定の不一致のチェック(MTU)
CRCエラーは物理的な問題ほど一般的ではありませんが、MTUの不一致により、フレームのトランケートとそれに続くCRCエラーが発生する場合があります。
MTU設定を確認します。
ローカルルータと接続されたピアデバイスのインターフェイスに設定されているMTUを確認します。
出力でMTU <value>バイトを探します。
コマンド出力例:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show interfaces Te0/0/0/26
Mon Jul 21 19:50:25.842 WIB
TenGigE0/0/0/26 is up, line protocol is up
Interface state transitions: 39
Dampening enabled: penalty 0, not suppressed
half-life: 1 reuse: 750
suppress: 2000 max-suppress-time: 4
restart-penalty: 0
Hardware is TenGigE, address is xxx.xxx.xxx (bia xxx.xxx.xxx)
Description: 10G:
Internet address is Unknown
MTU 9212 bytes, BW 10000000 Kbit (Max: 10000000 Kbit)
reliability 255/255, txload 0/255, rxload 6/255
Encapsulation ARPA,
Full-duplex, 10000Mb/s, 10GBASE-LR, link type is force-up
output flow control is off, input flow control is off
Carrier delay (up) is 2000 msec, Carrier delay (down) is 100 msec
loopback not set,
Last link flapped 1w4d
Last input 00:00:00, output 00:00:00
Last clearing of "show interface" counters 01:35:40
30 second input rate 249013000 bits/sec, 27739 packets/sec
30 second output rate 34886000 bits/sec, 11563 packets/sec
152403495 packets input, 172646518724 bytes, 0 total input drops
0 drops for unrecognized upper-level protocol
Received 0 broadcast packets, 84723 multicast packets
13 runts, 0 giants, 0 throttles, 0 parity
3731 input errors, 3718 CRC, 0 frame, 0 overrun, 0 ignored, 0 abort
66477366 packets output, 24050248792 bytes, 0 total output drops
Output 0 broadcast packets, 77461 multicast packets
0 output errors, 0 underruns, 0 applique, 0 resets
0 output buffer failures, 0 output buffers swapped out
0 carrier transitions
処置:MTU設定がリンクの両端で一貫していることを確認します。必要に応じて調整して一致させます。
ステップ 3:物理層の問題のトラブルシューティング(ケーブル配線とトランシーバ)
物理層の問題は、CRCエラーの最も一般的な原因です。
- 物理メディアの検査と交換:
- ケーブル(ファイバ、銅線、DAC)に破損、キンク、鋭角の曲がりがないかどうかを目視で確認します。
- ケーブルがルータインターフェイスと接続デバイスの両方にしっかりと取り付けられていることを確認します。
- 処置:ケーブルを正常なことが分かっているケーブルと交換します。エラーがなくなれば、元のケーブルは不良です。
- 光パワーレベルのチェック(ファイバインターフェイスの場合):
- 光パワーが低いか過度に高いと、信号劣化やCRCエラーが発生する可能性があります。
- show controllers <interface> allコマンドを使用して、トランシーバの光パワー値(TxパワーとRxパワー)を確認します。
コマンド出力例:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D# show controller Te0/0/0/26 all
Mon Jul 21 19:50:32.643 WIB
Operational data for interface TenGigE0/0/0/26:
State:
Administrative state: enabled
Operational state: Up
LED state: Green On
Phy:
Media type: R fiber over 1310nm optics
Optics:
Vendor: CISCO-ACCELINK
Part number: RTXM228-401-C88
Serial number: ACW26040HE6
Wavelength: 1310 nm
Digital Optical Monitoring:
Transceiver Temp: 39.000 C
Transceiver Voltage: 3.265 V
Alarms key: (H) Alarm high, (h) Warning high
(L) Alarm low, (l) Warning low
Wavelength Tx Power Rx Power Laser Bias
Lane (nm) (dBm) (mW) (dBm) (mW) (mA)
-- ----- ------ ------ ------ ------ ------
0 n/a -2.5 0.5603 -17.2 0.0192l 35.250
DOM alarms:
Receive Power: Warning low
Alarm Alarm Warning Warning Alarm
Thresholds High High Low Low
------- ------- ------- -------
Transceiver Temp (C): 75.000 70.000 0.000 -5.000
Transceiver Voltage (V): 3.630 3.465 3.135 2.970
Laser Bias (mA): 75.000 70.000 18.000 15.000
Transmit Power (mW): 2.239 1.122 0.151 0.060
Transmit Power (dBm): 3.500 0.500 -8.202 -12.204
Receive Power (mW): 2.239 1.122 0.036 0.015
Receive Power (dBm): 3.500 0.500 -14.413 -18.386
Alarms:
Current:
No alarms
Statistics:
FEC:
Corrected Codeword Count: 0
Uncorrected Codeword Count: 0
- Tx PowerとRx Powerの値を、Warning low/highしきい値とAlarm low/highしきい値と比較します。値が通常の動作範囲(出力の「Warning low」または「Alarm low/high」で示される)外にある場合は、光パスの問題に対処します(たとえば、コネクタの清掃、ファイバパッチケーブルの交換、過剰な減衰の確認)。
光パワーレベルを許容できる場合、またはトランシーバ自体に障害があると考えられる場合は、トランシーバ(SFP、SFP+、QSFPなど)を正常なことが分かっているトランシーバと交換してください。
ステップ 4:ハードウェアの問題のトラブルシューティング(ポートまたはラインカード)
物理メディアとトランシーバが除外された場合、問題はルータのハードウェアに存在する必要があります。
このテストでは、ポート自体にトラフィックをループバックし、外部ケーブルとトランシーバをバイパスすることで、インターフェイスの内部回路を確認します。
ステップ 4.1:内部ループバックの実装:
# clear counter interface
# conf t
# interface
# loopback internal
# commit
ステップ 4.2:CRCエラーを確認します。
- show interfaces Te0/0/0/26を使用して、インターフェイスにCRCエラーがないか監視します。
- CRCエラーが増加を停止している場合は、外部光モジュールまたは外部光パス(ファイバ、パッチパネル、リモートデバイスなど)に問題があることを示しています。 ステップ4(外部ループバック)に進むか、外部ネットワークコンポーネントに注目します。
- CRCエラーが増加し続ける場合は、そのポートまたはラインカードのルータの内部回線に問題があることを強く示唆しています。この場合、ラインカードまたはルータ自体の交換を進める必要があります。
ステップ 4.3:テスト完了後に内部ループバックを削除する
# conf t
# interface <interface-id>
# no loopback internal
# commit
外部ループバックテスト(ハードループ):
このテストでは、物理ループバックコネクタを使用して、トランシーバを含むポートの物理コネクタで信号をループバックします。これにより、問題の原因がトランシーバにあるのか、またはポートの内部処理にあるのかを特定できます。
ステップ 4.4:ループバックコネクタを使用する
これは、インターフェイスの物理ポート上の受信(Rx)パスに送信(Tx)を物理的に接続するのに役立ちます。
ステップ 4.5:外部ループバックツールキットの使用
また、インターフェイスの物理ポートで送信(Tx)パスと受信(Rx)パスを物理的に接続し、コマンドラインインターフェイスで外部ループバックを適用することもできます。
# clear counter interface
# conf t
# interface Te0/0/0/26
# loopback external
# commit
外部ループバックセンシブリーを使用して、CRCの原因となっているハードウェアを特定します。CRCエラーが停止した場合、問題はさらにアップストリーム(たとえば、リモートデバイス、ケーブル)にある可能性があります。 それでも問題が解決しない場合は、トランシーバまたはポートハードウェアに問題があると考えられます。
ステップ 4.6:テスト完了後に外部ループバックを削除する
また、ループバックコネクタ/ツールキットも削除します。
# conf t
# interface Te0/0/0/26
# no loopback external
# commit
- 別のポート/ラインカードへのインターフェイスの移動:
- 可能であれば、ケーブルとトランシーバを同じラインカード上の別のポートに移動してみてください。エラーが続く場合は、ラインカード自体に障害がある可能性があります。
- エラーが停止した場合は、元のポートに障害がある可能性があります。
- 同じラインカード上の複数のポートでエラーが続く場合は、別のラインカードに移動してみてください(可能な場合)。 これにより、問題の原因が特定のポート、ラインカード、または潜在的にシャーシにあるかどうかを特定できます。
ステップ 5: 既知の問題とバグを確認する
ハードウェア交換に進む前に、既知のソフトウェアまたはハードウェアの不具合を確認することをお勧めします。
- Cisco Bug Search Tool:Cisco Bug Search Tool(BST)で、使用しているプラットフォーム、インターフェイスタイプ、およびソフトウェアバージョンを検索します。
- シスコのサポートドキュメント:シスコのField Notice、リリースノート、既知の注意事項を確認できます。
該当する不具合が見つかった場合は、推奨される回避策またはアップグレードパスを実行します。
手順 6:ハードウェアの交換
既知のソフトウェアバグの発見を含め、これまでのトラブルシューティング手順がすべて完了しても問題が解決しない場合は、ハードウェア(光ファイバ、トランシーバ、ラインカード、またはシャーシ)に障害がある可能性があります。
必要に応じて、光ファイバまたはラインカードのReturn Merchandise Authorization(RMA)について、Cisco Technical Assistance Center(TAC)にケースを提出してください。
これらのトラブルシューティング手順を体系的に実行することで、Cisco IOS XRプラットフォーム上のインターフェイスCRCエラーを効果的に診断および解決できます。