概要
この資料はエラー データ・リンクの増加かポートごとの NPU カウンターを検出するスクリプトを記述したものです。
前提条件
要件
次の項目に関する知識が推奨されます。
使用するコンポーネント
このドキュメントは、特定のソフトウェアやハードウェアのバージョンに限定されるものではありません。
本書の情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。 このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。 対象のネットワークが実稼働中である場合には、どのような作業についても、その潜在的な影響について確実に理解しておく必要があります。
問題
ポート レベルのエラーカウンタはさまざまな問題を StarOS ノードで解決するために大きい情報ソースである場合もあります。
ほとんどの有益な情報は、この場合、ある特定のある一定の時間の間にそれらのカウンターの変化です。
単一 " show " コマンドの出力で利用可能である静的な値は有意義な結論を作るために十分な情報を提供していません。
典型的なアプローチは show コマンドの複数の出力を集め、次に違いを手動で生じることです。
これはどんなポートが丁度影響を与えられるか特にそれが知られないとき難しい仕事である場合もあります。
このスクリプトはポートごとのある特定のある一定の時間にわたるエラーカウンタの変化の提供によってこのプロセスを簡素化します。
検出することができる問題の例:
- MTU 不一致
- VLAN ミスコンフィギュレーション
- データ・リンク水平なエラー
スクリプトがはたらく仕組み
SSD ファイルでは、数分間隔で奪取 される show port npu カウンターおよび show port データ・リンク カウンターの 2 出力があります。
このポートがカウンターをある特定の現時点に水平にし、また原動力を見るのを見る割り当て。
このスクリプトはカウンターの増加が観察されるときコマンド 出力からのエラーカウンタをチェックして、アラートを生成します。
通常、これは物理的のかネットワーク レベルで問題を示唆します。 状況によって解決することをステップを続行して下さい。
NPU カウンター
これらの NPU カウンターは観察されています:
カウンタ |
説明 |
注意事項 |
HW エラー |
First In First Out (FIFO; 先入れ先出し)オーバーランかアンダーランがパケットの数によって廃棄される原因で。 |
|
無現用ポート |
操作上ポートがパケットの数によって廃棄される原因で。 |
|
SRC MAC はマルチキャストです |
送信元MACアドレスがパケットの数によって廃棄される原因でマルチキャストです。 |
|
未知 VLAN タグ |
認識されない Virtual Local Area Network (VLAN; バーチャル LAN) タグがパケットの数によって廃棄される原因で。 |
ネクスト・ホップ スイッチの VLAN構成をチェックして下さい |
悪い IPv4 ヘッダ |
パケットの数は無効 な IPv4 ヘッダが原因で廃棄しました |
|
超過する IPv4 MRU |
パケット 長がパケットの数によって廃棄される原因で余りに長いです。 |
|
TCP 小さいフラグメント |
パケットの数は TCP 小さいフラグメントが原因で廃棄しました |
|
切れる TTL |
存続可能時間パラメータが超過したので廃棄されるパケットの数。 |
|
余りに短い: IP |
短い IPパケットがパケットの数によって廃棄される原因で余りに |
|
余りに短い: ICMP |
ルックアップキーのために短い ICMPパケットがパケットの数によって廃棄される原因で余りに |
|
余りに短い: IGMP |
ルックアップキーのために短い IGMPパケットがパケットの数によって廃棄される原因で余りに |
|
余りに短い: TCP |
ルックアップキーのために短い TCPパケットがパケットの数によって廃棄される原因で余りに |
|
余りに短い: UDP |
ルックアップキーのために短い UDP パケットがパケットの数によって廃棄される原因で余りに |
|
余りに短い: IPIP |
ルックアップキーのために短い UDP パケットがパケットの数によって廃棄される原因で余りに |
おそらくドキュメントのタイプエラー。 おそらくそれはルックアップキーのためにショートするべき IPIP パケットです。 |
余りに短い: GRE |
GRE ヘッダーサイズがパケットの数によって廃棄される原因で < 8 バイト |
|
余りに短い: GRE キー |
GRE ヘッダがパケットの数によって廃棄される原因でキー提供ヘッダーサイズを < 13 バイト言います |
|
frag 破棄は |
フラグメンテーションを必要とする IP ヘッダー Don't Fragment ビットが設定 されるので NPU によって廃棄されるパケット。 |
|
廃棄される IPv4VlanMap |
廃棄された IPv4 VLAN マップ パケットの総数。 |
|
見つけられない MPLS フロー |
MPLS フローが見つけられなかった時廃棄されるパケットの総数。 |
|
データ・リンク カウンター
これらのデータ・リンク カウンターは分析されます:
カウンタ |
説明 |
注意事項 |
RX バイト BAD |
受け取ったバイトの数。 |
|
TX バイト BAD |
バイト数 エラーと送信された。 |
|
RX OVF |
受け取ったオーバーフローの数。 |
|
TX は延期します |
使用中行による最初の送信する試みに延期される帯の数。 |
|
TX COL |
伝達の間に発生する規則的な衝突 イベントの数。 |
|
RX 不足分 CRC |
帯の数、長さが 64 バイト以下、巡回冗長 チェック(CRC)エラーと受け取られて。 |
|
TX SCOL |
単一 衝突に続くエラーなしで送信される帯の数。 |
|
RX SFD 無し |
開始する フレーム デリミタ(SFD)検出なしでしかしキャリア アサーションと受信したフレーム数。 |
|
TX MCOL |
複数のコリジョンの後でエラーなしで送信される帯の数。 |
|
TX XCOL |
16 の連続した衝突または多くを経験した帯の数。 |
|
TX LCOL |
長さが 64 bye であるパケットの伝達の後に発生する衝突による伝達中絶の数。 |
|
TX 一時停止 |
正しい送信されたフロー制御帯の数。 |
|
RX 長い CRC |
CRCエラーと受け取った最大フレームサイズより大きい帯の数。 |
|
TX ERR |
FIFO アンダーフローまたは TXERR 場合アサーションを送信すること当然のエラーと送信される帯の数 |
|
RX 一時停止 |
正しい受信されたフロー制御帯の数。 |
|
RX FALS CRS |
検出する偽キャリア イベントの数。 |
|
RX SYM ERR |
物理的 な(PHY)記号エラーが検出する 受信フレームの数。 |
|
RX BAD 帯 |
エラーの受信フレームの数。 |
|
RX ラント フレーム |
サイズを期待したより少しの受信フレームの数。 |
|
RX 特大帯 |
受信された特大帯の数。 |
ドキュメントのおそらくエラー。 同じは「RX 特大帯として」あるはずです |
RX 特大帯 |
受信された特大帯の数。 |
|
RX 標準 CRC |
64 バイトおよびバイトの整数によって受け取った最大フレームサイズおよび巡回冗長 チェック(CRC)エラー間の期間の帯の数。 |
|
RX 標準アリ |
64 バイトおよび非整数 バイト数によって受け取った最大フレームサイズおよび巡回冗長 チェック(CRC)エラー間の期間の帯の数。 |
|
RX GPCS ERR |
物理的 な(PHY)記号エラーが検出する 受信フレームの数。 |
|
STM インターフェイスについてはだけ見られる一連のデータ・リンク カウンターがあります:
カウンタ |
説明 |
注意事項 |
rx 帯 FECN セット |
|
関連するフレーム リレー |
rx 帯 BECN セット |
|
関連するフレーム リレー |
rx CRCエラー |
|
|
rx アラインメント エラー |
|
|
rx 長さ違反 |
|
|
rx FBP は空になります |
|
|
十分の rx ホスト キュー |
|
|
rx 不正 な ヘッダ |
|
|
rx 打ち切る |
|
|
rx パリティ エラー |
|
|
rx サポートされていない DLCI |
|
関連するフレーム リレー |
rx SOP/EOP エラー |
|
|
rx 総エラー バイト |
|
|
tx 帯 FECN セット |
|
関連するフレーム リレー |
tx 帯 BECN セット |
|
関連するフレーム リレー |
tx アンダーラン |
|
|
tx によって打ち切られる帯 |
|
|
|
|
|
出力例
エラーのいくつかで増加すればドロップ カウンタ fromshow ポート npu countersor show port データ・リンク countersoutputs は提供された SSD で観察されます。
スクリプトはチェックされるすべてのカウンターを強調表示しますが「port'statement のために観察される続く増加が含まれている物である増加との物だけ分析する必要があります
そのような増加がノードにおいての問題を必ずしも指していないことに注目して下さい。 通常、それはケーブル、SFP、ミスコンフィギュレーションまたはネットワーク レベル問題における問題です。
影響を受けたカウンターの定義をチェックし、ステップを解決することをこれに基づいて順方向に続行して下さい。
########################## NPU COUNTERS ######################################
No errors increase found during monitoring period
######################## DATALINK COUNTERS ###################################
Errors observed in the output of 'show port datalink counters' between Monday October 01 12:29:49 CDT 2018 and Monday October 01 13:03:24 CDT 2018 on the ports 6/10,6/16,5/15
- Following increase in errors is seen on port 6/10:
RX OverSize frames:Frames: 404
- Following increase in errors is seen on port 6/16:
RX OverSize frames:Frames: 402
- Following increase in errors is seen on port 5/15:
RX OverSize frames:Frames: 3
出力を理解する方法か。
変化があらゆるポートの対象のカウンターの何れかで見られなかった場合、スクリプトは何も戻しません。
対象の少なくとも 1 つのカウンターとの変化が、少なくともあれば、1 ポート-スクリプトはアラートを生成しません。
次にアラートは型(NPU かデータ・リンク)とポートごとにグループ化されます。
最初に、すべての調査結果およびモニタ期間を要約する文があります。
Errors observed in the output of 'show port datalink counters' between Monday October 01 12:29:49 CDT 2018 and Monday October 01 13:03:24 CDT 2018 on the ports 6/10,6/16,5/15
それの上で、10月 01 13:03:24 CDT 2018 は月曜日、10月 01 12:29:49 CDT 2018 および月曜日の間にです、すなわち 30 分のまわりにあります。
タイムスタンプは show port データ・リンク カウンターまたは、それぞれ、show port npu カウンターの出力から奪取 されます
その後、ポートに対して識別される問題となるカウンターの要約があります。
- Following increase in errors is seen on port 6/16:
RX OverSize frames:Frames: 402
述べられた例ではモニタ期間の間に 6/16 ポートで受信された 402 の特大帯がありました(30 分のまわりで)。