تسعى مجموعة الوثائق لهذا المنتج جاهدة لاستخدام لغة خالية من التحيز. لأغراض مجموعة الوثائق هذه، يتم تعريف "خالية من التحيز" على أنها لغة لا تعني التمييز على أساس العمر، والإعاقة، والجنس، والهوية العرقية، والهوية الإثنية، والتوجه الجنسي، والحالة الاجتماعية والاقتصادية، والتمييز متعدد الجوانب. قد تكون الاستثناءات موجودة في الوثائق بسبب اللغة التي يتم تشفيرها بشكل ثابت في واجهات المستخدم الخاصة ببرنامج المنتج، أو اللغة المستخدمة بناءً على وثائق RFP، أو اللغة التي يستخدمها منتج الجهة الخارجية المُشار إليه. تعرّف على المزيد حول كيفية استخدام Cisco للغة الشاملة.
ترجمت Cisco هذا المستند باستخدام مجموعة من التقنيات الآلية والبشرية لتقديم محتوى دعم للمستخدمين في جميع أنحاء العالم بلغتهم الخاصة. يُرجى ملاحظة أن أفضل ترجمة آلية لن تكون دقيقة كما هو الحال مع الترجمة الاحترافية التي يقدمها مترجم محترف. تخلي Cisco Systems مسئوليتها عن دقة هذه الترجمات وتُوصي بالرجوع دائمًا إلى المستند الإنجليزي الأصلي (الرابط متوفر).
يقدّم هذا المستند شرحًا موجزًا وحلولاً لمشكلات الأجهزة والبُنى التقنية الشائعة لمُبدّلات Cisco Nexus 7000 Series التي تعمل ببرنامج نظام Cisco NX-OS.
ملاحظة: يمكن أن يختلف التنسيق الدقيق لنمط syslog ورسائل الخطأ التي يصفها هذا المستند إختلافا طفيفا. يعتمد التباين على إصدار البرنامج الذي يتم تشغيله على Supervisor Engine (محرك المشرف).
يفشل إختبار التحكم في العمود الفقري للمشرف Nexus 7000:
Nexus7000# show module internal exceptionlog module 5
...
System Errorcode : 0x418b0022 Spine control test failed
Error Type : Warning
PhyPortLayer : 0x0
Port(s) Affected : none
Error Description : Module 10 Spine Control Bus test Failed
...
11) SpineControlBus E
Error code ------------------> DIAG TEST ERR DISABLE
Total run count -------------> 1597800
Last test execution time ----> Mon May 27 21:57:17 2013
First test failure time -----> Sun Nov 20 00:30:55 2011
Last test failure time ------> Mon May 27 21:57:17 2013
Last test pass time ---------> Mon May 27 21:56:47 2013
Total failure count ---------> 33
Consecutive failure count ---> 1
Last failure reason ---------> Spine control test failed
يتعلق هذا الأمر بمعرف تصحيح الأخطاء من Cisco CSCuc72466. ارجع إلى الأسئلة المتداولة حول Nexus 7000: ما هو الإجراء الموصى باتخاذه عند فشل إختبار SpineControlBus؟.
تظهر أخطاء NVRAM في أحداث التشخيص:
Nexus7000#show diagnostic events
1) Event:E_DEBUG, length:97, at 9664 usecs after Wed Dec 5 01:03:42 2012
[103] Event_ERROR: TestName->NVRAM TestingType->health monitoring module->5
Result->fail Reason->
#show diagnostic result module 5 test NVRAM detail
4) NVRAM-------------------------> E
Error code ------------------> DIAG TEST ERR DISABLE
Total run count -------------> 52596
Last test execution time ----> Wed Dec 5 01:03:41 2012
First test failure time -----> Tue Dec 4 23:28:45 2012
Last test failure time ------> Wed Dec 5 01:03:42 2012
Last test pass time ---------> Tue Dec 4 23:23:41 2012
Total failure count ---------> 20
Consecutive failure count ---> 20
Last failure reason ---------> Bad blocks found on nvram
إما أن تكون هذه مشكلة في الأجهزة أو عطل في "محرك المشرف" أو أنها مشكلة مؤقتة.
دخلت العرض تشخيصي نتيجة وحدة نمطية 5 إختبار NVRAM تفصيل أمر in order to رأيت النتائج من الاختبار أمر.
رأيت واحد أو كل هذا على المشرف 2/المشرف 2E:
DEVICE_TEST-2-COMPACT_FLASH_FAIL: Module 5 has failed test CompactFlash
20 times on device Compact Flash due to error The compact flash power test failed.
Test results: (. = Pass, F = Fail, I = Incomplete,
U = Untested, A = Abort, E = Error disabled)
7) CompactFlash E
Error code ------------------> DIAG TEST ERR DISABLE
Total run count -------------> 23302
Last test execution time ----> Sun Apr 13 10:07:30 2014
First test failure time -----> Sun Apr 13 00:37:41 2014
Last test failure time ------> Sun Apr 13 10:07:40 2014
Last test pass time ---------> Sun Apr 13 00:07:41 2014
Total failure count ---------> 20
Consecutive failure count ---> 20
Last failure reason ---------> The compact flash power test
failed
Next Execution time ---------> Sun Apr 13 10:37:30 2014
سبب جذري
يتم شحن الجيل الثاني من مشرفي Nexus 7000 مع ومضي eUSB متطابقين لإتاحة إمكانية التكرار. توفر ومضات الذاكرة المؤقتة مستودعا لذاكرة Bootflash والتكوينات والمعلومات الأخرى ذات الصلة. ويتم إعادة تكوين هاتين المروحتين كصفيف مكرر من الأقراص المستقلة (RAID) 1 يقوم بتنفيذ النسخ المتماثل الداخلي. مع التكرار، يمكن أن يعمل المشرف مع فقد أحد ومضات الشاشة وليس كليهما.
هناك بعض الأمثلة في الحقل حيث يتم وضع علامة غير صحيحة على أحد هذه الومضات أو كليهما بواسطة برنامج RAID على مدى فترة زمنية تبلغ عدة أشهر أو سنوات في الخدمة. تقوم إعادة ضبط/إعادة تشغيل اللوحة باكتشاف هذه الوميض الفاشلة بشكل صحيح في عملية التمهيد التالية.
أتمت هذا steps in order to دققت إن يكون هذا أو ليس جهاز إصدار:
يبلغ الخط فشل تشخيصي بسبب إخفاق إختبار PortLoopback 10 مرة بالتتابع:
DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL Module:16 Test:PortLoopback
failed 10 consecutive times. Faulty module:Module 16 affected ports:5,7
Error:Loopback test failed. Packets lost on the LC at the Queueing engine ASIC
MODULE-4-MOD_WARNING Module 16 (serial: XXXX) reported warning on
ports 16/5-16/5 (Ethernet) due to Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC in device 78
(device error 0x41830059)
سبب جذري
هذه رسالة تحذير وفي معظم الحالات تشير إلى مشكلة في الجهاز مع المنفذ.
تحقق من معرف تصحيح الأخطاء من Cisco CSCtn81109 ومعرف تصحيح الأخطاء من Cisco CSCti95293 أولا، لأن هذا يمكن أن يكون مشكلة برنامج.
قم بإعادة تركيب الوحدة النمطية أولا لإعادة تهيئة البطاقة وإعادة تشغيل إختبارات سلامة الأجهزة. إذا كانت إختبارات التشخيص لا تزال تظهر فشلا للبطاقة نفسها، فاستبدل البطاقة.
قم بإعادة تحميل البطاقة في الوقت المناسب وتجميع مخرجات هذه الأوامر:
بدلا من ذلك، يمكنك إعادة تشغيل هذا الاختبار المحدد فقط ولا تحتاج إلى إعادة تحميل البطاقة. يوضح هذا المثال الوحدة النمطية 16:
show diagnostic result module 16
diagnostic clear result module all
(config)# no diagnostic monitor module 16 test 5
(config)# diagnostic monitor module 16 test 5
diagnostic start module 16 test 5
show diagnostic result module 16 test 5
تظهر هذه الأخطاء وهناك إعادة تحميل وحدة نمطية محتملة:
2013 Mar 27 00:40:23 DC3-7000-PRODD2-A23 MODULE-4-MOD_WARNING
Module 9 (serial: XXX) reported warning on ports 9/1-9/3 (Unknown)
due to BE2 Arbiter experienced an error in device 65 (device error 0xc410f613)
سبب جذري
هذا عطل في الأجهزة بسبب أخطاء التماثل أو مشاكل في الأجهزة على البطاقة التابعة.
عيب إضافي معروف في البرامج
معرف تصحيح الأخطاء من Cisco CSCtb98876
تظهر هذه الأخطاء على الوحدة النمطية:
%MODULE-4-MOD_WARNING: Module # (Serial number: XXXX) reported warning
Ethernet#/# due to chico serdes sync loss in device DEV_SKYTRAIN
(device error 0xc9003600)
سبب جذري
تشير هذه الأخطاء إلى وجود مشكلة في فقدان المزامنة بين الوحدة النمطية # و Xbar/ASIC. في معظم الحالات يكون السبب هو عطل في أجهزة الوحدة النمطية.
إذا كان إصدار Cisco NS-OX الخاص بك أقدم من 6.1(4) ولم تظهر الرسالة باستمرار، يمكن أن تتأثر بمعرف تصحيح الأخطاء من Cisco CSCud91672. وسبب هذا العيب هو أن إعدادات خوادم NX-OS تختلف عن إعدادات التشخيص على القناتين بين SKT <—>SAC.
يجمع الإنتاج من هذا أمر:
قم بترقية المحول إلى NS-OX الإصدار 6.1(4) أو إصدار أحدث لعزل سبب الخلل.
قم بإجراء هذا الاختبار للتأكد من وجود خطأ في البطاقة بدلا من فتحة xbar أو الهيكل:
تفشل الوحدة النمطية N7K-F248XP-25 في كل من الاختبارات PrimaryBootROM و SecondaryBootROM:
show module internal exceptionlog module 1 | i Error|xception
********* Exception info for module 1 ********
exception information --- exception instance 1 ----
Error Description : Secondary BootROM test failed
exception information --- exception instance 2 ----
Error Description : Primary BootROM test failed
سبب جذري
وعادة ما يحدث ذلك بسبب تلف ملف BIOS أو عطل في أجهزة Linecard.
يضيف معرف تصحيح الأخطاء من Cisco CSCuf82089 تعليما لإظهار مزيد من المعلومات الوصفية حول مثل هذه الإخفاقات من أجل تشخيصات أفضل. على سبيل المثال، يظهر مكون فاشل بدلا من قيمة خالية حاليا.
وفي بعض الحالات تكون المشكلة ناجمة عن تلف في نظام BIOS على الوحدة. دخلت ال install وحدة نمطية X bios فرض أمر in order to حللت هذا. لاحظ أن هذا الأمر يمكن أن يؤثر على الخدمة. والتوصية هي عدم تنفيذه إلا أثناء فترة الصيانة.
أتمت هذا steps in order to حللت الإصدار:
Nexus7000# install module 1 bios forced
Warning: Installing Bios forcefully...!
Warning: Please do not remove or power off the module at this time
Upgrading primary bios
Started bios programming .... please wait
[# 0% ]
BIOS install failed for module 1, Error=0x40710027(BIOS flash-type verify failed)
BIOS is OK ...
Please try the command again...
يظهر هذا خطأ على النظام الأساسي:
%PLATFORM-4-MOD_TEMPFAIL: Module-2 temperature sensor 7 failed
سبب جذري
وهذه مسألة متقطعة مع كتلة الحرارة/الجهد الكهربي في دائرة الضغط الكهربي في ظل ظروف معينة بسبب التوقيت الداخلي لوحدة قياس الضغط الكهربي. يصف Cisco بق id CSCtw79052 السبب المعروف ل هذا إصدار.
هذه هي مشكلة التوقيت بين ASIC الذي يقوم بسحب الحرارة داخليا والبرنامج الذي يأخذ عينة البت الصحيح. الإصدار هو أن هو يستطيع ضربت على أي من ال 12 مثال قصاصة. ولا يوجد سبب محدد لهذه المشكلة وهي متقطعة. لا تؤثر هذه المشكلة على الخدمة وتنشأ بسبب أن منطق قراءة درجة الحرارة لديه مشكلة تتطلب المزيد من عمليات إعادة المحاولة في برنامج التشغيل.
جمعت الإنتاج من هذا أمر وفحصت ضد cisco بق id CSCtw79052:
يوجد C7010-FAB-1 في حالة انخفاض طاقة وتظهر هذه الأخطاء:
%PLATFORM-3-EJECTOR_STAT_CHANGED: Ejectors' status in slot 13 has changed,
Left Ejector is OPEN, Right Ejector is CLOSE
%PLATFORM-3-EJECTOR_STAT_CHANGED: Ejectors' status in slot 13 has changed,
Left Ejector is OPEN, Right Ejector is OPEN
%PLATFORM-2-XBAR_REMOVE: Xbar 3 removed (Serial number XXX)
Xbar Ports Module-Type Model Status
--- ----- ----------------------------------- ------------------ ----------
3 0 Fabric Module N/A powered-dn
?
Xbar Power-Status Reason
--- ------------ ---------------------------
3 powered-dn failure(powered-down) since maximum number of bringups were exceeded
بدلا من ذلك، تظهر أخطاء ASIC xbar:
%MODULE-4-MOD_WARNING: Module 15 (serial: XXX) reported warning due to
X-bar Interface ASIC Error in device 70 (device error 0xc4600248)
%OC_USD-SLOT15-2-RF_CRC: OC2 received packets with CRC error from MOD 15
through XBAR slot 3/inst 2
سبب جذري
ترجع هذه المشكلة إما إلى وحدة نمطية xbar غير صحيحة أو إلى فتحة هيكل غير صحيحة.
وقد لوحظ واحد أو أكثر من أعراض فشل المروحة هذه:
%PLATFORM-5-FAN_STATUS: Fan module 3 (Serial number XXX)
Fan3(fab_fan1) current-status is FAN_FAIL
Nexus 7000#show environment fan
Fan3(fab_fan1) N7K-C7010-FAN-F 1.1 Failure (Failed Fanlets: 2 6 7 8 9 10 14 15 )
Fan4(fab_fan2) N7K-C7010-FAN-F 1.1 Ok
...
#show hardware
----------------------------------
Chassis has 4 Fan slots
----------------------------------
Fan3(fab_fan1) failed
Model number is N7K-C7010-FAN-F
...
سبب جذري
وفي معظم الحالات، يكون ذلك نتيجة عطل في فتحة المروحة أو الهيكل.
تشاهد التنبيهات لتغيرات السعة، في بعض الأحيان بشكل متكرر جدا.
%PLATFORM-2-PS_CAPACITY_CHANGE: Power supply PS2 changed its capacity.
possibly due to On/Off or power cable removal/
2013 Oct 17 17:06:40 ... last message repeated 14 times
سبب جذري
ترجع هذه المشكلة إما إلى وجود كبل طاقة معيب أو منقطع الاتصال، أو إلى فشل في وحدة إمداد الطاقة.
تحقق من إخراج الأمر show env power detail وابحث عن حالة وحدة إمداد الطاقة. في هذا المثال إخراج البيانات، يتم توصيل كلا الجهازين ولكن العرض الثاني يظهر فقط سعة 1200 وات بدلا من 3000 وات ويلزم أن يكون للتيار المتردد بقوة 220 فولت على الطراز N7K-AC-6.0KW. تم إختبار مصدر الطاقة بشكل صحيح. استبدل وحدة إمداد الطاقة.
PS_2 total capacity: 4200 W Voltage:50Vchord 1 capacity: 3000 W chord 1
connected to 110v AC chord 2 capacity: 1200 W chord 2 connected to 220v AC
يظهر هذا التنبيه على النظام الأساسي:
%PLATFORM-5-PS_STATUS: PowerSupply 3 current-status is PS_FAIL
%PLATFORM-2-PS_FAIL: Power supply 3 failed or shut down (Serial number xxxxx)
سبب جذري
يرجع سبب هذا التنبيه إلى وجود عطل في كابل الطاقة أو إلى قطع إتصاله أو إلى فشل في وحدة إمداد الطاقة.
المراجع
تكرار وحدة إمداد الطاقة من السلسلة Cisco Nexus 7000
تظهر هذه الإنذارات لمصدر طاقة FEX:
%SATCTRL-FEX104-2-SOHMS_DIAG_ERROR: FEX-104 Module 1: Runtime diag detected major event:
Voltage failure on power supply: 1
%SATCTRL-FEX104-2-SOHMS_DIAG_ERROR: FEX-104 System minor alarm on power
supply 1: failed
%SATCTRL-FEX104-2-SOHMS_DIAG_ERROR: FEX-104 Recovered: System minor alarm
on power supply 1: failed
تحقق من وجود مشكلات تتعلق بالأجهزة والطاقة. إذا كانت لديك مشكلة في البرنامج، تستمر رسائل الخطأ حتى بعد تبديل الأجهزة.
وتتضمن طرق حل هذه المشاكل ما يلي:
قم بمراجعة هذه الأسئلة والإجابة عنها للمساعدة على تحديد ظروف الفشل:
جمعت إنتاج من هذا أمر in order to استعملت الفشل:
عيب برمجي معروف
معرف تصحيح الأخطاء من Cisco CSCtr77620
تم الإبلاغ عن وحدات إمداد الطاقة Emerson Power Supply N7K-AC-6.0KW على أنها معطلة/متوقفة عن العمل، ولكن المحول يعمل بشكل جيد ويتم مشاهدة الإخراج الفعلي بخلاف 0 الخاص بوحدة إمداد الطاقة التي بها مشكلة.
سبب جذري
في وحدة تزويد تعمل كلا مدخلي الطاقة، وعند فصل الإدخال أو إعادة توصيله أو قطع إتصاله مرة أخرى في غضون 1.5 ثانية، يمكن أن يتسبب المورد في حدوث عطل أقل من الجهد الكهربائي وقد يقوم NX-OS بوضع علامة على وحدة إمداد الطاقة على أنها فاشلة. في تباين آخر، على مورد يحتوي على مدخلين، قم بإزالة إدخال واحد وانتظر من 20 إلى 30 ثانية. قد يؤدي هذا الإمداد إلى تعيين تنبيه الأعطال الداخلي على نحو متقطع بينما يقوم NX-OS بالإعلام عن فشل مصدر الطاقة.
يجري معرف تصحيح الأخطاء من Cisco CSCty78612 تغييرات على البرنامج الثابت على وحدات وحدة إمداد الطاقة من أجل إصلاح المشكلة.
يضيف Cisco بق id CSCuc86262 تحسين برمجية in order to إستردت من هذا خطأ إخفاق. ويعمل نظام التشغيل NX الآن على مراقبة حالة وحدة التزويد بالطاقة (PSU) بشكل مستقل وتعديلها إلى الحالة المناسبة إذا كانت الحالة التي تم الإبلاغ عنها تختلف عن الحالة الحقيقية.
أدخل الأمر show env power detail وتحقق من الإخراج الفعلي للتحقق من الفشل الخاطئ:
Nexus7000# show env power
Power Supply:
Voltage: 50 Volts
Power Actual Total
Supply Model Output Capacity Status
(Watts ) (Watts )
------- ------------------- ----------- ----------- --------------
1 N7K-AC-6.0KW 0 W 0 W Shutdown
2 N7K-AC-6.0KW 3888 W 6000 W Fail/Shut
يتم مسح حالة الفشل/الإيقاف الخطأ عند إيقاف تشغيل/على وحدة التزويد بالطاقة (PSU).
يجري معرف الأخطاء من Cisco CSCty78612 تغييرات على البرنامج الثابت في وحدة التزويد بالطاقة (PSU). تم تحسين البرنامج من خلال معرف تصحيح الأخطاء من Cisco CSCuc86262 الذي يسترد من إعلامات فشل/إيقاف تشغيل خاطئة مع تصحيح وحدات بت خاطئة إذا كان مصدر الطاقة في وقت التشغيل يعمل بشكل طبيعي. تتوفر في الإصدارات 5.2(9) و 6.1(3) و 6.2(2) من نظام التشغيل NX والإصدارات اللاحقة ميزات التحسين الحالية التي تمنع ترخيص المواد المسترجعة.
يتم إسقاط جزء من الحزم الكبيرة الحجم عندما يكون هناك معدل مرتفع من حزم IP بطول أطول من وحدة الحد الأقصى للنقل (MTU) التي تم تكوينها على واجهة مخرج الحزمة.
سبب جذري
وهذا هو السلوك المتوقع. عندما يستقبل النظام حزمة IP بطول أطول من وحدة الحد الأقصى للنقل (MTU) التي تم تكوينها على واجهة مخرج الحزمة، يرسل النظام هذه الحزمة إلى مستوى التحكم، الذي يهتم بالتجزئة. في NX-OS 4.1.3 والإصدارات الأحدث، يتم تطبيق محدد المعدل على هذه الحزم المثقبة. هذا الحد الأقصى هو 500 صفحة في الثانية بشكل افتراضي.
هذا معروف خلل برمجية في cisco بق id CSCsu01048.
يعرض خطأ "user-2-system_msg FIPS self-test failure في DCOs_rand - netstack".
سبب جذري
كلما تم إنشاء رقم عشوائي، يعمل الاختبار الذاتي لمولد الرقم العشوائي المشروط (CRNG). إذا فشل الاختبار، فسيتم تسجيل رسالة syslog. ويتم ذلك وفقا لتوصية المعايير الاتحادية لتجهيز المعلومات. ومع ذلك، فإن تأثير هذا الإجراء غير ضار حيث يتم إنشاء الرقم العشوائي مرة أخرى.
هناك نوعان من مولدات الأرقام العشوائية (RNGs) في NX-OS:
طبقا ل FIPS، يجب أن تنفذ كل RNG إختبار مولد الأرقام العشوائية المشروط (CRNGT). يقوم الاختبار بمقارنة الرقم العشوائي الحالي الذي تم إنشاؤه مع الرقم السابق. إذا كانت الأرقام هي نفسها، فعندئذ يتم إنشاء رسالة syslog ويتم إنشاء رقم عشوائي إضافي.
يتم تشغيل الاختبار لضمان تفرد الرقم العشوائي. لا يوجد تأثير وظيفي عند إعادة إنشاء الرقم.
هذه الرسالة غير ضارة بعملية النظام. من الإصدار 5.2x من Cisco NX-OS والإصدارات الأحدث، يتم خفض خطورة الرسالة من 2، وبالتالي لم تعد ترى باستخدام تكوين التسجيل الافتراضي. يحدث هذا التسجيل كجزء من الاختبارات الذاتية ل NX-OS الداخلية لمختلف الوظائف على المحول.
هذا معروف برمجية خلل في cisco بق id CSCtn70083.
المراجعة | تاريخ النشر | التعليقات |
---|---|---|
1.0 |
15-May-2015 |
الإصدار الأولي |