المقدمة
يوضح هذا المستند كيفية أستكشاف أخطاء وحدة المروحة النمطية وإصلاحها في النظام الأساسي NCS XR.
المتطلبات الأساسية
المتطلبات
توصي Cisco بأن تكون لديك معرفة بالمواضيع التالية:
ملاحظة: cisco يوصي أن أنت ينبغي يتلقى منفذ إلى cisco IOS® XR CLI و admin CLI.
ملاحظة: cisco يوصي أن أنت ينبغي يتلقى منفذ إلى cisco IOS® XR CLI و admin CLI.
المكونات المستخدمة
تستند المعلومات الواردة في هذا المستند إلى إصدارات البرامج والمكونات المادية التالية:
وهذا يتضمن، على سبيل المثال لا الحصر، هذه السلاسل:
- NCS 540 Series
- NCS 560 Series
- NCS 5500 Series
- NCS 5700 Series
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك قيد التشغيل، فتأكد من فهمك للتأثير المحتمل لأي أمر.
معلومات أساسية
تتضمن سلسلة موجهات Cisco NCS XR العديد من الأنظمة الأساسية المصممة لحالات إستخدام مختلفة ومستويات أداء مختلفة، لكل منها أنواع وحدات مراوح وبنية أنظمة متميزة:
· السلسلة Cisco NCS 540 Series: هذا موجه XR صغير الحجم مصمم خصيصا لتطبيقات النطاق الترددي الفرعي 100G مثل نقل الشبكة عبر الشبكة (NR) من الجيل الخامس وتقنية FTTx وعمليات النشر الفرعية للمؤسسات. وهو يستخدم وحدات مراوح مزودة بتصميم مروحة إحتياطية لمروحة 3+1 وتبريد الهواء القسري من جانب إلى جانب. يتم تثبيت وحدات التزويد بالطاقة باستخدام وحدات إحتياطية للتيار المتردد/التيار المستمر بمعدل 1+1، كما يتم تصميم النظام باستخدام طبقات متوافقة ويدعم التوافق مع التوقيت من الفئة C.
· السلسلة Cisco NCS 560 Series: ويتضمن هذا النظام النمطي ثلاث أدراج مراوح نمطية عالية السرعة يجب ملؤها للتشغيل. وتحتوي أدراج المراوح هذه على مراوح إحتياطية وقابلة للخدمة في الموقع، مما يسمح باستبدالها دون إيقاف تشغيل النظام. يدعم النظام التشغيل مع حالات تعطل المروحة الواحدة، كما يفرض حدودا زمنية لإعادة دمج أدراج المراوح استنادا إلى درجة الحرارة المحيطة. كما أنه يتميز بمرشح مدمج لتيار الغبار لتحسين تدفق الهواء. تتسم مصادر الطاقة بكونها قابلة لإضافة وحدات أخرى ومزودة بخيارات التيار المتردد والتيار المستمر، مما يدعم إمكانية مشاركة الأحمال وخطط الحماية.
· السلسلة Cisco NCS 5500 Series: تم تصميم هذا النظام الأساسي لموجه نمطي فائق المرونة لمواجهة الأعطال خصيصا لمراكز البيانات وبيئات الشبكات فائقة الأداء. ويتميز هذا الطراز بوحدات مراوح قابلة للاستبدال في الموقع وقابلة لإضافة وحدات أخرى تدعم قابلية الصيانة والتكرار. يتضمن أستكشاف الأخطاء وإصلاحها عمليات فحص سجلات النظام وحالة الأجهزة وإدارة حزم البرامج للحفاظ على إستقرار النظام. يدعم النظام الأساسي برنامج Cisco IOS® XR المزود بحزم قابلة لإضافة وحدات أخرى وميزات المرونة.
· السلسلة Cisco NCS 5700 Series: استنادا إلى النظام الأساسي NCS 5500، تتضمن هذه السلسلة تصميم ASIC المحسن لإعادة التوجيه كما تعمل بنظام التشغيل Cisco IOS® XR7. يحتوي على متغيرات مثل NCS-57B1-6D24 و NCS-57B1-5DSE. ويتميز النظام بأنه قابل لإضافة وحدات أخرى من خلال أدراج مراوح ومصادر طاقة قابلة للاستبدال في الموقع، كما يدعم قابلية توفر فائقة ومرونة مذهلة للأعطال. تم تصميم أدراج المراوح للتكرار والتبديل دون إيقاف التشغيل. يوفر نظام تشغيل Cisco IOS® XR7 ميزات برمجية متقدمة تعمل على مراقبة إدارة النظام والأعطال.
المشكلة
تؤثر حالات فشل المروحة في موجهات Cisco NCS XR على تبريد النظام وموثوقيته. تختلف طبيعة وشدة المشكلات باختلاف النظام الأساسي نظرا للاختلافات في تصميم وحدة المروحة وإمكانية الخدمة. هناك العديد من الطرز في سلسلة NCS 540 التي تستخدم وحدات مراوح ثابتة غير قابلة للاستبدال في الموقع مع تصميم وحدات إحتياطية 3+1. هنا، يتطلب فشل المروحة عادة خدمة الوحدة بأكملها أو إستبدالها. ومن المحتمل أن يؤدي ذلك إلى وقت أطول للتوقف عن العمل واستكشاف الأخطاء وإصلاحها بشكل أكثر تعقيدا.
تستخدم وحدات التخزين فئة NCS 560 و 5500 و 5700 والطرز القليلة في السلسلة NCS 540 أدراج مراوح قابلة للاستبدال في الموقع وقابلة لإضافة وحدات أخرى ومصممة خصيصا لإتاحة إمكانية التكرار والتبديل دون إيقاف التشغيل. وهذا يسمح بالتشغيل المستمر أثناء حالات فشل المروحة الواحدة ويتيح إمكانية صيانة أكثر سهولة دون إيقاف تشغيل النظام.
ويمكن أن يؤدي تعطل المروحة في هذه الأنظمة القابلة لإضافة وحدات أخرى إلى تشغيل تنبيهات النظام، مما يتطلب مراقبة قيود درجة الحرارة المحيطة، كما يتطلب إعادة إدخال درج المروحة في الوقت المناسب للحفاظ على تدفق الهواء واستقرار النظام على النحو الأمثل. وبشكل عام، يتسبب فشل المروحة في موجهات NCS XR في حدوث مخاطر فرط التسخين وتدهور الأداء واحتمال تلف الأجهزة. وهذا يتطلب الاكتشاف والتشخيص الفوري والإجراءات التصحيحية المناسبة المصممة خصيصا لسلسلة الموجهات وبنية المراوح المحددة.
إجراء حل فشل وحدة المروحة النمطية في النظام الأساسي NCS XR
يحدد إجراء أستكشاف أخطاء وحدة المروحة وإصلاحها في أنظمة NCS XR الأساسية بشكل عام نهجا متناسقا، مع إتخاذ إجراءات مادية محددة تختلف بناء على ما إذا كان الطراز يستخدم وحدة مروحة ثابتة أو درج مروحة قابل لإضافة وحدات أخرى.
الخطوة 1. التحقق الأولي من واجهة سطر الأوامر
قم بتسجيل الدخول إلى الموجه في واجهة سطر الأوامر Cisco IOS® XR وقم بتنفيذ هذه الأوامر لتحديد حالة أدراج المراوح والمراوح الفردية. هذه الأوامر مشتركة عبر جميع أنظمة NCS XR الأساسية التي تشغل Cisco IOS® XR.
الخطوة 1.1 التحقق من حالة Plarform: قم بتشغيل هذا الأمر للتعرف على ما إذا كان تعطل درج المروحة أو عطل مروحة أو أكثر في درج المروحة.
نموذج إخراج الأوامر:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show platform
Thu Jul 24 12:33:45.143
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-12Z16G-SYS-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/FT0 N540-FAN OPERATIONAL NSHUT
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
ملاحظة: إذا كانت جميع أدراج المروحة في "وضع التشغيل"، عندها يمكنك الاستنتاج بأن درج المروحة يعمل بشكل جيد. وإلا في حالة عدم تشغيل أي درج مروحة، فهذا يعني أن درج المروحة في حالة فشل.
الخطوة 1.2. التعرف على وحدات المراوح الفاشلة: قم بتشغيل هذا الأمر للتحقق من حالة المراوح الفردية وسرعتها داخل درج المروحة.
نموذج إخراج الأوامر:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show environment fan
Thu Jul 24 12:33:09.673
=========================================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3
-----------------------------------------------------------------------------------------
0/FT0 N540-FAN 25680 0 25440 26130
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
ملاحظة: يمكن أن تشير قيمة '0' أو قيمة RPM أقل بشكل ملحوظ مقارنة بالمراوح الأخرى في نفس علبة الورق إلى وجود مروحة معطلة أو معطلة.
الخطوة 1.3. التحقق من فشل وحدة المروحة النمطية من أجهزة الإنذار: قم بتشغيل هذا الأمر للتحقق من تنبيهات النظام لأجهزة التنبيه المتعلقة بالمروحة.
نموذج السجلات:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show alarms brief system active
Thu Jul 24 12:33:23.874
------------------------------------------------------------------------------------
Active Alarms
------------------------------------------------------------------------------------
Location Severity Group Set Time Description
------------------------------------------------------------------------------------
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Fan 1: Out of tolerance
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
ملاحظة: رسائل التنبيه تشير إلى FAN X: يؤدي عدم التسامح أو "وجود مستشعر في حالة فشل" إلى تأكيد حالات فشل المروحة.
ملاحظة: رسائل التنبيه تشير إلى FAN X: يؤدي عدم التسامح أو "وجود مستشعر في حالة فشل" إلى تأكيد حالات فشل المروحة.
الخطوة 2 - التفتيش البيئي والمادي
يمكن أن تؤثر العوامل البيئية بشكل كبير على تشغيل المروحة والتبريد الكلي للنظام.
-
الظروف المحيطة:
- تحقق من درجة الحرارة المحيطة وتدفق الهواء حول الموجه لضمان أنه داخل حدود التشغيل. يمكن لارتفاع درجة الحرارة أن يجعل المراوح تعمل بجد أكثر أو تفشل قبل الأوان.
- تأكد من عدم وجود أي مرشحات غبار أو مغلفات هواء يمكن سدها أو تثبيتها بشكل غير صحيح، مما يحد من تدفق الهواء.
-
الفحص الفعلي بحثا عن العوائق أو الأضرار:
- فحص وحدة المروحة/الدرج بحثا عن أي حطام مرئي أو أسلاك غير محكم أو عوائق يمكن أن تمنع المراوح من الدوران بحرية. تراكم الأتربة سبب شائع لمشكلات المروحة.
- بالنسبة للأنظمة الأساسية التي تحتوي على أدراج مراوح قابلة لإضافة وحدات أخرى (على سبيل المثال، NCS 560 و NCS 5500 و NCS 5700 وبعض نماذج NCS 540)، إذا كانت آمنة للقيام بذلك وضمن إرشادات التشغيل، فكر في سحب درج المراوح المشتبه فيه بعناية. تحقق بصريا من المراوح الفردية بحثا عن الخوادم النصلية غير الدوارة أو عن تلف مرئي. أثناء عدم توفر الدرج، تحقق من وجود تراكم للأتربة في المراوح وداخل فتحة الهيكل.
- بالنسبة للأنظمة الأساسية التي تحتوي على وحدات مروحة ثابتة (على سبيل المثال، بعض نماذج NCS 540)، يكون الفحص المادي لوحدة المروحة والموصلات محدودا ولكن يجب القيام به مقابل أي علامات خارجية للتلف أو العرقلة.
الخطوة 3. التحقق من المشاكل والأعطال المعروفة
قبل متابعة إستبدال الأجهزة، من المستحسن التحقق من توافق فشل المروحة الذي تم ملاحظته مع أي أخطاء معروفة في البرامج أو الأجهزة.
- أداة البحث عن الأخطاء من Cisco: ابحث في أداة البحث عن الأخطاء (BST) باستخدام كلمات أساسية مثل "فشل مروحة NCS XR"، "مروحة NCS [رقم الطراز]"، وإصدار Cisco IOS® XR المحدد الذي يعمل على جهازك. ابحث عن المشاكل المعروفة التي يمكن أن تتسبب في التقارير الخاطئة للمروحة أو في حالات الفشل الفعلية.
- وثائق دعم Cisco: مراجعة وثائق الدعم الخاصة ب Cisco ومنتديات المجتمع للمشاكل المماثلة التي تم الإبلاغ عنها والحلول البديلة أو الإصلاحات الموصى بها.
الخطوة 4- الإجراءات التصحيحية والاستبدال
تعتمد الخطوات التالية على نوع وحدة المروحة النمطية في نظام NCS XR الأساسي.
بالنسبة لمنصات NCS XR مع وحدات المراوح الثابتة (على سبيل المثال، بعض نماذج NCS 540)
والطرز التي تحتوي على وحدات مراوح ثابتة لا تكون عادة قابلة للتبديل دون إيقاف التشغيل.
- دورة الطاقة: إذا لم تحل الفحوص الأولية والتعديلات البيئية المشكلة، قم بتنفيذ دورة طاقة للموجه. قد يؤدي ذلك أحيانا إلى مسح المشاكل العابرة والسماح لوحدة المروحة النمطية بإعادة التهيئة بشكل صحيح.
- الاستبدال (RMA): في حالة التأكد من فشل وحدة المروحة بعد دورة الطاقة، فإنها تتطلب عادة "ترخيص المواد المسترجعة" (RMA) للوحدة أو الهيكل بأكمله.
ملاحظة: يتطلب إستبدال وحدة مروحة ثابتة التوقف عن العمل بشكل مخطط له نظرا لأنه يجب إيقاف تشغيل الموجه.
بالنسبة لمنصات NCS XR مع أدراج المراوح النمطية (على سبيل المثال، معظم طرز NCS 540 و NCS 560 و NCS 5500 و NCS 5700)
تتميز هذه الأنظمة بأدراج مراوح قابلة للتبديل دون إيقاف التشغيل قابلة لإضافة وحدات أخرى.
-
إعادة الإعداد (مقبس الخروج ومقبس الدخول - جوجي):
- قم بإجراء مقبس خارجي ومقبس دخل (JOJI) بعناية على درج المروحة الذي يحتوي على وحدة (وحدات) المروحة المعطلة. وهذا يتضمن إزالة درج المروحة فعليا ثم إعادة إدخاله.
- أثناء سحب درج المروحة، قم بإجراء فحص بصري شامل لأي حطام أو أسلاك لاك مفككة يمكن أن تمنع المراوح من الدوران. كما يمكنك أيضا ملاحظة ما إذا كانت جميع المراوح تحاول الدوران عند إعادة الإدخال.
- بعد إعادة التعيين، تحقق من الحالة مرة أخرى باستخدام "إظهار مروحة البيئة".
-
الاستبدال (RMA): إذا كان أي من وحدات المروحة النمطية لا يزال في حالة فشل أو كانت درج المروحة لا يعمل بعد إعادة التعيين، فقم بالمتابعة مع RMA لدرج المروحة.
- جمع سجلات الأدلة:تشغيل "show logging" | أدخل المروحة مرة أخرى لالتقاط السجلات المتعلقة بدرج المروحة JOJI لأغراض التوثيق.
نموذج السجلات:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- تجميع معرف المنتج (PID) والرقم التسلسلي (SN): يمكنك الحصول على معرف العملية (PID) والشبكة الخاصة (SN) لدرج المروحة المعيب، والمطلوبين لعملية ترخيص المواد المسترجعة.
نموذج إخراج الأوامر:
Command Syntax:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "NCS 540 Fan"
PID: N540-FAN , VID: N/A, SN: N/A
- تابع مع RMA: ابدأ عملية RMA مع Cisco لدرج المروحة المعيب.