المقدمة
يوضح هذا المستند كيفية أستكشاف أخطاء وحدة FAN النمطية وإصلاحها في ASR9k.
المتطلبات الأساسية
المتطلبات
توصي Cisco بأن تكون لديك معرفة بالمواضيع التالية:
ملاحظة: cisco يوصي أن أنت ينبغي يتلقى منفذ إلى cisco IOS® XR CLI و admin CLI.
المكونات المستخدمة
تستند المعلومات الواردة في هذا المستند إلى إصدارات البرامج والمكونات المادية التالية:
- وتشتمل سلسلة ASR 9000 على مجموعة من الطرز، من بينها ASR 9001 و ASR 9006 و ASR 9010 و ASR 9901 و ASR 9906 و ASR 9910 و ASR 9912 و ASR 9922، من بين نماذج أخرى.
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك قيد التشغيل، فتأكد من فهمك للتأثير المحتمل لأي أمر.
معلومات أساسية
تعد موجهات خدمات التجميع (ASR9k) من السلسلة Cisco ASR 9000 موجهات عالية الأداء تم تصميمها لشبكات مزود الخدمة، وتوفر قابلية تطوير وموثوقية وميزات متقدمة لدعم متطلبات بيئات الشبكة. توفر موجهات ASR9k بنية أجهزة قابلة لإضافة وحدات أخرى وتسمح بالتهيئة والتوسعة بمرونة لتلبية متطلبات الشبكة المتنوعة.
تتضمن عائلة الموجه ASR9k ما يلي:
· تصميم قابل لإضافة وحدات أخرى: تتميز موجهات ASR9k بمكونات قابلة لإضافة وحدات أخرى مثل معالجات المسار وبطاقات الخط وأدراج المراوح، فضلا عن تمكين الترقيات والصيانة بسهولة دون مقاطعة عمليات الشبكة.
· نظام التبريد: على سبيل المثال، يستخدم الطراز ASR 9001 درج مروحة أحادي يمكن الوصول إليه من الأمام يحتوي على مراوح إحتياطية لضمان التبريد المستمر. تدعم درج المروحة تدفق الهواء من جانب إلى آخر، ومن الإصدار 4.3.0 فصاعدا من البرنامج، يسمح بإدخال الهواء وإزالته (OIR) عبر الإنترنت مع بعض قيود درجة الحرارة المحيطة، مما يساعد على تحسين قابلية الصيانة.
· الإتاحة العالية: تدعم الفئة ASR9k مصادر الطاقة والمراوح الاحتياطية، مما يساهم في تحقيق درجة عالية من التوفر ويقلل من وقت التوقف عن العمل إلى الحد الأدنى.
· الأداء وقابلية التطوير: نظرا لتصميمها للتعامل مع التجميع على نطاق واسع والتوجيه الطرفي، تدعم موجهات ASR9k سعة معالجة عالية وبروتوكولات توجيه متقدمة مناسبة للشبكات المركزية والطرفية لمزودي الخدمة.
· ميزات البرامج: تقوم الموجهات بتشغيل برنامج Cisco IOS® XR، الذي يوفر موثوقية وقابلية تعديل وبرمجة من فئة شركة النقل لدعم متطلبات الشبكة المتطورة.
المشكلة
يمكن أن يؤدي تعطل وحدة المروحة أو درج المروحة في موجه ASR 9000 إلى تبريد غير كاف، مما يؤدي إلى التسخين الزائد لمكونات الأجهزة الحيوية. وقد يؤدي هذا الارتفاع الزائد في درجة الحرارة إلى عدم إستقرار النظام أو انخفاض الأداء أو حالات إيقاف التشغيل غير المتوقعة أو تلف الأجهزة الدائم، مما يؤثر في نهاية المطاف على توفر الشبكة وموثوقية الخدمة. ونظرا للدور الحاسم لنظام التبريد في الحفاظ على سلامة الجهاز، يعد اكتشاف أعطال المروحة في الوقت المناسب والتخفيف من حدتها أمرا ضروريا لمنع أعطال الشبكة والحفاظ على التوفر العالي في بيئات موفري الخدمة.
إجراء حل فشل وحدة المروحة النمطية في ASR9k
يحدد إجراء أستكشاف أخطاء وحدات المروحة وإصلاحها في موجهات سلسلة ASR 9000 بشكل عام توجها ثابتا عبر الطرز، مع إتخاذ إجراءات مادية محددة تختلف باختلاف ما إذا كان الطراز يستخدم وحدة مروحة ثابتة أو درج مروحة قابل لإضافة وحدات أخرى.
الخطوة 1. التحقق الأولي من واجهة سطر الأوامر
قم بتسجيل الدخول إلى الموجه في واجهة سطر الأوامر Cisco IOS® XR وقم بتنفيذ هذه الأوامر لتحديد حالة أدراج المراوح والمراوح الفردية. هذه الأوامر شائعة عبر جميع الأنظمة الأساسية ASR 9000 التي تشغل برنامج Cisco IOS® XR.
الخطوة 1.1 فحص حالة Plarform: قم بتشغيل هذا الأمر للتعرف على ما إذا كان تعطل درج المروحة أو عطل مروحة أو أكثر في درج المروحة.
نموذج إخراج الأوامر:
RP/0/RSP0/CPU0:ASR-9006#show platform
Wed Jul 16 12:16:00.408 IST
Node Type State Config state
--------------------------------------------------------------------------------
0/RSP0/CPU0 A9K-RSP5-SE(Active) IOS XR RUN NSHUT
0/RSP1/CPU0 A9K-RSP5-SE(Standby) IOS XR RUN NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/0/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/0/0 A9K-MPA-20X1GE OK
0/1/CPU0 A9K-8X100GE-SE IOS XR RUN NSHUT
0/2/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/2/0 A9K-MPA-20X10GE OK
0/PT0 A9K-DC-PEM-V2 OPERATIONAL NSHUT
RP/0/RSP0/CPU0:ASR-9006#
ملاحظة: إذا كانت جميع أدراج المروحة في "وضع التشغيل"، عندها يمكنك الاستنتاج بأن درج المروحة يعمل بشكل جيد. وإلا في حالة عدم تشغيل أي درج مروحة، فهذا يعني أن درج المروحة في حالة فشل.
الخطوة 1.2. التعرف على وحدات المراوح الفاشلة: قم بتشغيل هذا الأمر للتحقق من حالة المراوح الفردية وسرعتها داخل درج المروحة.
نموذج إخراج الأوامر:
RP/0/RSP0/CPU0:ASR-9006#admin show environment fan
Wed Jul 16 12:16:09.843 IST
=============================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3 FAN_4 FAN_5
-----------------------------------------------------------------------------
0/FT0 ASR-9006-FAN-V2 - 7710 7590 8970 7500 7530
0/FT1 ASR-9006-FAN-V2 7590 7560 7590 7590 7560 7560
0/PT0-PM0 PWR-2KW-DC-V2 8022 8559
0/PT0-PM1 PWR-2KW-DC-V2 6280 6237
0/PT0-PM2 PWR-2KW-DC-V2 7914 8559
0/PT0-PM3 PWR-2KW-DC-V2 7978 8516
RP/0/RSP0/CPU0:ASR-9006#
ملاحظة: يمكن أن تشير شرطة المرور (-) أو قيم RPM الأقل بشكل ملحوظ مقارنة بالمراوح الأخرى الموجودة في نفس الدرج إلى وجود مروحة معطلة أو معطلة.
الخطوة 1.3. التحقق من فشل وحدة المروحة النمطية من السجلات: قم بتشغيل هذا الأمر للتحقق من سجلات النظام للتنبيهات المتعلقة بالمروحة.
نموذج السجلات:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:2025 Jul 10 07:52:41.797 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:53:42.798 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:54:43.800 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:55:44.799 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
الخطوة 2 - التفتيش البيئي والمادي
يمكن أن تؤثر العوامل البيئية بشكل كبير على تشغيل المروحة والتبريد الكلي للنظام.
-
الظروف المحيطة:
- تحقق من درجة الحرارة المحيطة وتدفق الهواء حول الموجه لضمان أنه داخل حدود التشغيل. يمكن لارتفاع درجة الحرارة أن يجعل المراوح تعمل بجد أكثر أو تفشل قبل الأوان.
- تأكد من عدم وجود أي مرشحات غبار أو مغلفات هواء يمكن سدها أو تثبيتها بشكل غير صحيح، مما يحد من تدفق الهواء.
-
الفحص الفعلي بحثا عن العوائق أو الأضرار:
- فحص وحدة المروحة/الدرج بحثا عن أي حطام مرئي أو أسلاك غير محكم أو عوائق يمكن أن تمنع المراوح من الدوران بحرية. تراكم الأتربة سبب شائع لمشكلات المروحة.
- بالنسبة للطرز التي تحتوي على أدراج مراوح قابلة لإضافة وحدات أخرى (على سبيل المثال، ASR 9006 و 9010 و ASR 99xx)، اسحب درج المراوح المشتبه فيه بعناية إذا كانت آمنة للقيام بذلك وضمن الإرشادات التشغيلية. تحقق بصريا من المراوح الفردية بحثا عن الخوادم النصلية غير الدوارة أو عن تلف مرئي. أثناء عدم توفر الدرج، تحقق من وجود تراكم للأتربة في المراوح وداخل فتحة الهيكل.
- بالنسبة للطرز التي لا تحتوي على وحدات مروحة ثابتة (على سبيل المثال، ASR 9001)، يكون الفحص المادي لوحدة المروحة والموصلات محدودا ولكن يظل يتعين إجراؤه بحثا عن أي علامات خارجية للتلف أو العرقلة.
الخطوة 3. التحقق من المشاكل والأعطال المعروفة
قبل متابعة إستبدال الأجهزة، من المستحسن التحقق من توافق فشل المروحة الذي تم ملاحظته مع أي أخطاء معروفة في البرامج أو الأجهزة.
- أداة البحث عن الأخطاء من Cisco: ابحث في أداة البحث عن الأخطاء (BST) من Cisco باستخدام كلمات أساسية مثل "فشل المروحة ASR 9000"، "المروحة ASR [رقم الطراز]"، وإصدار Cisco IOS® XR المحدد الذي يعمل على جهازك. ابحث عن المشاكل المعروفة التي يمكن أن تتسبب في التقارير الخاطئة للمروحة أو في حالات الفشل الفعلية.
- وثائق دعم Cisco: مراجعة وثائق دعم Cisco ومنتديات المجتمع للمشاكل المماثلة التي تم الإبلاغ عنها والحلول البديلة أو الإصلاحات الموصى بها.
الخطوة 4- الإجراءات التصحيحية والاستبدال
تعتمد الخطوات التالية على نوع وحدة المروحة النمطية في موجه من السلسلة ASR 9000 لديك.
بالنسبة لسلسلة ASR 9000 ذات وحدات المروحة الثابتة (على سبيل المثال، ASR 9001) :
تحتوي الطرز مثل ASR 9001 على وحدة مروحة ثابتة غير قابلة للتبديل دون إيقاف التشغيل.
- دورة الطاقة: إذا لم تحل الفحوص الأولية والتعديلات البيئية المشكلة، قم بتنفيذ دورة طاقة للموجه. قد يؤدي ذلك أحيانا إلى مسح المشاكل العابرة والسماح لوحدة المروحة النمطية بإعادة التهيئة بشكل صحيح.
- الاستبدال (RMA): في حالة التأكد من فشل وحدة المروحة بعد دورة الطاقة، فإنها تتطلب عادة ترخيص بضائع الإرجاع (RMA) للهيكل بالكامل.
ملاحظة: يتطلب إستبدال وحدة مروحة ثابتة التوقف عن العمل بشكل مخطط له نظرا لأنه يجب إيقاف تشغيل الموجه.
بالنسبة لسلسلة ASR 9000 التي تتضمن أدراج مراوح قابلة لإضافة وحدات أخرى (على سبيل المثال، الطرز ASR 9006 و ASR 9010 و ASR 99xx)
تتميز هذه الطرز بأدراج مراوح قابلة للتبديل دون إيقاف التشغيل.
-
إعادة الإعداد (مقبس الخروج ومقبس الدخول - جوجي):
- قم بإجراء مقبس خارجي ومقبس دخل (JOJI) بعناية على درج المروحة الذي يحتوي على وحدة (وحدات) المروحة المعطلة. وهذا يتضمن إزالة درج المروحة فعليا ثم إعادة إدخاله.
- أثناء سحب درج المروحة، قم بإجراء فحص بصري شامل لأي حطام أو أسلاك لاك مفككة يمكن أن تمنع المراوح من الدوران. كما يمكنك أيضا ملاحظة ما إذا كانت جميع المراوح تحاول الدوران عند إعادة الإدخال.
- بعد إعادة التعيين، تحقق من الحالة مرة أخرى باستخدام "مروحة بيئة عرض المسؤول".
-
الاستبدال (RMA): إذا كانت وحدة (وحدات) المروحة لا تزال في حالة فشل أو كانت درج المروحة لا يعمل بعد إعادة التعيين، فعليك بالمتابعة مع RMA لدرج المروحة.
- جمع سجلات الأدلة:تشغيل " show logging | تضمين المروحة مرة أخرى لالتقاط السجلات المتعلقة بدرج المروحة JOJI لأغراض التوثيق.
نموذج السجلات:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- جمع معرف المنتج (PID) والرقم التسلسلي (SN):الحصول على معرف المنتج (PID) وشبكة SN الخاصين بدرج المروحة المعيب، والمطلوبين لعملية RMA.
نموذج إخراج الأوامر:
Command Syntax:
RP/0/RSP0/CPU0:ASR-9006# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RSP0/CPU0:ASR-9006# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "ASR-9006 Fan Tray V2"
PID: ASR-9006-FAN-V2 , VID: V02, SN: FOC222XXX
- تابع مع RMA: ابدأ عملية RMA مع Cisco لدرج المروحة المعيب.