المقدمة
يصف هذا المستند عملية تشغيل أداة التحقق من صحة مدير نظام الحوسبة الموحدة (UCSM) ومرحلة ما قبل الترقية.
المتطلبات الأساسية
المتطلبات
cisco يوصي أن يتلقى أنت Python 3،6 أو متأخر ركبت على النظام.
ملاحظة: إذا كنت تقوم بتشغيل نظام التشغيل Windows OS، فيمكنك تثبيت Python وتكوينه لمسار البيئة.
ملاحظة: لا تفتح حالة مركز المساعدة الفنية لفشل تشغيل إصدار/برنامج نصي ل Python. أحلت ال CLI أمر قسم أن يعين يدويا الإصدار وفتح TAC حالة لكل يعين إصدار.
المكونات المستخدمة
لا يقتصر هذا المستند على إصدارات برامج ومكونات مادية معينة.
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك قيد التشغيل، فتأكد من فهمك للتأثير المحتمل لأي أمر.
معلومات أساسية
أداة التحقق من UCSM هي أداة مساعدة لإجراء عمليات التحقق الذاتي الاستباقية على UCSM لضمان استقرارها ومرونتها. وهو يساعد على أتمتة قائمة التحقق من الصحة وما قبل الترقية على أنظمة UCS لتوفير الوقت عند إجراء عمليات ترقية البنية الأساسية ل UCS وصيانتها.
ملاحظة: قم دائما بتنزيل أحدث إصدار من الأداة واستخدامها. بما أن الأداة يتم تحسينها بشكل متكرر، عندما تستخدم إصدار أقدم، فإنه يمكن أن تفقد تحققات مهمة.
ملاحظة: هذا النص هو أفضل جهد، نص حر. غير أنه لا يمكن أن يحدد جميع المسائل.
متى تستخدمه
- قبل ترقيات بنية UCS الأساسية
- التحقق من صحة UCS قبل نشاط الصيانة وبعده
- عندما تعمل مع Cisco TAC
- فحص الحماية الاستباقية في أي وقت
كيف تستخدمه
نظام التشغيل Windows
الخطوة 1. تنزيل أحدث إصدار من Python من تنزيلات Python
الخطوة 2. أستخدم عملية التثبيت العادية وانقر فوق تثبيت الآن (الخطوة الموصى بها)، لتنزيل الإعداد.
ملاحظة: تأكد من إضافة بايثون إلى المسار.

الخطوة 3. انتقل إلى الدليل الذي تم تثبيت Python فيه على النظام.
الخطوة 4. افتح موجه الأمر واكتب الأمر Python للتحقق من تثبيت Python.

الخطوة 5. قم بتنزيل أحدث إصدار من البرنامج النصي للتحقق من الصحة من هنا وحفظه في مجلد. الآن، استخرج الملف المضغوط، كما هو موضح في الصورة.

الخطوة 6. تنزيل و حفظ أحدث سجلات الدعم الفني ل UCSM إلى المجلد الذي تم إنشاؤه، كما هو موضح في الصورة. طقطقت هذا خطوة أن يجد ال steps أن يجلب UCSM سجل حزمة: إنشاء الدعم التقني UCSM.
الخطوة 7. افتح CMD وCD إلى المجلد حيث يوجد UCSMTool.py وقم بتشغيل UCSMTool.py كما هو موضح في الصورة.

يدخل خطوة 8. الملف ممر حيث ال UCSM دعم مبرد يكون واخترت خيار ب رغب.
1. التحقق من صحة UCSM
2. التحقق السابق للتحديث

ماك أو إس
خطوة 1. يأتي MacOS مع تثبيت Python افتراضي. تحقق من إصدار Python المثبت كما هو موضح:

ملاحظة: في حال كان إصدار Python أقل من 3.6، يرجى الترقية إلى 3.6 والإصدارات الأحدث.
ملاحظة: إذا كان إصدار Python هو 3.6 أو إصدار أحدث، فقفز إلى الخطوة 5، وإلا، فقفز إلى الخطوة 2.
الخطوة 2. قم بتنزيل أحدث إصدار من Python من إصدارات Python لوحدات الماكرو.
الخطوة 3. أستخدم عملية التثبيت العادية لإكمال/ترقية تثبيت Python.
الخطوة 4. قم بتنزيل أحدث إصدار من البرنامج النصي للتحقق من الصحة من هنا واحفظه إلى مجلد. الآن، استخرج الملف المضغوط، كما هو موضح في هذه الصورة:

الخطوة 5. تنزيل و حفظ أحدث سجلات الدعم الفني ل UCSM إلى المجلد الذي تم إنشاؤه، كما هو موضح في هذه الصورة. طقطقت الخطوة أن يجد ال steps أن يجلب UCSM سجل حزمة: إنشاء الدعم التقني UCSM.

الخطوة 6. افتح الوحدة الطرفية، واستعرض إلى الدليل حيث لديك البرنامج النصي لفحص الصحة الذي تم تنزيله، ثم قم بتشغيل python UCSMTool.py أو python3UCSMTool.py كما هو موضح:.

الخطوة 7. أدخل مسار الملف حيث يوجد ملف الدعم الفني UCSM، واختر الخيار المرغوب لتشغيل البرنامج النصي.
1. التحقق من صحة UCSM
- فحص ما قبل الترقية

فهم المخرجات/عمليات الفحص التي تم إجراؤها
عمليات التحقق التي تم إجراؤها بواسطة UCSM HealthCheck
يتم إجراء هذه التحققات بواسطة UCSM-HealthCheckTool:
- حالة تجمع UCSM HA: يعرض حالة نظام المجموعة لمنافذ الموصلات البينية الليفية.
- حالة عملية PMON: يعرض حالة جميع العمليات في مدير CiscoUCS.
- تثبيت نظام الملفات: يعرض جدول التحميل.
- تحقق من وجود مشكلة في /var/ sysmgr size: عمليات التحقق /var/ sysmgr.
- تحقق من وجود مشكلة في /var/ حجم tmp: تحقق مما إذا كان /var/ tmp إستخدامات.
- جهاز 6296 Fi غير سريع الاستجابة بعد دورة الطاقة، تحديث مراجعة الأجهزة: للتحقق من وحدة Fabric Interconnect ورقم مراجعة الأجهزة الخاص بها.
- أخطاء تتعلق بخطورة رئيسية أو خطيرة: تقارير إذا كان لديك أي تنبيه رئيسي أو نقدي في إدارة UCS.
- فحص النسخة الاحتياطية المتوفرة: التحقق من توفر النسخ الاحتياطي في برنامج UCS Manager.
- التحقق من لوحة المفاتيح: التحقق من انتهاء صلاحية حلقة المفاتيح أو صلاحيتها.
- يلزم توفر حل بديل ل SafeHut أم لا: التحقق مما إذا كان إصلاح SafeHut مطلوبا أم لا عن طريق التحقق من نموذج FI وإصداره.
- الأجهزة المهملة في برنامج Cisco UCS Manager، الإصدار 4.x: يتحقق من أي جهاز مهمل في إصدار Cisco UCS Manager 4.x.
- الأجهزة المهملة التي تم العثور عليها ل 3.1.x فصاعدا: يتحقق من أي جهاز مهمل في إصدار Cisco UCS Manager 3.x.
- تحقق من إعادة تمهيد الطراز B200M4 بسبب وجود حقول الطراز MRAID12G فارغة: للتحقق مما إذا كان الخادم طراز B200M4 يحتوي على وحدة تحكم S/N فارغة من الطراز MRAID12G RAID.
- يؤدي تغيير UCSM 3.1 في الحد الأقصى لتخصيص الطاقة إلى فشل اكتشاف الخادم النصلي: يتحقق من سياسة الطاقة التي تم تكوينها في برنامج UCS Manager.
- وجود رمز خطأ تلف Bootflash Corruption F1219: يتحقق من وجود تلف Bootflash.
- فشل التحقق من فشل بدء تشغيل httpd عند حذف حلقة المفاتيح الافتراضية: التحقق من حذف حلقة المفاتيح الافتراضية.
- الجيل الثالث من FIs به حالات غير صحيحة لنظام الملفات-"حالة نظام الملفات: نظف مع وجود أخطاء: يتحقق من وجود خطأ في نظام الملفات.
- تحقق من فشل التثبيت التلقائي للخادم إلى 4.0(4b) في تنشيط وحدة التحكم في محرك أقراص SAS: للتحقق من إصدار البرنامج الثابت المضيف وإصدار موسع SAS.
- تحقق من أن ترقية البرنامج الثابت من السلسلة C-Series لا تزال قيد التشغيل لفترة طويلة، وقم بإجراء جرد للخوادم وجرد أنظمة تشغيل PNU: تحقق من طراز الخادم وإصداره للتعرف على ما إذا كنت قد أصبت بهذه المشكلة.
- تحقق من مجال مصادقة UCSM الذي يستخدم نقطة أو واصلة: للتحقق مما إذا تم تكوين اسم مجال المصادقة باستخدام فترة أو أحرف واصلة.
- فشل المصادقة المحلية أو الاحتياطية: يتحقق من طريقة المصادقة التي تم تكوينها لنموذج FI معين ويتحقق من إصدارها أيضا.
- تحقق من الصحة بين UCSM و UCS Central: يتحقق مما إذا كان UCS Manager مسجلا مع UCS Central.
- فحص VLAN المحجوز: يتحقق مما إذا كانت شبكات VLAN المستخدمة من نطاق شبكات VLAN المحجوزة.
- مجموعات المسامير لشبكة LAN وشبكة التخزين (SAN): تحقق من تكوين تثبيت شبكة LAN/SAN في المجموعة وقم بإبراز مراجعة التكوين قبل الترقية/أي نشاط MW.
- التحقق من الأنشطة المعلقة الموجودة في UCSM: يتحقق من وجود أي أنشطة معلقة في مجال مدير UCS.
- فحص صحة المنظمة الدولية للهجرة: للتحقق من الصحة العامة لوحدات الإدخال/الإخراج.
- الملفات الأساسية المتوفرة في UCSM تحقق: يتحقق من العثور على أي ملف أساسي في غضون 60 يوما.
- تفكيك L2 محتمل misconfiguration: يتحقق ما إذا كان هناك أي سوء تكوين في حالة تكوين L2 مفكك.
- VIC 1400 و 6400 خطوة رفرفة إصدار: يتحقق من الشروط الموجودة في هذا العيب.
- تحقق من 2304 IOMs قم بقطع الاتصال وإعادة الاتصال أثناء تحديث البرنامج الثابت: التحقق من نموذج وحدة الإدخال والإخراج للمنافذ البينية الليفية وتحديد ما إذا كانت هناك أي مشكلة محتملة.
- التحقق من صحة DME: التحقق من صحة قاعدة بيانات محرك إدارة البيانات (DME).
- عدد الواجهات لأعلى ومطابقة الإطارات على FI: يتحقق من عدد الواجهات وجلسة العمل الفعلية.
- فحص JUMBO أو MTU القياسي: يحدد تكوين MTU.
رقم إخراج أداة UCSM العينة
akmalla@ucsm_health_check-master % python3 UCSMTool.py
UCS Health Check Tool 2.0
Enter the UCSM file path: /Users/akmalla/Desktop/UCSM health Script/UCSMlog.tar
Press 1 for UCSM Health Check
Press 2 for PreUpgrade Check
Enter your choice (1/2): 1
Log Extraction: [########################] COMPLETED
UCSM Version: 4.3(2c)
Summary Result:
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| SlNo | Name | Status | Comments |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 1 | UCSM HA Cluster State | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 2 | PMON Process State | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 3 | File System Mount | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 4 | Check for /var/sysmgr size issue | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 5 | Check for /var/tmp size issue | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 6 | 6296 FI unresponsive after power cycle, HW revision update | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 7 | Faults with Severity Major or Severity Critical | Found | Review the faults and Contact TAC, if needed |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 8 | Check Backup Available | Backup Operation Not Found | Backup operation has not been found. Please ensure that the |
| | | | latest backup is captured as a best practice. |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 9 | Keyring Cert Check | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 10 | Safeshut Workaround Needed or Not | Not Needed | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 11 | Deprecated Hardware in Cisco UCS Manager Release 4.x | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 12 | Deprecated HW found for 3.1.x onwards | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 13 | Check for B200M4 reboot due to blank MRAID12G fields | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 14 | UCSM 3.1 Change in max power allocation causes blade discovery | Not Found | |
| | failure | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 15 | Existence of bootflash corruption fault code F1219 | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 16 | Check for httpd fail to start when default keyring is deleted | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 17 | 3rd GEN FIs has unclean file system states-"Filesystem state: | Not Found | |
| | clean with errors" | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 18 | Check for Server Auto-Install to 4.0(4b) Fails to Activate SAS | Not Found | |
| | Controller | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 19 | Check for C-Series firmware upgrade stays long in process | Not Found | |
| | "perform inventory of server" PNU OS Inventory | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 20 | Check UCSM Authentication Domain using a Period or Hyphen | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 21 | Local or fallback Authentication failure | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 22 | Health check between UCSM and UCS central | Not Found | UCS Manager is Not Registered |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 23 | Reserved VLAN Check | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 24 | LAN and SAN Pin Groups | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 25 | Checking Pending Activities Present in UCSM | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 26 | Health Check for IOM | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 27 | Core Files available in UCSM Check | Not Found | No core files were found in last 60 days |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 28 | Disjoint L2 potential misconfiguration | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 29 | VIC 1400 and 6400 Link Flap Issue | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 30 | Check 2304 IOMs disconnect and re-connect during firmware update | Not Found | |
| | step | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 31 | Number of Interface up and Flogi Matching on FI | --- | Primary: |
| | | | FC Port Trunking Count: 0, |
| | | | Eth up Port: 7, |
| | | | Flogi Count: 0 |
| | | | Secondary: |
| | | | FC Port Trunking Count: 0, |
| | | | Eth up Port: 7, |
| | | | Flogi Count: 0 |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 32 | Jumbo or Standard MTU Check | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
Faults with Severity Major:
F0331: Service profile DemoSP cannot be accessed
F0831: lan Member 1/2 of Port-Channel XXXX on fabric interconnect B is down, membership: down
F0858: lan port-channel XXXX on fabric interconnect B oper state: failed, reason: port-channel-members-down
F0831: lan Member 1/2 of Port-Channel XXXX on fabric interconnect A is down, membership: down
F0858: lan port-channel XXXX on fabric interconnect A oper state: failed, reason: port-channel-members-down
NOTE:
a. All reports and logs will be saved in the same location from where the script was executed.
b. Please visit the Summary Report/ Main Report to view all the Major and Critical Fault alerts.
تحليل مخرجات الأداة - الخطوات التالية
- تقوم الأداة بأتمتة عملية تشغيل الأوامر اليدوية على أنظمة UCS.
- إذا كانت الأداة تعمل موافق وتعطي تمرير/عدم العثور على كل الاختبارات. نظام UCS جيد لكل التحققات التي قام البرنامج النصي بتنفيذها.
- في الحالات التي فشلت فيها الأداة /تم العثور على بعض التحققات أو لم يتم تشغيلها بنجاح، يمكنك إستخدام أوامر واجهة سطر الأوامر (المدرجة هنا) لتنفيذ نفس التحققات على UCS System/Fabric Interconnect كما تم ذلك بواسطة البرنامج النصي يدويا.
- لا تقوم الأداة بالتحقق من وجود أي تحذيرات قديمة/جديدة/مفتوحة/تم حلها، ومن ثم يوصى بشدة بمراجعة ملاحظات إصدار UCS وأدلة الترقية قبل أي نشاط ترقية أو صيانة.
تلميح: للتحقق من الصحة العامة لبيئة UCS، لا يوفر Cisco TAC هذه الخدمة. يحتوي فريق توصيل العملاء CX (المعروف سابقا باسم الخدمات المتقدمة) من Cisco على تحليل الأخطاء/المخاطر الذي يقدمه. إذا كنت تريد هذا النوع من الخدمات، فاتصل بفريق المبيعات/الحساب.
أوامر CLI
يربط SSH إلى كلا الموصلات البينية الليفية:
# show cluster extended-state, verify HA status is ready.
# connect local-mgmt ; # show pmon state, Verify the services are in running status.
# connect nxos ; # show system internal flash, Verify free size in /var/sysmgr and /var/tmp
# connect nxos ; # show module, verify HW revision number for 6296 fabric interconnects.
# show fault detail | include F1219, verify this fault code for bootflash corruption
# scope eth-uplink; # show reserved-vlan
# show iom health status, displays health of IOM
# show server status, verify the status of server.
# scope monitoring; # scope sysdebug; # show cores , verify if there are any core files.
# scope security; # scope keyring default; #show detail, verify details for default keyring, expiry etc.
# connect nxos; # show int br | grep -v down | wc –l, verify the number of active Ethernet interfaces.
# scope security; # show authentication, review the authentication type.
# connect nxos; # show flogi database, review the flogi database.