Introduction
Ce document décrit les étapes de dépannage d'un problème où la lame ne parvient pas à détecter en raison d'une erreur MC d'état d'alimentation du serveur.
Conditions préalables
Conditions requises
Cisco recommande que vous ayez une connaissance pratique de ces sujets :
- Cisco Unified Computing System (UCS)
- Interconnexion de fabric Cisco (FI)
Components Used
Les informations contenues dans ce document sont basées sur les versions de matériel et de logiciel suivantes :
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si votre réseau est en ligne, assurez-vous de bien comprendre l’incidence possible des commandes.
Informations générales
- Mise à niveau du micrologiciel de la lame, le serveur est arrêté après le redémarrage de la stratégie de disponibilité.
- Événement d'alimentation dans le centre de données.
Ci-dessus pourrait être le déclencheur possible de la question.
Problème
Ce message d'erreur se produit lors d'un redémarrage ou de la découverte.
« Impossible de modifier l'état d'alimentation de la lame »
UCSM signale cette alerte pour une lame qui ne parvient pas à être mise sous tension
Lame redémarrée dans le cadre de la mise à niveau du micrologiciel ou toute autre maintenance ne parvient pas à détecter/activer avec le message ci-dessous dans FSM :
“ Impossible de modifier l'état d'alimentation du serveur - Erreur MC(-20) : Le contrôleur de gestion ne peut pas ou n'a pas pu traiter la demande(sam:dme:ComputePhysicalTurnup:Execute) ”
Les journaux SEL affichent les entrées d'erreur comme suit :
CIMC | Alerte de plate-forme POWER_ON_FAIL #0xde | Échec prédictif désactivé | Déassermenté
CIMC | Alerte de plate-forme POWER_ON_FAIL #0xde | Défaillance prédictive affirmée | Affirmé
Dépannage
À partir du shell CLI UCSM, connectez-vous à cimc de la lame et vérifiez l'état de l'alimentation de la lame à l'aide de la commande power
- ssh FI-IP-ADDR
- connect cimc X
- alimentation
Failure Scenario # 1
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ active ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
Failure Scenario #2
OP:[ status ]
Power-State: [ off ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ permanent lock ] <<<----------------
Power-System-Status: [ Bad ] <<<---------------
Front-Panel Power Button: [ Disabled ]
Front-Panel Reset Button: [ Disabled ]
OP-CCODE:[ Success ]
Sortie du scénario de travail #
[ help ]# power
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ active ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
[ power ]#
Vérifier la valeur de capteur #
ÉCHEC_ALIMENTATION | disque -> | discret | 0x0200 | na | na | na | na | na | na | »> Non opérationnel
Valeur du capteur#
ÉCHEC_ALIMENTATION | disque -> | discret | 0x0100 | na | na | na | na | na | na | »> Fonctionnement
Exécutez des capteurs et vérifiez les valeurs des capteurs d'alimentation et de tension. Comparez la sortie avec le même modèle de la lame est sous tension.
Si les colonnes Lecture ou État sont NA pour certains capteurs, il se peut qu'il ne s'agisse pas toujours d'une défaillance matérielle.
N° extrait de journal

N° journal
CIMC | Alerte de plate-forme POWER_ON_FAIL #0xde | Défaillance prédictive affirmée | Affirmé
power-on-fail.hist dans le fichier tmp/techsupport_pidXXXX/CIMCX_TechSupport-nvram.tar.gz)

Si les éléments ci-dessus n'aident pas et comme étape suivante, collectez l'ensemble de journaux d'assistance technique UCSM et Châssis.
Il permet d'approfondir la question.
Avec les symptômes mentionnés précédemment, essayez ces étapes pour récupérer le problème.
Étape 1 : Vérifiez que l'état FSM de la lame est “ Échec ” avec la description “ état-MC Error(-20) ”.
Accédez à Équipement > Châssis X > Serveur Y > FSM

Étape 2 : Notez le numéro de série de la lame affectée et décodez la lame.
« IMP : Notez le numéro de série de la lame de problème dans l'onglet Général avant de le désaffecter. Elle sera requise ultérieurement à l’étape 4 »>
Accédez à Équipement > Châssis X > Serveur Y > Général > Maintenance du serveur > Désaffectation > Ok.

Étape 3. IF-A/B# reset slot x/an
Par exemple, #Chassis2-Server 1 est affecté.
FI-A# slot 2/1 reset
Attendez 30 à 40 secondes après avoir exécuté la commande ci-dessus

Étape 4 : Recommandez la lame qui a été désactivée.
Accédez à Équipement > Désaffecté > Serveurs > Rechercher le serveur que nous avons désaffecté (Rechercher la lame correcte avec le numéro de série noté à l'étape 2 avant désaffectation) > Cochez la case Recommission Tick (Confirmer) sur la lame correcte (Valider avec le numéro de série) > Enregistrer les modifications.

Étape-5 : Résoudre le logement, le cas échéant.
Accédez à Équipement > Châssis X > Serveur Y.
Si vous recevez “ fenêtre contextuelle Résolution du problème de logement ” pour la lame que vous avez redémarrée, vérifiez son numéro de série et cliquez sur “ ici ” pour accepter le serveur dans le logement.


La découverte des lames doit commencer dès maintenant.
Patientez jusqu'à ce que la découverte du serveur soit terminée. Surveillez la progression dans l'onglet Serveur FSM.
Étape 6. Si les étapes 1 à 5 ne vous aident pas et que le FSM échoue à nouveau, déconnectez la lame et essayez de la REDÉMARRER physiquement.
Si le serveur n'est toujours pas en mesure de découvrir le centre d'assistance technique de Cisco en cas de problème matériel.
NOTE: If you have B200 M4 blade and notice failure scenario #2 , please refer following bug and Contact TAC
CSCuv90289
B200 M4 fails to power on due to POWER_SYS_FLT
Informations connexes
Procédure de découverte du châssis
Guide de gestion des serveurs UCSM