Introduction
Este documento descreve as etapas para solucionar um problema em que o blade não é detectado devido ao erro de estado de energia do servidor - MC.
Prerequisites
Requirements
A Cisco recomenda que você tenha um conhecimento funcional destes tópicos:
- Cisco Unified Computing System (UCS)
- Interconexão de estrutura (FI) da Cisco
Componentes Utilizados
As informações neste documento são baseadas nestas versões de software e hardware:
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Se a rede estiver ativa, certifique-se de que você entenda o impacto potencial de qualquer comando.
Informações de Apoio
- Atualização do firmware do blade, o servidor caiu após a reinicialização da política de tempo de atividade.
- Algum evento de energia no data center.
Acima pode ser o possível desencadeador do problema.
Problema
Essa mensagem de erro ocorre durante uma reinicialização ou durante a descoberta.
"Não é possível alterar o estado de energia do blade"
O UCSM relata esse alerta para um blade que não é ligado
O blade reinicializado como parte da atualização do firmware ou qualquer outra manutenção não consegue detectar/ativar com a mensagem abaixo no FSM:
"Não é possível alterar o estado de energia do servidor - Erro MC (-20): O controlador de gerenciamento não pode ou não processou a solicitação(sam:dme:ComputePhysicalTurnup:Execute)"
Os registros SEL mostram entradas de erro como abaixo:
CIMC | Alerta da plataforma POWER_ON_FAIL #0xde | Falha preditiva desafirmada | Desafirmado
CIMC | Alerta da plataforma POWER_ON_FAIL #0xde | Falha preditiva confirmada | Redigido
Troubleshoot
A partir da shell CLI do UCSM, conecte-se ao cimc do blade e verifique o status de energia do blade usando o comando power
- ssh FI-IP-ADDR
- connect cimc X
- alimentação
Failure Scenario # 1
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ active ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
Failure Scenario #2
OP:[ status ]
Power-State: [ off ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ permanent lock ] <<<----------------
Power-System-Status: [ Bad ] <<<---------------
Front-Panel Power Button: [ Disabled ]
Front-Panel Reset Button: [ Disabled ]
OP-CCODE:[ Success ]
Resultado do cenário de trabalho #
[ help ]# power
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ active ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
[ power ]#
Verifique o valor do sensor #
POWER_ON_FAIL | disco -> | discreta | 0x0200 | n | n | n | n | n | n | >> Não funcional
Número do sensor
POWER_ON_FAIL | disco -> | discreta | 0x0100 | n | n | n | n | n | n | >> Trabalhando
Execute o comando sensors e verifique os valores dos sensores de energia e voltagem. Compare a saída com o mesmo modelo do blade que está no estado ligado.
Se Reading or Status (Leitura ou Status), as colunas forem NA para determinados sensores, essa pode não ser a falha de hardware o tempo todo.
Logs snippet#

Sel.log#
CIMC | Alerta da plataforma POWER_ON_FAIL #0xde | Falha preditiva confirmada | Redigido
power-on-fail.hist dentro de tmp/techsupport_pidXXXX/CIMCX_TechSupport-nvram.tar.gz)

Se o acima não ajudar e como próxima etapa, colete o pacote de log UCSM e Chassis techsupport.
Isso ajuda a investigar o problema.
Com os sintomas mencionados anteriormente, tente estes passos para recuperar o problema.
Passo 1: Verifique se o status do FSM do blade está "Failed" com a descrição "state-MC Error(-20)".
Navegue até Equipment > Chassis X > Server Y > FSM

Passo 2: Anote o número de série do blade afetado e Desative o blade.
<<< IMP: Anote o número de série do blade de problema na guia Geral antes de desativá-lo. Ela será necessária posteriormente na Etapa 4 >>
Navegue até Equipment > Chassis X > Server Y > General > Server Maintenance > Decommission > Ok.

Etapa 3. FI-A/B#reset slot x/y
Por exemplo, #Chassis2-Server 1 é afetado.
FI-A# reiniciar slot 2/1
Aguarde de 30 a 40 segundos após executar o comando acima

Etapa 4: recompensar o blade que foi desativado.
Navegue até Equipamento > Descomissionado > Servidores > Procure o servidor que desativamos (Encontre o blade correto com o número de série anotado na Etapa 2 antes de descomissionar) > Marque a caixa de seleção Reconmissão em relação ao blade correto (Validar com número de série) > Salvar alterações.

Etapa 5: Resolva o slot, se observado.
Navegue até Equipment > Chassis X > Server Y.
Se você receber o pop-up "Resolver problema do slot" para o blade que você recomissionou, verifique seu número de série e clique em "aqui" para aceitar o servidor no slot.


A descoberta do blade deve começar agora.
Aguarde até que a descoberta do servidor seja concluída. Monitore o progresso na guia Server FSM (FSM do servidor).
Etapa 6. Se a etapa um a cinco não ajudar e o FSM falhar novamente, desative o blade e tente RECOLOCAR fisicamente.
Se ainda assim o servidor não conseguir descobrir o contato com o Cisco TAC se esse for um problema de hardware.
NOTE: If you have B200 M4 blade and notice failure scenario #2 , please refer following bug and Contact TAC
CSCuv90289
B200 M4 fails to power on due to POWER_SYS_FLT
Informações Relacionadas
Procedimento para descobrir o chassi
Guia de gerenciamento de servidor UCSM