소개
이 문서에서는 서버 전원 상태 MC 오류로 인해 블레이드가 검색되지 않는 문제를 해결하는 단계에 대해 설명합니다.
사전 요구 사항
요구 사항
Cisco에서는 다음 주제에 대한 실무 지식을 얻을 것을 권장합니다.
- Cisco UCS(Unified Computing System)
- Cisco Fabric Interconnect(FI)
사용되는 구성 요소
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다.이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다.네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 이해해야 합니다.
배경 정보
- 블레이드 펌웨어 업그레이드, 가동 시간 정책 재부팅 후 서버가 다운되었습니다.
- 데이터 센터의 일부 전력 이벤트입니다.
위의 사항이 문제의 트리거일 수 있습니다.
문제
이 오류 메시지는 재부팅 또는 검색 중에 발생합니다.
"블레이드 전원 상태를 변경할 수 없습니다."
UCSM은 전원이 켜지지 않는 블레이드에 대해 이 경고를 보고합니다.
펌웨어 업그레이드의 일환으로 블레이드를 재부팅하거나 기타 유지 관리 작업에서 FSM에서 아래 메시지를 검색/턴업하지 못했습니다.
"서버 전원 상태-MC 오류를 변경할 수 없습니다(-20).관리 컨트롤러가 요청을 처리할 수 없거나 실패했습니다(sam:dme:ComputePhysicalTurnup:Execute)."
SEL 로그는 다음과 같이 오류 항목을 표시합니다.
CIMC | 플랫폼 경고 POWER_ON_FAIL #0xde | 예측 실패 설정 해제됨 | 설정 해제됨
CIMC | 플랫폼 경고 POWER_ON_FAIL #0xde | 예측 실패 어설션 | 설정됨
문제 해결
UCSM CLI 셸에서 블레이드의 cimc에 연결하고 power 명령을 사용하여 블레이드 전원 상태를 확인합니다.
- SSH FI-IP-ADDR
- cimc X 연결
- 전원
Failure Scenario # 1
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ active ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
Failure Scenario #2
OP:[ status ]
Power-State: [ off ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ permanent lock ] <<<----------------
Power-System-Status: [ Bad ] <<<---------------
Front-Panel Power Button: [ Disabled ]
Front-Panel Reset Button: [ Disabled ]
OP-CCODE:[ Success ]
작업 시나리오 #의 출력
[ help ]# power
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ active ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
[ power ]#
센서 값 # 확인
POWER_ON_FAIL | 디스크 -> | 불연속 | 0x0200 | na | na | na | na | na | na | >> 비작동
센서 값 번호
POWER_ON_FAIL | 디스크 -> | 불연속 | 0x0100 | na | na | na | na | na | na | >>> 작업
sensor 명령을 실행하고 전원 및 전압 센서의 값을 확인합니다.출력을 블레이드의 동일한 모델 전원이 켜진 상태와 비교합니다.
Reading(읽기) 또는 Status(상태) 열이 특정 센서에 대해 NA이면 항상 하드웨어 오류가 아닐 수 있습니다.
로그 코드 조각#

Sel.log#
CIMC | 플랫폼 경고 POWER_ON_FAIL #0xde | 예측 실패 어설션 | 설정됨
power-on-fail.hist in the tmp/techsupport_pidXXXX/CIMCX_TechSupport-nvram.tar.gz)

위 단계에서 도움이 되지 않는 경우 다음 단계로 UCSM 및 섀시 기술 지원 로그 번들을 수집합니다.
문제를 더 자세히 조사하는 데 도움이 됩니다.
앞서 언급한 증상과 함께 다음 단계를 수행하여 문제를 해결하십시오.
1단계:"state-MC Error(-20)" 설명과 함께 블레이드 FSM 상태가 "Failed(실패)"인지 확인합니다.
Equipment(장비) > Chassis X(섀시 X) > Server Y(서버 Y) > FSM으로 이동합니다.

2단계:영향을 받은 블레이드 일련 번호를 기록하고 블레이드 사용을 해제합니다.
<<IMP:General(일반) 탭에서 Problem Blade Serial Number(문제 블레이드 일련 번호)를 해제한 후 종료합니다.4단계 >>>의 이후 단계에서 필요합니다.
Equipment(장비) > Chassis X(섀시 X) > Server Y(서버 Y) > General(일반) > Server Maintenance(서버 유지 관리) > Decommission(서비스 해제) > Ok(확인)로 이동합니다.

3단계. FI-A/B# 재설정 슬롯 x/y
예를 들어 #Chassis2-Server 1이 영향을 받습니다.
FI-A# 재설정 슬롯 2/1
위의 명령을 실행한 후 30-40초 동안 대기

4단계: 서비스 해제된 블레이드를 다시 처리합니다.
Equipment(장비) > Discounted(서비스 해제) > Servers(서버) > Look for the server we disrusted (서비스 해제 전 2단계에서 일련 번호가 표시된 올바른 블레이드 찾기) > Check Recommission Tick box against correct Blade(일련 번호로 검증) > Save Changes(변경 사항 저장)로 이동합니다.

5단계: 슬롯(관찰된 경우)을 확인합니다.
Equipment(장비) > Chassis X(섀시 X) > Server Y(서버 Y)로 이동합니다.
재의뢰한 블레이드에 대해 "슬롯 문제 해결" 팝업이 나타나면 일련 번호를 확인하고 "여기"를 클릭하여 슬롯에 있는 서버를 승인합니다.


블레이드 검색을 지금 시작해야 합니다.
서버 검색이 완료될 때까지 기다립니다.Server FSM(서버 FSM) 탭에서 진행 상황을 모니터링합니다.
6단계. 1단계에서 5단계까지 해도 문제가 해결되지 않고 FSM이 다시 실패하면 블레이드를 해제하고 물리적으로 재장착합니다.
여전히 서버가 하드웨어 문제인 경우 Cisco TAC에 대한 연결을 검색할 수 없는 경우
NOTE: If you have B200 M4 blade and notice failure scenario #2 , please refer following bug and Contact TAC
CSCuv90289
B200 M4 fails to power on due to POWER_SYS_FLT
관련 정보
섀시 검색 절차
UCSM 서버 관리 가이드