소개
이 문서에서는 UCSM(Unified Computing System Manager) 3.1.3a 릴리스에 도입된 DME(Data Management Engine) 데이터베이스(DB)와 관련된 기능에 대해 설명합니다.
사전 요구 사항
요구 사항
다음 주제에 대한 지식을 보유하고 있으면 유용합니다.
사용되는 구성 요소
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다.
- UCSM 소프트웨어 버전 3.1.3a
- FI(Fabric Interconnect) 6200 시리즈 및 6332 모델
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 미리 숙지하시기 바랍니다.
배경 정보
DME는 시스템 상태 정보를 보유하는 UCSM 소프트웨어 아키텍처의 중심 구성 요소입니다. 정보는 다음에 저장됩니다.
DME DB라는 임베디드 데이터베이스 형태의 로컬 스토리지 FI 디바이스입니다.
스토리지 하드웨어 디바이스 장애로 인해 데이터베이스의 데이터 무결성이 손상될 수 있습니다. UCSM 3.1.3a 릴리스에서는 여러 가지 새로운 기능이 제공됩니다
DME DB의 자동 백업을 통해 손상된 DB를 원활하게 복구하고 데이터를 보호하며 정기 DB 상태 검사를 사용하여 UCSM의 복원력을 향상시킵니다.
UCSM DME 데이터베이스 상태 확인 기능
정기 데이터베이스 상태 확인
UCS Manager는 데이터의 무결성을 검증하기 위해 정기적으로 DB의 상태 검사를 시작합니다.
또한 사용자가 수동으로 상태 검사를 실행하고 DB 무결성을 확인할 수 있습니다.
기본 컨피그레이션 확인
기본적으로 상태 검사는 12시간마다 수행되며, 현재 상태를 표시하려면 다음 명령을 사용합니다.
UCS # scope system
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 12
Last Integrity Check Time: 2017-05-07T14:42:47.019
Internal Backup Interval (days): 14
Last Internal Backup Time: 2017-04-28T14:52:12.648
UCS /system #
간격 변경
시간 간격을 수정하거나 상태 검사를 비활성화할 수 있지만 기본 컨피그레이션은 변경하지 않는 것이 좋습니다.
주의: 이러한 값은 기본값에서 변경하지 않는 것이 좋습니다
이 예에서 간격은 12시간에서 48시간으로 변경됩니다.
UCS /system # set mgmt-db-check-policy health-check-interval 48
UCS /system* # commit-buffer
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 48
Last Integrity Check Time: 2017-05-07T14:42:47.019
Internal Backup Interval (days): 14
Last Internal Backup Time: 2017-04-28T14:52:12.648
상태 검사를 비활성화하려면 값을 0으로 설정합니다.
상태 검사를 수동으로 실행
DB 상태 확인을 확인하려면 다음 명령을 실행할 수 있습니다. 터미널에 메시지가 출력되지 않으면 DB의 상태가 양호합니다.
UCS # scope system
UCS /system # start-db-check
UCS /system* # commit-buffer
또한 모든 오류 메시지가 기본 FI DME 로그 파일(UCSM techsupport 번들의 일부)에 기록됩니다.
[prt:executeHealthCheck] Health Check complete with no corruption
이 명령을 사용하여 DB 상태를 추가로 확인할 수 있습니다.
UCS # scope system
UCS /system # show mgmt-db
Management Database Status:
Fabric Id Corrupted Count Last Occurrence Time
--------- ----------------------- --------------------
A 0 1970-01-01T00:00:00.000
B 0 1970-01-01T00:00:00.000
DB 손상 - 사용자 수준 결함 및 복구 메커니즘
UCSM이 상태 확인 중에 DB의 손상을 탐지하면 오류 메시지가 생성됩니다.
INFO 수준 결함은 한 번 발생한 경우 생성되며, 손상이 두 번 이상 발생한 경우 MAJOR 수준 결함은 기록되므로 추가 조치를 취하고 Cisco TAC에 문의해야 합니다. Techsupport 번들을 수집합니다.
ucs /system # show fault
Severity Code Last Transition Time ID Description
--------- -------- ------------------------ -------- -----------
Info F1899 2017-04-28T01:09:23.332 263649 Management database corruption detected and recovered on Fabric Interconnect B. Number of corruption events: 1. Last corruption event timestamp: 2017-04-28T01:09:23.332
Major F1900 2017-05-02T00:52:07.846 263651 High number of management database corruption events on Fabric Interconnect A. Number of corruption events: 3. Last corruption event timestamp: 2017-05-02T01:06:06.387
복구 메커니즘
UCSM은 서비스나 데이터 플레인 트래픽에 영향을 주지 않고 손상을 자동으로 해결하며 메모리에서 DB를 덮어쓰거나 피어 FI에서 좋은 DB를 복사합니다.
| 손상 이벤트 |
시스템 복구 메커니즘 |
| 기본 FI |
MIT(Memory Management Information Tree)에서 데이터베이스 복구 |
| 하위 FI |
데이터베이스 파일이 기본 FI에서 검색됨 |
손상 수 재설정
DB 손상은 수동으로 지울 때까지 지속됩니다. 예를 들어 손상을 해결하기 위해 추가 조사를 기반으로 FI 하드웨어를 교체한 경우 이 명령을 실행하여 손상 결함 수를 재설정할 수 있습니다.
ucs-A # scope system
ucs-A /system # set mgmt-db-check-policy reset-corruption-count yes
ucs-A /system* # commit-buffer
정기 백업
데이터 보호를 극대화하기 위해 UCSM은 UCSM 컨피그레이션(DME DB)의 전체 상태 백업을 2주마다 수행하므로 복구 용도로 사용할 수 있습니다.
또한 DB 무결성 검사가 검증되어 백업에는 정상 상태의 컨피그레이션이 포함됩니다.
전체 상태 백업 파일은 각 FI의 /workspace/backup 디렉토리에 저장됩니다.
UCS # connect local-mgmt
UCS(local-mgmt)# dir backup/
1 1823454 Apr 28 14:53:23 2017 internalBackup.1493391132.tgz
백업 작업 간격 변경
백업 작업의 빈도는 1일에서 60일로 변경할 수 있습니다. 이 예에서 보여주는 것처럼 값을 28일로 변경했습니다.
UCS # scope system
UCS /system # set mgmt-db-check-policy internal-backup-interval 28
UCS /system* # commit-buffer
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 24
Last Integrity Check Time: 2017-05-10T10:35:24.909
Internal Backup Interval (days): 28
Last Internal Backup Time: 2017-04-28T14:52:12.648
UCS /system #
관련 정보