소개
이 문서에서는 하드웨어 문제로 인해 실패하는 패브릭 클러스터의 단일 APIC를 교체하기 위해 사용되는 프로세스에 대해 설명합니다.
문제
작동 가능한 ACI(Application Centric Infrastructure) 패브릭이 있으며 APIC(Application Policy Infrastructure Controller)가 실패했습니다. 이 오류는 하드웨어 문제와 관련이 있는 것으로 확인되었으며 전체 장치를 교체해야 합니다.
솔루션
이 문제를 해결하려면 다음 단계를 완료하십시오.
- 장애가 발생한 APIC 및 현재 패브릭 설정을 식별합니다.
- 운영 APIC의 웹 인터페이스에서 System > Controllers를 선택합니다.
- 화면 왼쪽에서 Controllers(컨트롤러) > (any APIC) > Cluster(클러스터)를 선택합니다.
- 장애가 발생한 APIC가 Operational State(작동 상태) 열에 Unavailable(사용할 수 없음)로 표시됩니다. 장애가 발생한 APIC의 패브릭 이름, 대상 크기, 노드 ID 및 TEP(Tunnel End Point) 주소 공간을 기록해 둡니다.
팁: acidiag avread 명령을 APIC의 CLI에 입력하여 이 정보를 얻을 수도 있습니다.
- 장애가 발생한 APIC를 해제합니다.
- 장애가 발생한 APIC를 강조 표시합니다.
- Actions(작업) 드롭다운 목록에서 Decommission(서비스 해제)을 선택합니다. 이제 APIC가 Out of Service Admin(서비스 불능 관리) 상태로 변경될 수 있습니다.
- 랙에서 장애가 발생한 APIC를 제거하고 교체품을 설치합니다. 새 APIC는 초기 설정 스크립트로 부팅할 수 있습니다.
- 1단계에서 수집한 정보를 사용하여 실패한 APIC의 값을 확인하고 설정 스크립트를 진행합니다.
참고: 패브릭 이름, 컨트롤러 ID, TEP 주소 풀과 같이 이전 APIC에서 기록한 것과 동일한 컨피그레이션 설정을 사용해야 합니다. 동일한 설정으로 APIC를 구성하지 못하면 패브릭이 부분적으로 분기된 상태로 전환될 수 있습니다. 또한 대체 APIC는 나머지 2개의 APIC와 동일한 버전의 ACI 소프트웨어를 실행해야 클러스터에 가입할 수 있습니다.
- 새로운 APIC에 커미션을 적용합니다.
- APIC가 부팅되면 Cluster(클러스터) 페이지에서 현재 Out of Service APIC를 강조 표시합니다.
- Actions(작업) 드롭다운 목록에서 Commission(커미션)을 선택합니다.
APIC에서 IP 주소를 수신합니다. 이 주소는 APIC의 웹 인터페이스에 반영됩니다.
참고: 이 작업이 수행되기까지 최대 10분이 소요될 수 있습니다. 새 APIC는 상태(Health State)가 Fully Fit(전체 적합)으로 나타나기 전에 Available(사용 가능) 및 Unavailable(사용 불가능) 운영 상태 사이를 순환할 수도 있습니다.
- 새 APIC가 패브릭에 조인되었는지 확인하려면 새 APIC의 CLI를 사용하여 패브릭에 로그인합니다. 로그인할 때 패브릭의 나머지 부분에 대해 구성된 자격 증명을 사용합니다.