Introduction
Este documento descreve a conectividade de rede suportada para várias redes envolvidas na implantação de cluster de 3 nós do Cisco DNA Center.
Prerequisites
Familiarize-se com as informações básicas sobre o cluster do Cisco DNA Center de 3 nós e a alta disponibilidade lendo os seguintes artigos:
Guia de instalação do Cisco DNA Center - Este guia descreve passo a passo como ativar o cluster de 3 nós.
Guia do administrador do Cisco DNA Center 1.2.x
Guia do administrador do Cisco DNA Center 1.2.10
Descrição
A partir da versão 1.2.8 do Cisco DNA Center, o cluster de alta disponibilidade de 3 nós é compatível com automação básica e automação de acesso SD. Em 1.2.8/1.2.10, a alta disponibilidade ainda está na versão Beta para Garantia.
A alta disponibilidade (HA) do Cisco DNA Center oferece mais resiliência e reduz o tempo de inatividade quando um nó ou serviços ou um link de rede ficam inativos. Quando ocorre uma falha, essa estrutura ajuda a restaurar sua rede para seu estado operacional anterior. Se isso não for possível, o Cisco DNA Center indicará que há um problema que requer sua atenção.
Sempre que a estrutura HA do Cisco DNA Center determina que uma alteração em um nó de cluster ocorreu, ela sincroniza essa alteração com os outros nós. Os tipos de sincronização suportados incluem:
-
Alterações no banco de dados, como atualizações relacionadas aos dados de configuração, desempenho e monitoramento.
-
Alterações de arquivos, como configurações de relatório, modelos de configuração, diretório raiz TFTP, configurações de administração, arquivos de licenciamento e o armazenamento de chaves.
O software atual do Cisco DNA Center suporta um cluster mínimo de 3 nós para alta disponibilidade. Quando o cluster é configurado, ele pode gerenciar a falha de nó único. São necessários no mínimo 2 nós para definir o quórum. Sem um quórum de 2 nós, o cluster será declarado inativo. Se você estiver usando o SD-Access Fabric, a falha do cluster só resultará em falha de provisionamento de automação, mas ainda assim o tráfego de rede do usuário da malha SD-Access continuará a ser encaminhado, já que o DNA Center não é responsável por nenhum tráfego de controle ou dados.
Neste documento, examinaremos vários pontos de falha e como o cluster minimiza o tempo de inatividade para manter o Cisco DNA Center operacional o tempo todo. Focaremos principalmente nos aspectos de conectividade de rede do cluster de 3 nós. Para obter serviços e todas as outras informações, consulte o guia de instalação e administração.
Conectividade de rede:
O Cisco DNA Center usa os seguintes tipos de conectividade de rede:
1. Link de cluster de 10 Gbps
2. GUI/link de gerenciamento de 1 Gbps
3. Link para nuvem de 1 Gbps (opcional)
4. Link empresarial de 10 Gbps
5. Link CIMC de 1 Gbps
Pressupõe-se que a resolução IP-ARP entre clusters apropriada ocorra e a conectividade é garantida entre todos os 3 nós. Além disso, é recomendável ter <10ms RTT entre os links de cluster para todos os cenários.
Cenários de falha e comportamento do cluster:
Em geral, a redistribuição de serviços de cluster acontece sob a seguinte condição:
1. Um único nó fica inativo: Os serviços serão distribuídos para os 2 nós restantes e o cluster ainda estará operacional.
2. O link de rede corporativa fica inativo para um único nó: Não há redistribuição de serviços. Somente a acessibilidade à rede corporativa a partir do nó com falha não funcionará.
3. O link Rede de Cluster é desativado: Os serviços serão redistribuídos para os 2 nós restantes e o cluster ainda estará operacional.
4. Todos os outros links de rede ficam inativos, exceto o link do cluster para um único nó: o nó não poderá atender às funções esperadas, mas todos os serviços e clusters funcionarão normalmente.
5. Falha de serviço em nó único: O serviço tentará reiniciar. Na maioria dos cenários, ele tentará reiniciar no mesmo nó, mas atualmente não há afinidade com o nó para que ele possa iniciar em qualquer nó.
6. O switch de rede cai: Dependendo dos diferentes tipos de topologia, o cluster operará normalmente ou o serviço será redistribuído ou tudo ficará inoperante.
Opção de Topologia Física-1
Inicialmente, a Engenharia sugeriu seguir a conectividade de rede. A Figura 1 e a Figura 2 fornecem a conectividade onde cada tipo de link de rede de todos os nós está conectado ao mesmo switch físico. Por exemplo: O link de rede corporativa de todos os 3 nós está conectado ao mesmo switch físico.
Figura 1

Figura 2

A topologia acima fornece os seguintes tipos de cenário de falha em que o cluster ainda estará operacional.
1. falha de nó único
2. Falha de link de rede corporativa
3. Falha no link do cluster
4. Falha de serviço
A topologia acima não conseguirá gerenciar o switch completo para nenhum dos links de rede.
Condição de falha |
Impacto / Estado do cluster |
Nó único para baixo |
O cluster ainda estará operacional com 2 nós restantes. |
Link único inativo para qualquer link de rede |
O cluster continuará funcionando normalmente. Os serviços serão distribuídos somente se o link do cluster ficar inoperante. |
Switch cai |
O cluster não será utilizável para automação. |
Opção 2 de topologia física (mais recomendada)
A Figura 3 fornece a conectividade onde todo o link de rede do mesmo nó está conectado ao mesmo switch físico. Todos os links de um nó são conectados ao mesmo switch físico com separação usando VLANs ou podem ser conectados a switches diferentes. Por exemplo: O link do Nó 1 é conectado ao Switch 1, os links do Nó 2 são conectados ao Switch 2 e assim por diante.
Figura 3

A topologia acima fornece os seguintes tipos de cenário de falha em que o cluster ainda estará operacional.
1. falha de nó único
2. Falha de link de rede corporativa para nó único
3. Falha de link de cluster para nó único
4. Falha de serviço para nó único
5. Falha de switch de rede único para nó único
Condição de falha |
Impacto / Estado do cluster |
Nó único para baixo |
O cluster ainda estará operacional com 2 nós restantes. |
Link único inativo para qualquer link de rede |
O cluster continuará funcionando normalmente. Os serviços serão distribuídos somente se o link do cluster ficar inoperante. |
Um único switch cai |
O cluster ainda estará operacional com 2 nós restantes. |
Opção de Topologia Física-3 (para o ambiente do tipo Data Center)
Essa topologia é semelhante à Opção 2, exceto que você pode ter 3 switches de Camada 2 conectados ao gateway. Todas as informações são semelhantes à Opção 2.

Opção 4 de topologia física (não recomendada)
A Figura 4 fornece a conectividade onde 2 nós se conectam ao mesmo switch enquanto outro nó está conectado a um switch diferente. Essa topologia é menos recomendada porque a falha no switch que tem vários links conectados pode desativar o cluster.

A topologia acima fornece os seguintes tipos de cenário de falha em que o cluster ainda estará operacional.
1. falha de nó único
2. Falha de link de rede corporativa para nó único
3. Falha de link de cluster para nó único
4. Falha de serviço para nó único
A topologia acima não conseguirá gerenciar o switch completo para nenhum dos links de rede.
Condição de falha |
Impacto / Estado do cluster |
Nó único para baixo |
O cluster ainda estará operacional com 2 nós restantes. |
Link único desativado para qualquer link de rede, exceto link de cluster |
O cluster continuará funcionando normalmente. |
Link de cluster único desativado |
Os serviços serão distribuídos para outros dois nós e continuarão a operação. |
Um único switch cai |
O cluster pode ficar inoperante se o switch que tem vários links ficar inoperante. |
Alguns cenários de falha adicionais e o estado abordados no Guia do Administrador do Cisco DNA Center 1.2.10