此产品的文档集力求使用非歧视性语言。在本文档集中,非歧视性语言是指不隐含针对年龄、残障、性别、种族身份、族群身份、性取向、社会经济地位和交叉性的歧视的语言。由于产品软件的用户界面中使用的硬编码语言、基于 RFP 文档使用的语言或引用的第三方产品使用的语言,文档中可能无法确保完全使用非歧视性语言。 深入了解思科如何使用包容性语言。
思科采用人工翻译与机器翻译相结合的方式将此文档翻译成不同语言,希望全球的用户都能通过各自的语言得到支持性的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 Cisco Systems, Inc. 对于翻译的准确性不承担任何责任,并建议您总是参考英文原始文档(已提供链接)。
本文档介绍如何重建Cisco SD-WAN交换矩阵,包括备份和恢复各种部署的控制器配置。
Cisco 建议您了解以下主题:
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
vManage部署
DR选项
注意:有关灾难恢复类型的更多详细信息,请参阅此链接
组合:
| # | vManage设置 | DR选项 |
|---|---|---|
| 1 | 独立(1个节点) | 无DR |
| 2 | 独立(1个节点) | 单节点DR |
| 3 | 集群(3节点或6节点) | 无DR |
| 4 | 集群(3节点或6节点) | 备用DR群集 |
这些步骤对所有部署组合都通用。它们涵盖启动VM实例和应用基本CLI配置的过程。每个组合部分都会告诉您要部署多少实例以及要完成的其他步骤。
注意:思科已更改某些术语的品牌,因此这些术语可以互换。Cisco vManage = Cisco Catalyst Manager、Cisco vBond = Cisco Catalyst Validator、Cisco vSmart = Cisco Catalyst Controller
从Cisco软件下载页面下载SD-WAN控制器的OVA文件此处:
注意:在ESXi/云平台上使用OVA文件启动vSmart、vBond和vManage控制器。请参阅链接文档,并确保根据SD-WAN部署类型为所有控制器分配足够的CPU、RAM和磁盘。导航到此处以获取其他信息。请确保将辅助磁盘分配给vManage节点,如链接的计算指南的“存储大小*”列中所述。
For a standalone vManage, choose the persona as COMPUTE_AND_DATA.
For a 3 node cluster, on 3 vManage nodes, the persona is set to COMPUTE_AND_DATA.
For a 6 node cluster, on 3 vManage nodes the persona is COMPUTE_AND_DATA and on rest 3 vManage nodes persona DATA.
示例:为COMPUTE_AND_DATA选择1

选择辅助磁盘,如下所示:


示例

注意:您可以在此处引用现有vManage的配置并配置相同的IP地址方案。
Conf t
vpn 0
no interface eth0
vpn 512
interface eth0
ip address
no shutdown
!
ip route 0.0.0.0/0
!
示例:

注意:您可以参考现有vBond中的配置,并在此处配置相同的配置。
Conf t
vpn 0
no interface eth0
vpn 512
interface eth0
ip address
no shutdown
!
ip route 0.0.0.0/0
!
commit
一旦您拥有对所有控制器的SSH访问权限,请在每个控制器上配置这些CLI配置。
config t
system
host-name
system-ip
site-id
organization-name
vbond
commit
注意:如果我们使用URL作为vBond地址,请确保在VPN 0配置中配置DNS服务器IP地址或确保可以解析这些地址。
所有控制器上都需要这些配置,才能启用传输接口,该接口用于与路由器和其余控制器建立控制连接。
config t
vpn 0
dns primary
dns secondary
interface eth1
ip address
tunnel-interface
allow-service all
allow-service dhcp
allow-service dns
allow-service icmp
no allow-service sshd
no allow-service netconf
no allow-service ntp
no allow-service stun
allow-service https
!
no shutdown
!
ip route 0.0.0.0/0
commit
注:您可以参考现有控制器的配置,如果配置存在,则您可以将此配置添加到新控制器。
仅当需要路由器使用TLS与vManage节点建立安全控制连接时,才将控制协议配置为TLS。默认情况下,所有控制器和路由器都使用DTLS建立控制连接。根据您的要求,此配置是仅在vSmart和vManage节点上必需的可选配置。
Conf t
security
control
protocol tls
Commit
确保活动的Cisco SD-WAN Manager实例数与新安装的Cisco SD-WAN Manager实例数相同。
确保所有活动实例和新的Cisco SD-WAN Manager实例都运行相同的软件版本。
确保所有活动实例和新的Cisco SD-WAN Manager实例能够到达Cisco SD-WAN Validator的管理IP地址。
确保证书已安装在新安装的Cisco SD-WAN Manager实例上。
确保所有Cisco Catalyst SD-WAN设备(包括新安装的Cisco SD-WAN Manager)上的时钟都同步。
确保在新安装的Cisco SD-WAN Manager实例上配置一组新的系统IP和站点ID,同时配置与活动集群相同的基本配置。




例如,如果我们使用自己的CA(企业证书颁发机构),请选择Enterprise。


如果是20.15/20.18 vManage节点,请导航到配置>设备>控制组件。对于20.9/20.12版本,请选择Configuration > Devices > Controllers
注意:我们需要将vBondor的管理凭据用作netadmingroup的用户部分。您可以在vBond的CLI中验证这一点。如果我们需要为vBond安装新证书,请在“生成CSR”的下拉列表中选择是。
注意:如果vBond位于NAT设备/防火墙之后,请检查vBond VPN 0接口IP是否已转换为公共IP。如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口的公用IP地址。

在20.12 vManage中点击Add vSmart,在20.15/20.18 vManage中点击Add Controller。
系统打开一个弹出窗口,输入vSmart的VPN 0传输IP,可从vManage访问。
如果允许从vManage的CLI到vSmart IP,请使用ping检查可达性。
输入vSmart Note的用户凭据,我们需要使用vSmart的管理员凭据或netadmin组的用户部分。
您可以在vSmart的CLI中验证这一点。
如果打算对路由器使用TLS来建立与vSmart的控制连接,请将协议设置为TLS。此配置也需要在vSmarts和vManage节点的CLI上进行配置。
如果需要为vSmart安装新证书,请在生成CSR"的下拉列表中选择Yes。
注意:如果vSmart位于NAT设备/防火墙之后,请检查vSmart VPN 0接口IP是否已转换为公共IP,如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口IP的公共IP地址。

完成所有步骤后,在Monitor>Dashboard中确认所有控制组件均可访问


确认configuration-db正在vManage节点上运行。
您可以使用request nms configuration-db status命令在vManageCLI上检验相同配置。输出如下所示
vmanage# request nms configuration-db status
NMS configuration database
Enabled: true
Status: running PID:32632 for 1066085s
Native metrics status: ENABLED
Server-load metrics status: ENABLED
vmanage#
使用此命令从已确定的configuration-db领导vManage节点收集configuration-db备份。
request nms configuration-db backup path /opt/data/backup/
预期输出如下所示:
vmanage# request nms configuration-db backup path /opt/data/backup/june18th
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved backup to /opt/data/backup/june18th.tar.gz
sha256sum: 8d0f5af8aee4e70f05e3858be6bdd5e6c136134ae47c383569ec883080f5d359
Removing the temp staging dir :/opt/data/backup/staging
vmanage#
使用SCP将configuration-db备份复制到vManage的/home/admin/目录。
scp命令输出示例:
XXXXXXXXX Downloads % scp june18th.tar.gz admin@10.66.62.27:/home/admin/
viptela 20.15.4.1
(admin@10.66.62.27) Password:
(admin@10.66.62.27) Password:
june18th.tar.gz 0% 255KB 47.2KB/s - stalled -
要恢复configuration-db备份,首先需要配置configuration-db凭据。如果您的配置数据库凭证是默认凭证(neo4j/password),我们可以跳过此步骤。
要配置configuration-db凭证,请使用命令request nms configuration-db update-admin-user。使用您选择的用户名和密码。
请注意,vManage的应用服务器已重新启动。由于此vManage UI在短时间内变得不可访问。
vmanage# request nms configuration-db update-admin-user
configuration-db
Enter current user name:neo4j
Enter current user password:password
Enter new user name:ciscoadmin
Enter new user password:ciscoadmin
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully updated configuration database admin user(this is service node, please repeat same operation on all service/data nodes)
Successfully restarted vManage Device Data Collector
Successfully restarted NMS application server
Successfully restarted NMS data collection agent
vmanage#
发布后,我们可以继续恢复configuration-db备份:
我们可以使用命令request nms configuration-db restore path /home/admin/< >将配置数据库恢复到新的vManage:
vmanage# request nms configuration-db restore path /home/admin/june18th.tar.gz
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Successfully backup database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Configuration database is running in a standalone mode
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully saved cluster configuration for localhost
Successfully saved vManage root CA information for device: "53f95156-f56b-472f-b713-d164561b25b7"
Stopping NMS application server on localhost
Stopping NMS configuration database on localhost
Reseting NMS configuration database on localhost
Loading NMS configuration database on localhost
Starting NMS configuration database on localhost
Waiting for 180s or the instance to start...
NMS configuration database on localhost has started.
Updating DB with the saved cluster configuration data
Successfully reinserted cluster meta information
Successfully reinserted vmanage root ca information
Starting NMS application server on localhost
Waiting for 180s for the instance to start...
Successfully restored database
恢复configuration-db后,请确保vManage UI可访问。等待约5分钟,然后尝试访问UI。
成功登录UI后,请确保边缘路由器列表、模板、策略以及之前或现有vManage UI上存在的所有其余配置都反映在新的vManage UI上。
恢复configuration-db后,我们需要重新验证交换矩阵中的所有新控制器(vmanage/vsmart/vbond)。
注:在实际生产中,如果用于重新身份验证的接口IP是隧道接口IP,则需要确保在vManage、vSmart和vBond的隧道接口以及路径沿途的防火墙上允许NETCONF服务。要打开的防火墙端口是从DR群集到所有vBonds和vSmarts的双向规则的TCP端口830。
在vmanage UI上,点击Configuration > Devices > Controllers


所有控制器入网后,请完成以下步骤:
在新活动集群中的任何Cisco SD-WAN Manager服务器上,执行以下操作:
输入以下命令将根证书与新活动集群中的所有Cisco Catalyst SD-WAN设备同步:
https://vmanage-url/dataservice/system/device/sync/rootcertchain
输入以下命令将Cisco SD-WAN Manager UUID与Cisco SD-WAN Validator同步:
https://vmanage-url/dataservice/certificate/syncvbond
一旦交换矩阵恢复,并且交换矩阵中的所有边缘和控制器的控制和bfd会话都已启动,我们就需要从UI使旧控制器(vmanage/vsmart/vbond)失效
注意:继续此处所示的“后检查”部分,它适用于所有部署组合。
确保活动的Cisco SD-WAN Manager实例数与新安装的Cisco SD-WAN Manager实例数相同。
确保所有活动实例和新的Cisco SD-WAN Manager实例都运行相同的软件版本。
确保所有活动实例和新的Cisco SD-WAN Manager实例能够到达Cisco SD-WAN Validator的管理IP地址。
确保证书已安装在新安装的Cisco SD-WAN Manager实例上。
确保所有Cisco Catalyst SD-WAN设备(包括新安装的Cisco SD-WAN Manager)上的时钟都同步。
确保在新安装的Cisco SD-WAN Manager实例上配置一组新的系统IP和站点ID,同时配置与活动集群相同的基本配置。




例如,如果我们使用自己的CA(企业证书颁发机构),请选择Enterprise。


如果是20.15/20.18 vManage节点,请导航到配置>设备>控制组件。对于20.9/20.12版本,Configuration > Devices > Controllers
注意:我们需要将vBondor的管理凭据用作netadmingroup的用户部分。您可以在vBond的CLI中验证这一点。如果我们需要为vBond安装新证书,请在“生成CSR”的下拉列表中选择是
注意:如果vBond位于NAT设备/防火墙之后,请检查vBond VPN 0接口IP是否已转换为公共IP。如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口的公用IP地址

在20.12 vManage中点击Add vSmart,在20.15/20.18 vManage中点击Add Controller。
系统打开一个弹出窗口,输入vSmart的VPN 0传输IP,可从vManage访问。
如果允许从vManage的CLI到vSmart IP,请使用ping检查可达性。
输入vSmart Note的用户凭据,我们需要使用vSmart的管理员凭据或netadmin组的用户部分。
您可以在vSmart的CLI中验证这一点。
如果打算对路由器使用TLS来建立与vSmart的控制连接,请将协议设置为TLS。此配置也需要在vSmarts和vManage节点的CLI上进行配置。
如果需要为vSmart安装新证书,请在生成CSR"的下拉列表中选择Yes。
注意:如果vSmart位于NAT设备/防火墙之后,请检查vSmart VPN 0接口IP是否已转换为公共IP,如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口IP的公共IP地址。

完成所有步骤后,在Monitor>Dashboard中确认所有控制组件均可访问


注意:从已启用灾难恢复的现有vManage节点收集配置数据库备份时,请确保在该节点的灾难恢复暂停和删除后收集配置数据库备份。
确认没有正在进行的灾难恢复复制。导航到管理>灾难恢复和 确保状态为Success且未处于Import Pending、Export Pending或Download Pending等暂时状态。如果状态未成功,请联系Cisco TAC并确保复制成功,然后继续暂停灾难恢复。
首先暂停灾难恢复并确保任务完成。然后删除灾难恢复并确认任务已完成。

联系思科TAC以确保成功清理灾难恢复。
确认configuration-db正在vManage节点上运行。
您可以使用commandrequest nms configuration-db statusonvManageCLI验证相同配置。输出如下所示
vmanage# request nms configuration-db status
NMS configuration database
Enabled: true
Status: running PID:32632 for 1066085s
Native metrics status: ENABLED
Server-load metrics status: ENABLED
vmanage#
使用此命令从已确定的configuration-db领导vManage节点收集configuration-db备份。
request nms configuration-db backup path /opt/data/backup/
预期输出如下所示:
vmanage# request nms configuration-db backup path /opt/data/backup/june18th
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved backup to /opt/data/backup/june18th.tar.gz
sha256sum: 8d0f5af8aee4e70f05e3858be6bdd5e6c136134ae47c383569ec883080f5d359
Removing the temp staging dir :/opt/data/backup/staging
vmanage#
使用SCP将configuration-db备份复制到vManage的/home/admin/目录。
scp命令输出示例:
XXXXXXXXX Downloads % scp june18th.tar.gz admin@10.66.62.27:/home/admin/
viptela 20.15.4.1
(admin@10.66.62.27) Password:
(admin@10.66.62.27) Password:
june18th.tar.gz 0% 255KB 47.2KB/s - stalled -
要恢复configuration-db备份,首先需要配置configuration-db凭据。如果您的配置数据库凭证是默认凭证(neo4j/password),我们可以跳过此步骤。
要配置configuration-db凭据,请使用命令request nms configuration-db update-admin-user。使用您选择的用户名和密码。
请注意,vManage的应用服务器已重新启动。由于此vManage UI在短时间内变得不可访问。
vmanage# request nms configuration-db update-admin-user
configuration-db
Enter current user name:neo4j
Enter current user password:password
Enter new user name:ciscoadmin
Enter new user password:ciscoadmin
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully updated configuration database admin user(this is service node, please repeat same operation on all service/data nodes)
Successfully restarted vManage Device Data Collector
Successfully restarted NMS application server
Successfully restarted NMS data collection agent
vmanage#
发布后,我们可以继续恢复configuration-db备份:
我们可以使用命令request nms configuration-db restore path /home/admin/< >将配置数据库恢复到新的vManage:
vmanage# request nms configuration-db restore path /home/admin/june18th.tar.gz
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Successfully backup database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Configuration database is running in a standalone mode
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully saved cluster configuration for localhost
Successfully saved vManage root CA information for device: "53f95156-f56b-472f-b713-d164561b25b7"
Stopping NMS application server on localhost
Stopping NMS configuration database on localhost
Reseting NMS configuration database on localhost
Loading NMS configuration database on localhost
Starting NMS configuration database on localhost
Waiting for 180s or the instance to start...
NMS configuration database on localhost has started.
Updating DB with the saved cluster configuration data
Successfully reinserted cluster meta information
Successfully reinserted vmanage root ca information
Starting NMS application server on localhost
Waiting for 180s for the instance to start...
Successfully restored database
恢复configuration-db后,请确保vManage UI可访问。等待约5分钟,然后尝试访问UI。
成功登录UI后,请确保边缘路由器列表、模板、策略以及之前或现有vManage UI上存在的所有其余配置都反映在新的vManage UI上。
请参阅步骤2:组合2中的预检查:独立式vManage +单节点DR,并确保我们已经完成所有要求,然后继续启用灾难恢复。
VPN 0中的带外集群接口
vManage的最小配置,如图所示
config t
system
host-name
system-ip
site-id
organization-name
vbond
commit
注意:如果我们使用URL作为vBond地址,请确保在VPN 0配置中配置DNS服务器IP地址或确保可以解析这些地址。
需要使用这些配置来启用传输接口,该接口用于与路由器和控制器的其余部分建立控制连接
config t
vpn 0
dns primary
dns secondary
interface eth1
ip address
tunnel-interface
allow-service all
allow-service dhcp
allow-service dns
allow-service icmp
no allow-service sshd
no allow-service netconf
no allow-service ntp
no allow-service stun
allow-service https
!
no shutdown
!
ip route 0.0.0.0/0
commit
还要配置VPN 512管理接口以启用对控制器的带外管理访问。
Conf t
vpn 512
interface eth0
ip address
no shutdown
!
ip route 0.0.0.0/0
!
commit
在vManage节点上配置服务接口。此接口用于DR通信,
conf t
interface eth2
ip address
no shutdown
commit
确保主vManage和DR vManage上的服务接口使用相同的IP子网
继续执行Combination 2部分下给出的步骤:独立vManage +单节点DR第3步:配置vManage UI、证书和板载控制器,以在灾难恢复vManage上安装证书。

填写完毕后,单击“下一步”。
填写vBond控制器详细信息。
vBond控制器必须在指定的IP地址中通过Netconf到达。
凭证必须是netadmin用户(dradmin)的凭证,并且配置DR后不得更改这些凭证。
为此,建议vBond在本地配置此dadmin用户,或者您可以使用管理员用户添加vBond。


在复制计划中,设置“复制间隔”’.每次复制间隔时间,都会从主复制数据 vManageto辅助vManage。最小可配置值为15分钟。


请注意,vManage GUI在此过程中重新启动。
完成后,必须看到Success状态。

导航到管理→灾难恢复查看灾难恢复状态以及上次复制数据的时间。

恢复configuration-db后,我们需要重新验证交换矩阵中的所有新控制器(vmanage/vsmart/vbond)
注:在实际生产中,如果用于重新身份验证的接口IP是隧道接口IP,则需要确保在vManage、vSmart和vBond的隧道接口以及路径沿途的防火墙上允许NETCONF服务。要打开的防火墙端口是从DR群集到所有vBonds和vSmarts的双向规则的TCP端口830。
在vmanage UI上,点击Configuration > Devices > Controllers

所有控制器入网后,请完成以下步骤:
在新活动集群中的任何Cisco SD-WAN Manager服务器上,执行以下操作:
输入以下命令将根证书与新活动集群中的所有Cisco Catalyst SD-WAN设备同步:
https://vmanage-url/dataservice/system/device/sync/rootcertchain
输入以下命令将Cisco SD-WAN Manager UUID与Cisco SD-WAN Validator同步:
https://vmanage-url/dataservice/certificate/syncvbond
一旦交换矩阵恢复,并且交换矩阵中的所有边缘和控制器的控制和bfd会话都已启动,我们就需要从UI使旧控制器(vmanage/vsmart/vbond)失效
注意:继续此处所示的“后检查”部分,它适用于所有部署组合。
所需实例:
步骤:
确保活动的Cisco SD-WAN Manager实例数与新安装的Cisco SD-WAN Manager实例数相同。
确保所有活动实例和新的Cisco SD-WAN Manager实例都运行相同的软件版本。
确保所有活动实例和新的Cisco SD-WAN Manager实例能够到达Cisco SD-WAN Validator的管理IP地址。
确保证书已安装在新安装的Cisco SD-WAN Manager实例上。
确保所有Cisco Catalyst SD-WAN设备(包括新安装的Cisco SD-WAN Manager)上的时钟都同步。
确保在新安装的Cisco SD-WAN Manager实例上配置一组新的系统IP和站点ID,同时配置与活动集群相同的基本配置。




例如,如果我们使用自己的CA(企业证书颁发机构),请选择Enterprise。


如果是20.15/20.18 vManage节点,请导航到配置>设备>控制组件。对于20.9/20.12版本,Configuration > Devices > Controllers
注意:我们需要将vBondor的管理凭据用作netadmingroup的用户部分。您可以在vBond的CLI中验证这一点。如果我们需要为vBond安装新证书,请在“生成CSR”的下拉列表中选择是
注意:如果vBond位于NAT设备/防火墙之后,请检查vBond VPN 0接口IP是否已转换为公共IP。如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口的公用IP地址

在20.12 vManage中点击Add vSmart,在20.15/20.18 vManage中点击Add Controller。
系统打开一个弹出窗口,输入vSmart的VPN 0传输IP,可从vManage访问。
如果允许从vManage的CLI到vSmart IP,请使用ping检查可达性。
输入vSmart Note的用户凭据,我们需要使用vSmart的管理员凭据或netadmin组的用户部分。
您可以在vSmart的CLI中验证这一点。
如果打算对路由器使用TLS来建立与vSmart的控制连接,请将协议设置为TLS。此配置也需要在vSmarts和vManage节点的CLI上进行配置。
如果需要为vSmart安装新证书,请在生成CSR"的下拉列表中选择Yes。
注意:如果vSmart位于NAT设备/防火墙之后,请检查vSmart VPN 0接口IP是否已转换为公共IP,如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口IP的公共IP地址。

完成所有步骤后,在Monitor>Dashboard中确认所有控制组件均可访问


注意:vManage集群可以配置3个vManage节点或6个vManage节点,具体取决于注册到SD-WAN交换矩阵的站点数量。请参考现有的vManage集群,并根据该集群选择节点数。
config t
system
host-name
system-ip
site-id
organization-name
vbond
commit
注意:如果我们使用URL作为vBond地址,请确保在VPN 0配置中配置DNS服务器IP地址或确保可以解析这些地址。
需要使用这些配置来启用传输接口,该接口用于与路由器和其余控制器建立控制连接。
config t
vpn 0
dns primary
dns secondary
interface eth1
ip address
tunnel-interface
allow-service all
allow-service dhcp
allow-service dns
allow-service icmp
no allow-service sshd
no allow-service netconf
no allow-service ntp
no allow-service stun
allow-service https
!
no shutdown
!
ip route 0.0.0.0/0
commit
还要配置VPN 512管理接口以启用对控制器的带外管理访问。
Conf t
vpn 512
interface eth0
ip address
no shutdown
!
ip route 0.0.0.0/0
!
Commit
可选配置:
Conf t
security
control
protocol tls
commit
在所有vManagenode(包括已注册的vManage-1)上配置服务接口。此接口用于集群通信,即集群中vManagenodes之间的通信。
conf t
interface eth2
ip address
no shutdown
commit
确保同一IP子网用于vManagecluster中所有节点上的服务接口。
我们可以使用与vManagenode相同的管理凭据配置vManagecluster。否则,我们可以配置作为netadmingroup一部分的新用户凭据。配置新用户凭据的配置如下所示
conf t
system
aaa
user
password
group netadmin
commit
确保在属于群集的所有vManagenode上配置相同的用户凭据。如果我们决定使用管理员凭据,则必须在所有vManagenode上配置相同的用户名/密码。
如果是20.15/20.18 vManage节点,请导航到Configuration > Certificates > Control Components 。对于20.9/20.12版本,Configuration > Devices > Controllers
单击Manager/vManage的……并单击Generate CSR。

生成CSR后,您可以下载CSR并根据为控制器选择的证书颁发机构对其进行签名。您可以在管理>设置>控制器证书授权中验证此配置。如果选择思科(推荐),则vManage会自动将CSR上传到PNP门户,并且证书签名后,会自动将其安装到vManage上。
如果选择“手动”,请通过导航到相应SD-WAN重叠的智能帐户和虚拟帐户,使用思科PNP门户手动签署CSR。如果使用Digicert和企业根证书,则适用相同步骤。
证书从PNP门户可用后,点击vManage同一部分的安装证书,然后上传证书并安装证书。
跨属于集群的所有vManage节点完成此步骤。
注意:对于有3个节点的集群,所有3个vManage节点都以计算+数据作为角色。

注意:请参阅现有集群中的此配置以启用SDAVC — 仅当需要且仅在集群的一个vManage节点上需要时,才需要选中。
点击Update。




在将下一个节点添加到集群之前,需要考虑以下几点:
请验证到目前为止已添加到集群的vManage节点的所有UI上的以下点:
所有控制器入网后,请完成以下步骤:
注意:从已启用灾难恢复的现有vManage群集收集配置数据库备份时,请确保在该节点上的灾难恢复暂停并删除后收集配置数据库备份。
确认没有正在进行的灾难恢复复制。导航到管理>灾难恢复和 确保状态为Success且未处于Import Pending、Export Pending或Download Pending等暂时状态。如果状态未成功,请联系Cisco TAC并确保复制成功,然后继续暂停灾难恢复。
首先暂停灾难恢复并确保任务完成。然后删除灾难恢复并确认任务已完成。

联系思科TAC以确保成功清理灾难恢复。
您可以在vManageCLI上使用requestnmsconfiguration-dbstatus命令验证相同。输出如下所示
vmanage# request nms configuration-db status
NMS configuration database
Enabled: true
Status: running PID:32632 for 1066085s
Native metrics status: ENABLED
Server-load metrics status: ENABLED
vmanage#
vManage-3# request nms configuration-db diagnostics
NMS configuration database
Checking cluster connectivity for ports 7687,7474 ...
Pinging vManage node 0 on 169.254.1.5:7687,7474...
Starting Nping 0.7.80 ( https://nmap.org/nping ) at 2026-02-18 12:41 UTC
SENT (0.0013s) Starting TCP Handshake > 169.254.1.5:7474
RCVD (0.0022s) Handshake with 169.254.1.5:7474 completed
SENT (1.0024s) Starting TCP Handshake > 169.254.1.5:7687
RCVD (1.0028s) Handshake with 169.254.1.5:7687 completed
SENT (2.0044s) Starting TCP Handshake > 169.254.1.5:7474
RCVD (2.0050s) Handshake with 169.254.1.5:7474 completed
SENT (3.0064s) Starting TCP Handshake > 169.254.1.5:7687
RCVD (3.0072s) Handshake with 169.254.1.5:7687 completed
SENT (4.0083s) Starting TCP Handshake > 169.254.1.5:7474
RCVD (4.0091s) Handshake with 169.254.1.5:7474 completed
SENT (5.0106s) Starting TCP Handshake > 169.254.1.5:7687
RCVD (5.0115s) Handshake with 169.254.1.5:7687 completed
Max rtt: 0.906ms | Min rtt: 0.392ms | Avg rtt: 0.724ms
TCP connection attempts: 6 | Successful connections: 6 | Failed: 0 (0.00%)
Nping done: 1 IP address pinged in 5.01 seconds
Pinging vManage node 1 on 169.254.2.5:7687,7474...
========== SNIP ==========
Connecting to 10.10.10.3...
+------------------------------------------------------------------------------------+
| type | row | attributes[row]["value"] |
+------------------------------------------------------------------------------------+
| "StoreSizes" | "TotalStoreSize" | 85828934 |
| "PageCache" | "Flush" | 4268666 |
| "PageCache" | "EvictionExceptions" | 0 |
| "PageCache" | "UsageRatio" | 0.09724264705882353 |
| "PageCache" | "Eviction" | 2068 |
| "PageCache" | "HitRatio" | 1.0 |
| "ID Allocations" | "NumberOfRelationshipIdsInUse" | 2068 |
| "ID Allocations" | "NumberOfPropertyIdsInUse" | 56151 |
| "ID Allocations" | "NumberOfNodeIdsInUse" | 7561 |
| "ID Allocations" | "NumberOfRelationshipTypeIdsInUse" | 31 |
| "Transactions" | "LastCommittedTxId" | 214273 |
| "Transactions" | "NumberOfOpenTransactions" | 1 |
| "Transactions" | "NumberOfOpenedTransactions" | 441742 |
| "Transactions" | "PeakNumberOfConcurrentTransactions" | 11 |
| "Transactions" | "NumberOfCommittedTransactions" | 414568 |
| "Causal Cluster" | "IsLeader" | 1 >>>>>>>>> |
| "Causal Cluster" | "MsgProcessDelay" | 0 |
| "Causal Cluster" | "InFlightCacheTotalBytes" | 0 |
+------------------------------------------------------------------------------------+
18 rows
ready to start consuming query after 388 ms, results consumed after another 13 ms
Completed
Connecting to 10.10.10.3...
Displaying the Neo4j Cluster Status
+---------------------------------------------------------------------------------------------------------------------------------+
| name | aliases | access | address | role | requestedStatus | currentStatus | error | default | home |
+---------------------------------------------------------------------------------------------------------------------------------+
| "neo4j" | [] | "read-write" | "169.254.3.5:7687" | "leader" | "online" | "online" | "" | TRUE | TRUE |
| "neo4j" | [] | "read-write" | "169.254.2.5:7687" | "follower" | "online" | "online" | "" | TRUE | TRUE |
| "neo4j" | [] | "read-write" | "169.254.1.5:7687" | "follower" | "online" | "online" | "" | TRUE | TRUE |
| "system" | [] | "read-write" | "169.254.3.5:7687" | "follower" | "online" | "online" | "" | FALSE | FALSE |
| "system" | [] | "read-write" | "169.254.2.5:7687" | "follower" | "online" | "online" | "" | FALSE | FALSE |
| "system" | [] | "read-write" | "169.254.1.5:7687" | "leader" | "online" | "online" | "" | FALSE | FALSE |
+---------------------------------------------------------------------------------------------------------------------------------+
6 rows
ready to start consuming query after 256 ms, results consumed after another 3 ms
Completed
Total disk space used by configuration-db:
60M .
使用此命令从已确定的configuration-db领导vManage节点收集configuration-db备份。
request nms configuration-db backup path /opt/data/backup/
预期输出如下所示:
vmanage# request nms configuration-db backup path /opt/data/backup/june18th
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved backup to /opt/data/backup/june18th.tar.gz
sha256sum: 8d0f5af8aee4e70f05e3858be6bdd5e6c136134ae47c383569ec883080f5d359
Removing the temp staging dir :/opt/data/backup/staging
vmanage#
使用SCP将configuration-db备份复制到vManage的/home/admin/目录。
scp命令输出示例:
XXXXXXXXX Downloads % scp june18th.tar.gz admin@10.66.62.27:/home/admin/
viptela 20.15.4.1
(admin@10.66.62.27) Password:
(admin@10.66.62.27) Password:
june18th.tar.gz 0% 255KB 47.2KB/s - stalled -
要恢复configuration-db备份,首先需要配置configuration-db凭据。如果您的配置数据库凭证是默认凭证(neo4j/password),我们可以跳过此步骤。
要配置configuration-db凭据,请使用命令request nms configuration-db update-admin-user。使用您选择的用户名和密码。
请注意,vManage的应用服务器已重新启动。由于此vManage UI在短时间内变得不可访问。
vmanage# request nms configuration-db update-admin-user
configuration-db
Enter current user name:neo4j
Enter current user password:password
Enter new user name:ciscoadmin
Enter new user password:ciscoadmin
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully updated configuration database admin user(this is service node, please repeat same operation on all service/data nodes)
Successfully restarted vManage Device Data Collector
Successfully restarted NMS application server
Successfully restarted NMS data collection agent
vmanage#
发布后,我们可以继续恢复configuration-db备份:
我们可以使用命令request nms configuration-db restore path /home/admin/< >将配置数据库恢复到新的vManage:
vmanage# request nms configuration-db restore path /home/admin/june18th.tar.gz
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Successfully backup database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Configuration database is running in a standalone mode
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully saved cluster configuration for localhost
Successfully saved vManage root CA information for device: "53f95156-f56b-472f-b713-d164561b25b7"
Stopping NMS application server on localhost
Stopping NMS configuration database on localhost
Reseting NMS configuration database on localhost
Loading NMS configuration database on localhost
Starting NMS configuration database on localhost
Waiting for 180s or the instance to start...
NMS configuration database on localhost has started.
Updating DB with the saved cluster configuration data
Successfully reinserted cluster meta information
Successfully reinserted vmanage root ca information
Starting NMS application server on localhost
Waiting for 180s for the instance to start...
Successfully restored database
恢复configuration-db后,请确保vManage UI可访问。等待约5分钟,然后尝试访问UI。
成功登录UI后,请确保边缘路由器列表、模板、策略以及之前或现有vManage UI上存在的所有其余配置都反映在新的vManage UI上。
恢复configuration-db后,我们需要重新验证交换矩阵中的所有新控制器(vmanage/vsmart/vbond)
注:在实际生产中,如果用于重新身份验证的接口IP是隧道接口IP,则需要确保在vManage、vSmart和vBond的隧道接口以及路径沿途的防火墙上允许NETCONF服务。要打开的防火墙端口是从DR群集到所有vBonds和vSmarts的双向规则的TCP端口830。
在vmanage UI上,点击Configuration > Devices > Controllers

所有控制器入网后,请完成以下步骤:
在新活动集群中的任何Cisco SD-WAN Manager服务器上,执行以下操作:
输入以下命令将根证书与新活动集群中的所有Cisco Catalyst SD-WAN设备同步:
https://vmanage-url/dataservice/system/device/sync/rootcertchain
输入以下命令将Cisco SD-WAN Manager UUID与Cisco SD-WAN Validator同步:
https://vmanage-url/dataservice/certificate/syncvbond
一旦交换矩阵恢复,并且交换矩阵中的所有边缘和控制器的控制和bfd会话都已启动,我们就需要从UI使旧控制器(vmanage/vsmart/vbond)失效
注意:继续此处所示的“后检查”部分,它适用于所有部署组合。
什么是手动/冷备份DR — 备份SD-WAN Manager服务器或SD-WAN Manager群集在冷备份状态下保持关闭。
对活动数据库进行定期备份,如果主SD-WAN Manager或SD-WAN Manager集群发生故障,则手动启动备用SD-WAN Manager或SD-WAN Manager集群,并在其中恢复备份数据库。
所需实例:
步骤:
确保活动的Cisco SD-WAN Manager实例数与新安装的Cisco SD-WAN Manager实例数相同。
确保所有活动实例和新的Cisco SD-WAN Manager实例都运行相同的软件版本。
确保所有活动实例和新的Cisco SD-WAN Manager实例能够到达Cisco SD-WAN Validator的管理IP地址。
确保证书已安装在新安装的Cisco SD-WAN Manager实例上。
确保所有Cisco Catalyst SD-WAN设备(包括新安装的Cisco SD-WAN Manager)上的时钟都同步。
确保在新安装的Cisco SD-WAN Manager实例上配置一组新的系统IP和站点ID,同时配置与活动集群相同的基本配置。




例如,如果我们使用自己的CA(企业证书颁发机构),请选择Enterprise。


如果是20.15/20.18 vManage节点,请导航到配置>设备>控制组件。对于20.9/20.12版本,Configuration > Devices > Controllers
注意:我们需要将vBondor的管理凭据用作netadmingroup的用户部分。您可以在vBond的CLI中验证这一点。如果我们需要为vBond安装新证书,请在“生成CSR”的下拉列表中选择是
注意:如果vBond位于NAT设备/防火墙之后,请检查vBond VPN 0接口IP是否已转换为公共IP。如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口的公用IP地址

在20.12 vManage中点击Add vSmart,在20.15/20.18 vManage中点击Add Controller。
系统打开一个弹出窗口,输入vSmart的VPN 0传输IP,可从vManage访问。
如果允许从vManage的CLI到vSmart IP,请使用ping检查可达性。
输入vSmart Note的用户凭据,我们需要使用vSmart的管理员凭据或netadmin组的用户部分。
您可以在vSmart的CLI中验证这一点。
如果打算对路由器使用TLS来建立与vSmart的控制连接,请将协议设置为TLS。此配置也需要在vSmarts和vManage节点的CLI上进行配置。
如果需要为vSmart安装新证书,请在生成CSR"的下拉列表中选择Yes。
注意:如果vSmart位于NAT设备/防火墙之后,请检查vSmart VPN 0接口IP是否已转换为公共IP,如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口IP的公共IP地址。

完成所有步骤后,在Monitor>Dashboard中确认所有控制组件均可访问


注意:vManage集群可以配置3个vManage节点或6个vManage节点,具体取决于注册到SD-WAN交换矩阵的站点数量
继续执行“在SD-WAN重叠中带单节点vManage的板载SD-WAN控制器”中共享的步骤,首先启用带一个vManage节点的SD-WAN交换矩阵,然后板载所有所需的验证器(vBond)和控制器(vSmart)。
config t
system
host-name
system-ip
site-id
organization-name
vbond
commit
注意:如果我们使用URL作为vBond地址,请确保在VPN 0配置中配置DNS服务器IP地址或确保可以解析这些地址。
需要使用这些配置来启用传输接口,该接口用于与路由器和其余控制器建立控制连接。
config t
vpn 0
dns primary
dns secondary
interface eth1
ip address
tunnel-interface
allow-service all
allow-service dhcp
allow-service dns
allow-service icmp
no allow-service sshd
no allow-service netconf
no allow-service ntp
no allow-service stun
allow-service https
!
no shutdown
!
ip route 0.0.0.0/0
commit
还要配置VPN 512管理接口以启用对控制器的带外管理访问。
Conf t
vpn 512
interface eth0
ip address
no shutdown
!
ip route 0.0.0.0/0
!
Commit
可选配置:
Conf t
security
control
protocol tls
commit
在所有vManagenode(包括已注册的vManage-1)上配置服务接口。此接口用于集群通信,即集群中vManagenodes之间的通信。
conf t
interface eth2
ip address
no shutdown
commit
确保同一IP子网用于vManagecluster中所有节点上的服务接口。
我们可以使用与vManagenode相同的管理凭据配置vManagecluster。否则,我们可以配置作为netadmingroup一部分的新用户凭据。配置新用户凭据的配置如下所示
conf t
system
aaa
user
password
group netadmin
commit
确保在属于群集的所有vManagenode上配置相同的用户凭据。如果我们决定使用管理员凭据,则必须在所有vManagenode上配置相同的用户名/密码。
如果是20.15/20.18 vManage节点,请导航到Configuration > Certificates > Control Components 。对于20.9/20.12版本,Configuration > Devices > Controllers
单击Manager/vManage的……并单击Generate CSR。

生成CSR后,您可以下载CSR并根据为控制器选择的证书颁发机构对其进行签名。您可以在管理>设置>控制器证书授权中验证此配置。如果选择思科(推荐),则vManage会自动将CSR上传到PNP门户,并且证书签名后,会自动将其安装到vManage上。
如果选择“手动”,请通过导航到相应SD-WAN重叠的智能帐户和虚拟帐户,使用思科PNP门户手动签署CSR。
证书从PNP门户可用后,点击vManage同一部分的安装证书,然后上传证书并安装证书。
如果我们使用Digicert和Enterprise Root Certificate,则适用相同的步骤。
跨属于集群的所有vManage节点完成此步骤。
注意:对于有3个节点的集群,所有3个vManage节点都以计算+数据作为角色。
可选配置:
请参阅现有集群中的此配置以启用SDAVC — 仅当需要且仅在集群的一个vManage节点上需要时,才需要选中。
点击Update。



在将下一个节点添加到集群之前,需要考虑以下几点:
请验证到目前为止已添加到集群的vManage节点的所有UI上的以下点:
您可以使用第4步中介绍的步骤启动一个或多个vManage集群:构建vManage集群。完成步骤6中所述的步骤的开机自检:Config-db Backup/Restore,恢复备用群集中的config-db备份。
您可以在vManageCLI上使用requestnmsconfiguration-dbstatus命令验证相同。输出如下所示
vmanage# request nms configuration-db status
NMS configuration database
Enabled: true
Status: running PID:32632 for 1066085s
Native metrics status: ENABLED
Server-load metrics status: ENABLED
vmanage#
vManage-3# request nms configuration-db diagnostics
NMS configuration database
Checking cluster connectivity for ports 7687,7474 ...
Pinging vManage node 0 on 169.254.1.5:7687,7474...
Starting Nping 0.7.80 ( https://nmap.org/nping ) at 2026-02-18 12:41 UTC
SENT (0.0013s) Starting TCP Handshake > 169.254.1.5:7474
RCVD (0.0022s) Handshake with 169.254.1.5:7474 completed
SENT (1.0024s) Starting TCP Handshake > 169.254.1.5:7687
RCVD (1.0028s) Handshake with 169.254.1.5:7687 completed
SENT (2.0044s) Starting TCP Handshake > 169.254.1.5:7474
RCVD (2.0050s) Handshake with 169.254.1.5:7474 completed
SENT (3.0064s) Starting TCP Handshake > 169.254.1.5:7687
RCVD (3.0072s) Handshake with 169.254.1.5:7687 completed
SENT (4.0083s) Starting TCP Handshake > 169.254.1.5:7474
RCVD (4.0091s) Handshake with 169.254.1.5:7474 completed
SENT (5.0106s) Starting TCP Handshake > 169.254.1.5:7687
RCVD (5.0115s) Handshake with 169.254.1.5:7687 completed
Max rtt: 0.906ms | Min rtt: 0.392ms | Avg rtt: 0.724ms
TCP connection attempts: 6 | Successful connections: 6 | Failed: 0 (0.00%)
Nping done: 1 IP address pinged in 5.01 seconds
Pinging vManage node 1 on 169.254.2.5:7687,7474...
========== SNIP ==========
Connecting to 10.10.10.3...
+------------------------------------------------------------------------------------+
| type | row | attributes[row]["value"] |
+------------------------------------------------------------------------------------+
| "StoreSizes" | "TotalStoreSize" | 85828934 |
| "PageCache" | "Flush" | 4268666 |
| "PageCache" | "EvictionExceptions" | 0 |
| "PageCache" | "UsageRatio" | 0.09724264705882353 |
| "PageCache" | "Eviction" | 2068 |
| "PageCache" | "HitRatio" | 1.0 |
| "ID Allocations" | "NumberOfRelationshipIdsInUse" | 2068 |
| "ID Allocations" | "NumberOfPropertyIdsInUse" | 56151 |
| "ID Allocations" | "NumberOfNodeIdsInUse" | 7561 |
| "ID Allocations" | "NumberOfRelationshipTypeIdsInUse" | 31 |
| "Transactions" | "LastCommittedTxId" | 214273 |
| "Transactions" | "NumberOfOpenTransactions" | 1 |
| "Transactions" | "NumberOfOpenedTransactions" | 441742 |
| "Transactions" | "PeakNumberOfConcurrentTransactions" | 11 |
| "Transactions" | "NumberOfCommittedTransactions" | 414568 |
| "Causal Cluster" | "IsLeader" | 1 >>>>>>>>> |
| "Causal Cluster" | "MsgProcessDelay" | 0 |
| "Causal Cluster" | "InFlightCacheTotalBytes" | 0 |
+------------------------------------------------------------------------------------+
18 rows
ready to start consuming query after 388 ms, results consumed after another 13 ms
Completed
Connecting to 10.10.10.3...
Displaying the Neo4j Cluster Status
+---------------------------------------------------------------------------------------------------------------------------------+
| name | aliases | access | address | role | requestedStatus | currentStatus | error | default | home |
+---------------------------------------------------------------------------------------------------------------------------------+
| "neo4j" | [] | "read-write" | "169.254.3.5:7687" | "leader" | "online" | "online" | "" | TRUE | TRUE |
| "neo4j" | [] | "read-write" | "169.254.2.5:7687" | "follower" | "online" | "online" | "" | TRUE | TRUE |
| "neo4j" | [] | "read-write" | "169.254.1.5:7687" | "follower" | "online" | "online" | "" | TRUE | TRUE |
| "system" | [] | "read-write" | "169.254.3.5:7687" | "follower" | "online" | "online" | "" | FALSE | FALSE |
| "system" | [] | "read-write" | "169.254.2.5:7687" | "follower" | "online" | "online" | "" | FALSE | FALSE |
| "system" | [] | "read-write" | "169.254.1.5:7687" | "leader" | "online" | "online" | "" | FALSE | FALSE |
+---------------------------------------------------------------------------------------------------------------------------------+
6 rows
ready to start consuming query after 256 ms, results consumed after another 3 ms
Completed
Total disk space used by configuration-db:
60M .
使用此命令从已确定的configuration-db领导vManage节点收集configuration-db备份。
request nms configuration-db backup path /opt/data/backup/
预期输出如下所示:
vmanage# request nms configuration-db backup path /opt/data/backup/june18th
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved backup to /opt/data/backup/june18th.tar.gz
sha256sum: 8d0f5af8aee4e70f05e3858be6bdd5e6c136134ae47c383569ec883080f5d359
Removing the temp staging dir :/opt/data/backup/staging
vmanage#
使用SCP将configuration-db备份复制到vManage的/home/admin/目录。
scp命令输出示例:
XXXXXXXXX Downloads % scp june18th.tar.gz admin@10.66.62.27:/home/admin/
viptela 20.15.4.1
(admin@10.66.62.27) Password:
(admin@10.66.62.27) Password:
june18th.tar.gz 0% 255KB 47.2KB/s - stalled -
要恢复configuration-db备份,首先需要配置configuration-db凭据。如果您的配置数据库凭证是默认凭证(neo4j/password),我们可以跳过此步骤。
要配置configuration-db凭据,请使用命令request nms configuration-db update-admin-user。使用您选择的用户名和密码。
请注意,vManage的应用服务器已重新启动。由于此vManage UI在短时间内变得不可访问。
vmanage# request nms configuration-db update-admin-user
configuration-db
Enter current user name:neo4j
Enter current user password:password
Enter new user name:ciscoadmin
Enter new user password:ciscoadmin
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully updated configuration database admin user(this is service node, please repeat same operation on all service/data nodes)
Successfully restarted vManage Device Data Collector
Successfully restarted NMS application server
Successfully restarted NMS data collection agent
vmanage#
发布后,我们可以继续恢复configuration-db备份:
我们可以使用命令request nms configuration-db restore path /home/admin/< >将配置数据库恢复到新的vManage:
vmanage# request nms configuration-db restore path /home/admin/june18th.tar.gz
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Successfully backup database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Configuration database is running in a standalone mode
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully saved cluster configuration for localhost
Successfully saved vManage root CA information for device: "53f95156-f56b-472f-b713-d164561b25b7"
Stopping NMS application server on localhost
Stopping NMS configuration database on localhost
Reseting NMS configuration database on localhost
Loading NMS configuration database on localhost
Starting NMS configuration database on localhost
Waiting for 180s or the instance to start...
NMS configuration database on localhost has started.
Updating DB with the saved cluster configuration data
Successfully reinserted cluster meta information
Successfully reinserted vmanage root ca information
Starting NMS application server on localhost
Waiting for 180s for the instance to start...
Successfully restored database
恢复configuration-db后,请确保vManage UI可访问。等待约5分钟,然后尝试访问UI。
成功登录UI后,请确保边缘路由器列表、模板、策略以及之前或现有vManage UI上存在的所有其余配置都反映在新的vManage UI上。
恢复configuration-db后,我们需要重新验证交换矩阵中的所有新控制器(vmanage/vsmart/vbond)
注:在实际生产中,如果用于重新身份验证的接口IP是隧道接口IP,则需要确保在vManage、vSmart和vBond的隧道接口以及路径沿途的防火墙上允许NETCONF服务。要打开的防火墙端口是从DR群集到所有vBonds和vSmarts的双向规则的TCP端口830。
在vmanage UI上,点击Configuration > Devices > Controllers

所有控制器入网后,请完成以下步骤:
在新活动集群中的任何Cisco SD-WAN Manager服务器上,执行以下操作:
输入以下命令将根证书与新活动集群中的所有Cisco Catalyst SD-WAN设备同步:
https://vmanage-url/dataservice/system/device/sync/rootcertchain
输入以下命令将Cisco SD-WAN Manager UUID与Cisco SD-WAN Validator同步:
https://vmanage-url/dataservice/certificate/syncvbond
一旦交换矩阵恢复,并且交换矩阵中的所有边缘和控制器的控制和bfd会话都已启动,我们就需要从UI使旧控制器(vmanage/vsmart/vbond)失效
注意:继续此处所示的“后检查”部分,它适用于所有部署组合。
所需实例:
步骤:
确保活动的Cisco SD-WAN Manager实例数与新安装的Cisco SD-WAN Manager实例数相同。
确保所有活动实例和新的Cisco SD-WAN Manager实例都运行相同的软件版本。
确保所有活动实例和新的Cisco SD-WAN Manager实例能够到达Cisco SD-WAN Validator的管理IP地址。
确保证书已安装在新安装的Cisco SD-WAN Manager实例上。
确保所有Cisco Catalyst SD-WAN设备(包括新安装的Cisco SD-WAN Manager)上的时钟都同步。
确保在新安装的Cisco SD-WAN Manager实例上配置一组新的系统IP和站点ID,同时配置与活动集群相同的基本配置。




例如,如果我们使用自己的CA(企业证书颁发机构),请选择Enterprise。


如果是20.15/20.18 vManage节点,请导航到配置>设备>控制组件。对于20.9/20.12版本,Configuration > Devices > Controllers
注意:我们需要将vBondor的管理凭据用作netadmingroup的用户部分。您可以在vBond的CLI中验证这一点。如果我们需要为vBond安装新证书,请在“生成CSR”的下拉列表中选择是
注意:如果vBond位于NAT设备/防火墙之后,请检查vBond VPN 0接口IP是否已转换为公共IP。如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口的公用IP地址

在20.12 vManage中点击Add vSmart,在20.15/20.18 vManage中点击Add Controller。
系统打开一个弹出窗口,输入vSmart的VPN 0传输IP,可从vManage访问。
如果允许从vManage的CLI到vSmart IP,请使用ping检查可达性。
输入vSmart Note的用户凭据,我们需要使用vSmart的管理员凭据或netadmin组的用户部分。
您可以在vSmart的CLI中验证这一点。
如果打算对路由器使用TLS来建立与vSmart的控制连接,请将协议设置为TLS。此配置也需要在vSmarts和vManage节点的CLI上进行配置。
如果需要为vSmart安装新证书,请在生成CSR"的下拉列表中选择Yes。
注意:如果vSmart位于NAT设备/防火墙之后,请检查vSmart VPN 0接口IP是否已转换为公共IP,如果无法从vManage访问VPN 0接口IP,请在此步骤中使用VPN 0接口IP的公共IP地址。

完成所有步骤后,在Monitor>Dashboard中确认所有控制组件均可访问


注意:vManage集群可以配置3个vManage节点或6个vManage节点,具体取决于注册到SD-WAN交换矩阵的站点数量
继续执行“在SD-WAN重叠中带单节点vManage的板载SD-WAN控制器”中共享的步骤,首先启用带一个vManage节点的SD-WAN交换矩阵,然后板载所有所需的验证器(vBond)和控制器(vSmart)。
config t
system
host-name
system-ip
site-id
organization-name
vbond
commit
注意:如果我们使用URL作为vBond地址,请确保在VPN 0配置中配置DNS服务器IP地址或确保可以解析这些地址。
需要使用这些配置来启用传输接口,该接口用于与路由器和其余控制器建立控制连接。
config t
vpn 0
dns primary
dns secondary
interface eth1
ip address
tunnel-interface
allow-service all
allow-service dhcp
allow-service dns
allow-service icmp
no allow-service sshd
no allow-service netconf
no allow-service ntp
no allow-service stun
allow-service https
!
no shutdown
!
ip route 0.0.0.0/0
commit
还要配置VPN 512管理接口以启用对控制器的带外管理访问。
Conf t
vpn 512
interface eth0
ip address
no shutdown
!
ip route 0.0.0.0/0
!
Commit
可选配置:
Conf t
security
control
protocol tls
commit
在所有vManagenode(包括已注册的vManage-1)上配置服务接口。此接口用于集群通信,即集群中vManagenodes之间的通信。
conf t
interface eth2
ip address
no shutdown
commit
确保同一IP子网用于vManagecluster中所有节点上的服务接口。
我们可以使用与vManagenode相同的管理凭据配置vManagecluster。否则,我们可以配置作为netadmingroup一部分的新用户凭据。配置新用户凭据的配置如下所示
conf t
system
aaa
user
password
group netadmin
commit
确保在属于群集的所有vManagenode上配置相同的用户凭据。如果我们决定使用管理员凭据,则必须在所有vManagenode上配置相同的用户名/密码。
如果是20.15/20.18 vManage节点,请导航到Configuration > Certificates > Control Components 。对于20.9/20.12版本,Configuration > Devices > Controllers
单击Manager/vManage的……并单击Generate CSR。

生成CSR后,您可以下载CSR并根据为控制器选择的证书颁发机构对其进行签名。您可以在管理>设置>控制器证书授权中验证此配置。如果选择思科(推荐),则vManage会自动将CSR上传到PNP门户,并且证书签名后,会自动将其安装到vManage上。
如果选择“手动”,请通过导航到相应SD-WAN重叠的智能帐户和虚拟帐户,使用思科PNP门户手动签署CSR。
证书从PNP门户可用后,点击vManage同一部分的安装证书,然后上传证书并安装证书。
如果我们使用Digicert和Enterprise Root Certificate,则适用相同的步骤。
跨属于集群的所有vManage节点完成此步骤。
注意:对于有3个节点的集群,所有3个vManage节点都以计算+数据作为角色。对于6节点集群,3个vManage节点采用计算+数据作为角色,3个vManage节点采用数据作为角色。

可选配置:
请参阅现有集群中的此配置以启用SDAVC — 仅当需要且仅在集群的一个vManage节点上需要时,才需要选中。
点击Update。



在将下一个节点添加到集群之前,需要考虑以下几点:
请验证到目前为止已添加到集群的vManage节点的所有UI上的以下点:
注意:从已启用灾难恢复的现有vManage群集收集配置数据库备份时,请确保在该节点上的灾难恢复暂停并删除后收集配置数据库备份。
确认没有正在进行的灾难恢复复制。导航到管理>灾难恢复和 确保状态为Success且未处于Import Pending、Export Pending或Download Pending等暂时状态。如果状态未成功,请联系Cisco TAC并确保复制成功,然后继续暂停灾难恢复。
首先暂停灾难恢复并确保任务完成。然后删除灾难恢复并确认任务已完成。

联系思科TAC以确保成功清理灾难恢复。
您可以在vManageCLI上使用requestnmsconfiguration-dbstatus命令验证相同。输出如下所示
vmanage# request nms configuration-db status
NMS configuration database
Enabled: true
Status: running PID:32632 for 1066085s
Native metrics status: ENABLED
Server-load metrics status: ENABLED
vmanage#
vManage-3# request nms configuration-db diagnostics
NMS configuration database
Checking cluster connectivity for ports 7687,7474 ...
Pinging vManage node 0 on 169.254.1.5:7687,7474...
Starting Nping 0.7.80 ( https://nmap.org/nping ) at 2026-02-18 12:41 UTC
SENT (0.0013s) Starting TCP Handshake > 169.254.1.5:7474
RCVD (0.0022s) Handshake with 169.254.1.5:7474 completed
SENT (1.0024s) Starting TCP Handshake > 169.254.1.5:7687
RCVD (1.0028s) Handshake with 169.254.1.5:7687 completed
SENT (2.0044s) Starting TCP Handshake > 169.254.1.5:7474
RCVD (2.0050s) Handshake with 169.254.1.5:7474 completed
SENT (3.0064s) Starting TCP Handshake > 169.254.1.5:7687
RCVD (3.0072s) Handshake with 169.254.1.5:7687 completed
SENT (4.0083s) Starting TCP Handshake > 169.254.1.5:7474
RCVD (4.0091s) Handshake with 169.254.1.5:7474 completed
SENT (5.0106s) Starting TCP Handshake > 169.254.1.5:7687
RCVD (5.0115s) Handshake with 169.254.1.5:7687 completed
Max rtt: 0.906ms | Min rtt: 0.392ms | Avg rtt: 0.724ms
TCP connection attempts: 6 | Successful connections: 6 | Failed: 0 (0.00%)
Nping done: 1 IP address pinged in 5.01 seconds
Pinging vManage node 1 on 169.254.2.5:7687,7474...
========== SNIP ==========
Connecting to 10.10.10.3...
+------------------------------------------------------------------------------------+
| type | row | attributes[row]["value"] |
+------------------------------------------------------------------------------------+
| "StoreSizes" | "TotalStoreSize" | 85828934 |
| "PageCache" | "Flush" | 4268666 |
| "PageCache" | "EvictionExceptions" | 0 |
| "PageCache" | "UsageRatio" | 0.09724264705882353 |
| "PageCache" | "Eviction" | 2068 |
| "PageCache" | "HitRatio" | 1.0 |
| "ID Allocations" | "NumberOfRelationshipIdsInUse" | 2068 |
| "ID Allocations" | "NumberOfPropertyIdsInUse" | 56151 |
| "ID Allocations" | "NumberOfNodeIdsInUse" | 7561 |
| "ID Allocations" | "NumberOfRelationshipTypeIdsInUse" | 31 |
| "Transactions" | "LastCommittedTxId" | 214273 |
| "Transactions" | "NumberOfOpenTransactions" | 1 |
| "Transactions" | "NumberOfOpenedTransactions" | 441742 |
| "Transactions" | "PeakNumberOfConcurrentTransactions" | 11 |
| "Transactions" | "NumberOfCommittedTransactions" | 414568 |
| "Causal Cluster" | "IsLeader" | 1 >>>>>>>>> |
| "Causal Cluster" | "MsgProcessDelay" | 0 |
| "Causal Cluster" | "InFlightCacheTotalBytes" | 0 |
+------------------------------------------------------------------------------------+
18 rows
ready to start consuming query after 388 ms, results consumed after another 13 ms
Completed
Connecting to 10.10.10.3...
Displaying the Neo4j Cluster Status
+---------------------------------------------------------------------------------------------------------------------------------+
| name | aliases | access | address | role | requestedStatus | currentStatus | error | default | home |
+---------------------------------------------------------------------------------------------------------------------------------+
| "neo4j" | [] | "read-write" | "169.254.3.5:7687" | "leader" | "online" | "online" | "" | TRUE | TRUE |
| "neo4j" | [] | "read-write" | "169.254.2.5:7687" | "follower" | "online" | "online" | "" | TRUE | TRUE |
| "neo4j" | [] | "read-write" | "169.254.1.5:7687" | "follower" | "online" | "online" | "" | TRUE | TRUE |
| "system" | [] | "read-write" | "169.254.3.5:7687" | "follower" | "online" | "online" | "" | FALSE | FALSE |
| "system" | [] | "read-write" | "169.254.2.5:7687" | "follower" | "online" | "online" | "" | FALSE | FALSE |
| "system" | [] | "read-write" | "169.254.1.5:7687" | "leader" | "online" | "online" | "" | FALSE | FALSE |
+---------------------------------------------------------------------------------------------------------------------------------+
6 rows
ready to start consuming query after 256 ms, results consumed after another 3 ms
Completed
Total disk space used by configuration-db:
60M .
使用此命令从已确定的configuration-db领导vManage节点收集configuration-db备份。
request nms configuration-db backup path /opt/data/backup/
预期输出如下所示:
vmanage# request nms configuration-db backup path /opt/data/backup/june18th
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved backup to /opt/data/backup/june18th.tar.gz
sha256sum: 8d0f5af8aee4e70f05e3858be6bdd5e6c136134ae47c383569ec883080f5d359
Removing the temp staging dir :/opt/data/backup/staging
vmanage#
使用SCP将configuration-db备份复制到vManage的/home/admin/目录。
scp命令输出示例:
XXXXXXXXX Downloads % scp june18th.tar.gz admin@10.66.62.27:/home/admin/
viptela 20.15.4.1
(admin@10.66.62.27) Password:
(admin@10.66.62.27) Password:
june18th.tar.gz 0% 255KB 47.2KB/s - stalled -
要恢复configuration-db备份,首先需要配置configuration-db凭据。如果您的配置数据库凭证是默认凭证(neo4j/password),我们可以跳过此步骤。
要配置configuration-db凭据,请使用命令request nms configuration-db update-admin-user。使用您选择的用户名和密码。
请注意,vManage的应用服务器已重新启动。由于此vManage UI在短时间内变得不可访问。
vmanage# request nms configuration-db update-admin-user
configuration-db
Enter current user name:neo4j
Enter current user password:password
Enter new user name:ciscoadmin
Enter new user password:ciscoadmin
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully updated configuration database admin user(this is service node, please repeat same operation on all service/data nodes)
Successfully restarted vManage Device Data Collector
Successfully restarted NMS application server
Successfully restarted NMS data collection agent
vmanage#
发布后,我们可以继续恢复configuration-db备份:
我们可以使用命令request nms configuration-db restore path /home/admin/< >将配置数据库恢复到新的vManage:
vmanage# request nms configuration-db restore path /home/admin/june18th.tar.gz
Starting backup of configuration-db
config-db backup logs are available in /var/log/nms/neo4j-backup.log file
Successfully saved database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Successfully backup database to /opt/data/backup/configdb-local-tmp-20230623-160954.tar.gz
Configuration database is running in a standalone mode
WARNING: sun.reflect.Reflection.getCallerClass is not supported. This will impact performance.
Successfully saved cluster configuration for localhost
Successfully saved vManage root CA information for device: "53f95156-f56b-472f-b713-d164561b25b7"
Stopping NMS application server on localhost
Stopping NMS configuration database on localhost
Reseting NMS configuration database on localhost
Loading NMS configuration database on localhost
Starting NMS configuration database on localhost
Waiting for 180s or the instance to start...
NMS configuration database on localhost has started.
Updating DB with the saved cluster configuration data
Successfully reinserted cluster meta information
Successfully reinserted vmanage root ca information
Starting NMS application server on localhost
Waiting for 180s for the instance to start...
Successfully restored database
恢复configuration-db后,请确保vManage UI可访问。等待约5分钟,然后尝试访问UI。
成功登录UI后,请确保边缘路由器列表、模板、策略以及之前或现有vManage UI上存在的所有其余配置都反映在新的vManage UI上。
重要预检查
两个单独的vManage 3节点群集必须配置且运行正常,才能继续进行灾难恢复。在活动群集上,必须注册验证器和控制器。如果您在DR站点上有验证器和控制器,则这些控制器也必须在活动群集上而不是在DR vManage群集上入网。
Cisco建议在注册灾难恢复之前必须满足以下要求:
配置
有关vManage灾难恢复的详细信息,请参阅此链接。
假设每个SD-WAN管理器具有最低配置并完成认证部分,则已创建两个单独的3节点集群。
在两个集群上导航到Administration > Cluster Management,并验证所有节点是否处于就绪状态。
DC vManage

DR vmanage

导航到Administration>Disaster Recovery of Primary vManage Cluster。单击管理灾难恢复。

在弹出窗口中,填写主要和辅助vManage的详细信息。
要指示的IP地址是带外集群接口IP地址。 最好在每个集群中使用vManage-1的VPN 0服务接口的IP地址。
凭证必须是netadmin用户的凭证,配置DR后不得更改凭证,除非删除凭证。 可以使用独立的vManage本地用户凭证进行灾难恢复。我们需要确保vManage本地用户是netadmin组的一部分。此处可使用管理员凭据。

填满后,单击下一步。
vBond控制器必须在指定的IP地址中通过Netconf到达。

填满后,单击下一步。


设置值,然后单击Save。

确认
导航到管理>灾难恢复,以查看灾难恢复状态以及上次复制数据的时间。

注意:复制可能需要几个小时,具体取决于数据库大小。此外,它可能需要几个周期才能成功复制。
恢复configuration-db后,我们需要重新验证交换矩阵中的所有新控制器(vmanage/vsmart/vbond)
注:在实际生产中,如果用于重新身份验证的接口IP是隧道接口IP,则需要确保在vManage、vSmart和vBond的隧道接口以及路径沿途的防火墙上允许NETCONF服务。要打开的防火墙端口是从DR群集到所有vBonds和vSmarts的双向规则的TCP端口830。
在vmanage UI上,点击Configuration > Devices > Controllers

所有控制器入网后,请完成以下步骤:
在新活动集群中的任何Cisco SD-WAN Manager服务器上,执行以下操作:
输入以下命令将根证书与新活动集群中的所有Cisco Catalyst SD-WAN设备同步:
https://vmanage-url/dataservice/system/device/sync/rootcertchain
输入以下命令将Cisco SD-WAN Manager UUID与Cisco SD-WAN Validator同步:
https://vmanage-url/dataservice/certificate/syncvbond
一旦交换矩阵恢复,并且交换矩阵中的所有边缘和控制器的控制和bfd会话都已启动,我们就需要从UI使旧控制器(vmanage/vsmart/vbond)失效
这些后期检查适用于所有部署组合。
request platform software sdwan vedge_cloud activate chassis-number token
验证项目是否按预期显示:
模板
策略
设备页面(两个选项卡)WAN vEdge ListandControllers
适用于vManage节点:
Configuration-DB(Neo4j)检查:
在所有vManage节点上执行命令“request nms configuration-db diagnostics”:
1.检查节点在线状态和领导状态:(不适用于所有版本)
“Neo4j”必须在线显示3个节点,1个领导者和2个追随者。“system”还必须显示3个在线节点、1个引导节点和2个跟随者,但由于这不是默认数据库,因此默认标志为false。如果每个neo4j少于3个条目,则系统表示节点从集群中脱离。请联系Cisco TAC进行故障排除。
2.检查是否有任何节点为“隔离”。

所有节点都必须处于隔离状态。
3.架构验证必须“成功”。

4.使用命令“request nms configuration-db diagnostics”收集configuration-db备份,并确保其成功。

如果发现任何不一致或错误,请联系Cisco TAC进行故障排除。
或者,我们可以运行这些API调用以确认集群(用于所有COMPUTE+DATA节点)的vmanage节点状态 — 仅在20.12版及更高版本上运行
go to vshell of the vmanage node ( to be done on all vmanages)
===============================================================
curl -u : -H "Content-Type: application/json" -d '{"statements":[{"statement":"call dbms.cluster.overview"}]}' http://:7474/db/neo4j/tx/commit | jq -r
curl -u : -H "Content-Type: application/json" -d '{"statements":[{"statement":"show databases"}]}' http://:7474/db/neo4j/tx/commit | jq -r 确保在一个集群中只有一个neo4j和系统的领导,其余为跟随者。确保所有节点均在线。如果您有3个节点集群(全部三个都是COMPUTE+DATA),neo4j和系统的领导者都必须只有一个。任何偏差,您必须联系TAC
5.在/var/log/kern.log中检查所有磁盘、内存、IO错误。这需要在所有vManage节点上检查。
6.为在每个节点之间没有CC的vmanage形成新集群时,请检查该步骤
从节点1到其他节点集群ip执行vmanage-admin作为ssh,反之亦然,以检查是否交换了公钥且未使用密码ssh [此处步骤需要同意令牌]
DR-vManage-1:~# ssh -i /etc/viptela/.ssh/id_dsa -p 830 vmanage-admin@
The authenticity of host '[192.168.50.5]:830 ([192.168.50.5]:830)' can't be established.
ECDSA key fingerprint is SHA256:rSpscoYCVC+yifUMHVTlxtjqmyrZSFg93msFdoSUieQ.
Are you sure you want to continue connecting (yes/no/[fingerprint])? yes
Warning: Permanently added '[192.168.50.5]:830' (ECDSA) to the list of known hosts.
viptela 20.9.3.0.31
Password:
如果输出要求输入密码,请联系TAC
适用于所有SD-WAN控制器(vBond、vManage、vSmart):
在重叠中的所有控制器上执行命令,并确认所看到的vManage UUID和序列号对当前交换矩阵有效:
虚拟绑定命令:
show orchestrator valid-vsmarts
show orchestrator valid-vmanage-id
vManage/vSmart命令:
show control valid-vsmarts
show control valid-vmanage-id
请注意,show control valid-vsmarts的输出包括vSmarts和vManage节点的序列号。
请将其与vManage UI中看到的进行比较。导航到配置>证书>控制器部分。
如果发现当前未注册到交换矩阵的UUID/序列号的其它条目,则必须将其删除。您也可以与思科TAC联系。
| 版本 | 发布日期 | 备注 |
|---|---|---|
1.0 |
25-Feb-2026
|
初始版本 |
反馈