此产品的文档集力求使用非歧视性语言。在本文档集中,非歧视性语言是指不隐含针对年龄、残障、性别、种族身份、族群身份、性取向、社会经济地位和交叉性的歧视的语言。由于产品软件的用户界面中使用的硬编码语言、基于 RFP 文档使用的语言或引用的第三方产品使用的语言,文档中可能无法确保完全使用非歧视性语言。 深入了解思科如何使用包容性语言。
思科采用人工翻译与机器翻译相结合的方式将此文档翻译成不同语言,希望全球的用户都能通过各自的语言得到支持性的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 Cisco Systems, Inc. 对于翻译的准确性不承担任何责任,并建议您总是参考英文原始文档(已提供链接)。
本文档介绍配置和部署指南,以及针对向Cisco Unified Wireless LAN(WLAN)添加Mobility Services Engine(MSE)High Availability(HA)和运行情景感知服务和/或自适应无线入侵防御系统(Adaptive Wireless Intrusion Prevention System, AwIPS)的故障排除提示。 本文档旨在解释MSE HA的指南并提供MSE的HA部署方案。
注意:本文档不提供与MSE HA不相关的MSE和相关组件的配置详细信息。这些信息将在其他文档中提供(同时提供参考材料)。本文档也不涉及 Adaptive wIPS 配置。
MSE是一个能够运行多个相关服务的平台。这些服务提供高级服务功能。因此,必须考虑HA才能保持最高的服务可信度。
启用HA后,每个活动MSE都由另一个非活动实例备份。MSE HA引入了运行状况监视器,可在其中配置、管理和监控高可用性设置。在主MSE和辅助MSE之间维护心跳。运行状况监控器负责设置数据库、文件复制和监控应用程序。当主MSE发生故障且辅助设备接管时,主MSE的虚拟地址会透明地交换。
此设置(请参阅图1。)演示典型的Cisco WLAN部署,其中包括为HA启用的Cisco MSE。
HA支持在MSE-3310、MSE-3350/3355、3365和ESXi上的虚拟设备上提供。
图1.高可用性中的MSE部署
以下信息是有关MSE HA架构的信息:
MSE虚拟设备仅支持1:1高可用性
一个辅助MSE最多可以支持两个主要MSE。请参阅HA配对矩阵(图2和图3)
HA支持网络连接和直接连接
仅支持MSE第2层冗余。运行状况监控器IP和虚拟IP必须位于同一子网上,并且可从网络控制系统(NCS)访问第3层冗余不受支持
运行状况监视器IP和虚拟IP必须不同
您可以使用手动或自动故障切换
您可以使用手动或自动故障恢复
主MSE和辅助MSE必须在相同的软件版本上
每个活动的主MSE都由另一个非活动实例备份。只有在启动故障切换过程后,辅助MSE才会变为活动状态。
故障切换过程可以是手动或自动
每个已注册的主要MSE都有一个软件和数据库实例。
图2. MSE HA支持配对矩阵
此矩阵的基准是,辅助实例必须始终与主实例具有相等或较高的规格,无论它们是设备还是虚拟机。
MSE-3365只能与另一个MSE-3365配对。未测试/支持任何其他组合。
图3. MSE HA N:1配对矩阵
此示例显示了MSE虚拟设备(VA)的高可用性配置(请参阅图4)。 对于此方案,配置以下设置:
主MSE VA:
Virtual IP – [10.10.10.11] Health Monitor interface (Eth0) – [10.10.10.12]
辅助MSE VA:
Virtual IP – [None] Health Monitor interface (Eth0) – [10.10.10.13]
注意:每个VA需要激活许可证(L-MSE-7.0-K9)。VA的HA配置需要此项。
图4.高可用性中的MSE虚拟设备
有关详细信息,请参阅有关MSE虚拟设备的思科文档。
以下是一般步骤:
完成MSE的VA安装,并验证是否满足所有网络设置,如图所示。
如图所示,首次登录时通过设置向导设置参数。
输入所需的条目(主机名、域等)。 在配置高可用性步骤中输入YES。
输入此信息,如图所示。
选择角色 — [1表示主要]。
运行状况监视器接口 — [eth0]*
*映射到网络适配器1的网络设置
如图所示,选择direct connect interface [none]。
输入此信息,如图所示:
虚拟IP地址 — [10.10.11]
网络掩码 — [255.255.255.0]
在恢复模式下启动MSE - [否]
输入此信息,如图所示:
配置Eth0 - [是]
输入Eth0 IP地址 — [10.10.10.12]
网络掩码 — [255.255.255.0]
默认网关 — [10.10.10.1]
第二个以太网接口(Eth1)未使用。
如图所示配置eth1接口 — [跳过]。
继续完成安装向导,如图所示。
启用NTP服务器以同步时钟至关重要。
首选时区为UTC。
下面汇总了MSE VA主要设置:
-------BEGIN-------- Role=1, Health Monitor Interface=eth0, Direct connect interface=none Virtual IP Address=10.10.10.11, Virtual IP Netmask=255.255.255.0 Eth0 IP address=10.10.10.12, Eth0 network mask=255.0.0.0 Default Gateway=10.10.10.1 -------END--------
输入yes确认所有设置信息均正确,如图所示。
如映像所示,安装后建议重新启动。
重新启动后,使用/etc/init.d/msed start或service msed start命令启动MSE服务,如映像所示。
所有服务启动后,使用getserverinfo命令确认MSE服务是否正常工作。
如图所示,操作状态必须显示为Up。
这些步骤是辅助MSE VA设置的一部分:
新安装后,初始登录会启动安装向导。输入以下信息,如图所示:
配置高可用性- [是]
选择角色- [2],表示辅助
运行状况监控器接口 — [eth0]与主相同
输入如图所示的信息:
直接连接- [无]
IP地址eth0 - [10.10.10.13]
网络掩码- [255.255.255.0]
默认网关- [10.10.10.1]
配置eth1接口 — [Skip],如图所示。
如图所示设置时区 — [UTC]。
如图所示启用NTP服务器。
完成设置向导的其余步骤,并确认设置信息,以保存配置,如图所示。
重新启动并启动服务,与主MSE的先前步骤相同,如映像所示。
接下来的步骤显示如何将主要和辅助MSE VA添加到NCS。执行将MSE添加到NCS的正常过程。有关帮助,请参阅配置指南。
从NCS导航到Systems > Mobility Services,然后选择Mobility Services Engine,如图所示。
从下拉菜单中,选择添加移动服务引擎。然后,单击Go,如图所示。
按照MSE的NCS配置向导进行操作。在本文档的场景中,这些值为:
输入设备名称 — 例如[MSE1]
IP地址- [10.10.10.12]
用户名和密码(每个初始设置)
单击下一步,如图所示。
添加所有可用许可证,然后点击下一步,如图所示。
选择MSE服务,然后单击下一步,如图所示。
启用Tracking参数,然后单击Next,如图所示。
可以选择分配映射和同步MSE服务。单击Done以完成将MSE添加到NCS,如图所示。
下一个屏幕截图显示主MSE VA已添加。现在,请完成以下步骤以添加辅助MSE VA:
找到Secondary Server(辅助服务器)列,然后点击链接进行配置,如图所示。
将辅助MSE VA添加到此场景中的配置:
辅助设备名称- [mse2]
辅助IP地址- [10.10.10.13]
辅助密码* - [默认或来自设置脚本]
故障切换类型* - [自动或手动]
回退类型*
长故障切换等待*
Click Save.
*如果需要,请单击信息图标或参阅MSE文档。
当NCS提示配对两个MSE时,单击OK,如图所示。
NCS需要几秒钟才能创建如图所示的配置。
NCS提示辅助MSE VA是否需要激活许可证(L-MSE-7.0-K9),如图所示。
单击OK并找到License File以激活Secondary,如图所示。
激活辅助MSE VA后,单击Save以完成配置,如图所示。
导航到NCS > Mobility Services > Mobility Services Engine。
NCS显示此屏幕,其中辅助MSE显示在辅助服务器的列中:
要查看高可用性状态,请导航到NCS > Services > High Availability,如图所示。
在HA状态中,您可以通过MSE对查看当前状态和事件,如图所示。
设置初始同步和数据复制可能需要几分钟时间。NCS提供进度%指示,直到HA对完全处于活动状态(如前面和图像中所示)为止。
与HA相关的MSE软件版本7.2引入的新命令是gethainfo。此输出显示Primary和Secondary:
[root@mse1 ~]#gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Primary Health Monitor IP Address: 10.10.10.12 Virtual IP Address: 10.10.10.11 Version: 7.2.103.0 UDI: AIR-MSE-VA-K9:V01:mse1 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.10.10.13 Virtual IP Address: 10.10.10.11 Version: 7.2.103.0 UDI: AIR-MSE-VA-K9:V01:mse2_666f2046-5699-11e1-b1b1-0050568901d9 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3s Instance database port: 1624 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Up Current state: PRIMARY_ACTIVE [root@mse2 ~]#gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Secondary Health Monitor IP Address: 10.10.10.13 Virtual IP Address: Not Applicable for a secondary Version: 7.2.103.0 UDI: AIR-MSE-VA-K9:V01:mse2 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.10.10.12 Virtual IP Address: 10.10.10.11 Version: 7.2.103.0 UDI: AIR-MSE-VA-K9:V01:mse1_d5972642-5696-11e1-bd0c-0050568901d6 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3 Instance database port: 1524 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Up Current state: SECONDARY_ACTIVE
网络连接的MSE HA使用网络,而直接连接配置有助于在主MSE服务器和辅助MSE服务器之间使用直接电缆连接。这有助于减少心跳响应时间、数据复制和故障检测时间方面的延迟。在本场景中,主物理MSE连接到接口eth1上的辅助MSE,如图5所示。请注意,Eth1用于直接连接。每个接口需要一个IP地址。
图 5:具有直接连接的MSE HA
设置主MSE。
设置脚本中的配置摘要:
-------BEGIN-------- Host name=mse3355-1 Role=1 [Primary] Health Monitor Interface=eth0 Direct connect interface=eth1 Virtual IP Address=10.10.10.14 Virtual IP Netmask=255.255.255.0 Eth1 IP address=1.1.1.1 Eth1 network mask=255.0.0.0 Default Gateway =10.10.10.1 -------END--------
设置辅助MSE。
设置脚本中的配置摘要:
-------BEGIN-------- Host name=mse3355-2 Role=2 [Secondary] Health Monitor Interface=eth0 Direct connect interface=eth1 Eth0 IP Address 10.10.10.16 Eth0 network mask=255.255.255.0 Default Gateway=10.10.10.1 Eth1 IP address=1.1.1.2, Eth1 network mask=255.0.0.0 -------END--------
将主MSE添加到NCS,如图所示。(请参阅前面的示例,或参阅配置指南)。
要设置辅助MSE,请导航到NCS > configure Secondary Server。
输入辅助设备名称 — [mse3355-2]
辅助IP地址- [10.10.10.16]
完成其余参数并单击Save,如图所示。
单击OK以确认两个MSE的配对,如图所示。
NCS需要一段时间才能添加辅助服务器配置,如图所示。
完成后,对HA参数进行任何更改。点击保存(如图所示)。
如图所示,查看新MSE HA对的实时进度的高可用性状态。
导航到NCS > Services > Mobility Services > Mobility Services Engine,确认MSE(直接连接)HA已添加到NCS,如图所示。
在控制台中,还可以使用gethainfo命令查看确认。
以下是主要和辅助输出:
[root@mse3355-1 ~]#gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Primary Health Monitor IP Address: 10.10.10.15 Virtual IP Address: 10.10.10.14 Version: 7.2.103.0 UDI: AIR-MSE-3355-K9:V01:KQ37xx Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.10.10.16 Virtual IP Address: 10.10.10.14 Version: 7.2.103.0 UDI: AIR-MSE-3355-K9:V01:KQ45xx Failover type: Automatic Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3s Instance database port: 1624 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: Yes Heartbeat status: Up Current state: PRIMARY_ACTIVE [root@mse3355-2 ~]#gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Secondary Health Monitor IP Address: 10.10.10.16 Virtual IP Address: Not Applicable for a secondary Version: 7.2.103.0 UDI: AIR-MSE-3355-K9:V01:KQ45xx Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.10.10.15 Virtual IP Address: 10.10.10.14 Version: 7.2.103.0 UDI: AIR-MSE-3355-K9:V01:KQ37xx Failover type: Automatic Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3 Instance database port: 1524 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: Yes Heartbeat status: Up Current state: SECONDARY_ACTIVE
根据配对矩阵,HA配置中的最大值为2:1。此值保留给MSE-3355,在辅助模式下,MSE-3310和MSE-3350可以支持。直接连接在此场景中不适用。
配置每个MSE以演示2:1高可用性场景:
MSE-3310 (Primary1) Server role: Primary Health Monitor IP Address (Eth0): 10.10.10.17 Virtual IP Address: 10.10.10.18 Eth1 – Not Applicable MSE-3350 (Primary2) Server role: Primary Health Monitor IP Address: 10.10.10.22 Virtual IP Address: 10.10.10.21 Eth1 – Not Applicable MSE-3355 (Secondary) Server role: Secondary Health Monitor IP Address: 10.10.10.16 Virtual IP Address: Not Applicable for a secondary
配置完所有MSE后,将Primary1和Primary2添加到NCS,如图所示。
单击以配置辅助服务器(如前面的示例所示)。 从任一主要MSE开始,如图所示。
输入辅助MSE的参数:
辅助设备名称:例如[mse-3355-2]
辅助IP地址- [10.10.10.16]
完成其余参数。
点击保存(如图所示)。
请稍等片刻,等待配置映像中所示的第一个辅助条目。
确认已为第一个主MSE添加辅助服务器,如图所示。
如图所示,对第二个主MSE重复步骤3到6。
使用第二个主MSE的高可用性参数最终确定,如图所示。
保存设置,如图所示。
检查每个主MSE的进度,如图所示。
确认Primary1和Primary2 MSE都设置了辅助MSE,如图所示。
导航到NCS > Services > Mobility Services,选择High Availability,如图所示。
请注意,已确认MSE-3355的2:1为MSE-3310和MSE-3350的次要,如图所示。
以下是在使用gethainfo命令时从所有三个MSE的控制台的HA设置示例输出:
[root@mse3355-2 ~]#gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Secondary Health Monitor IP Address: 10.10.10.16 Virtual IP Address: Not Applicable for a secondary Version: 7.2.103.0 UDI: AIR-MSE-3355-K9:V01:KQ45xx Number of paired peers: 2 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.10.10.22 Virtual IP Address: 10.10.10.21 Version: 7.2.103.0 UDI: AIR-MSE-3350-K9:V01:MXQ839xx Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3 Instance database port: 1524 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Up Current state: SECONDARY_ACTIVE ---------------------------- Peer configuration#: 2 ---------------------------- Health Monitor IP Address 10.10.10.17 Virtual IP Address: 10.10.10.18 Version: 7.2.103.0 UDI: AIR-MSE-3310-K9:V01:FTX140xx Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos4 Instance database port: 1525 Dataguard configuration name: dg_mse4 Primary database alias: mseop4s Direct connect used: No Heartbeat status: Up Current state: SECONDARY_ACTIVE
NCS中HA的最终验证显示MSE-3310和MSE-3350均处于完全活动状态,如图所示。
当前没有可用于此配置的验证过程。
本部分提供了可用于对配置进行故障排除的信息。
添加辅助MSE时,您可以看到如图所示的提示。
可能设置脚本期间出现问题。
运行getserverinfo命令以检查正确的网络设置。
服务也可能尚未启动。运行/init.d/msed start命令。
如果需要,请再次运行安装脚本(/mse/setup/setup.sh),并在结束时保存。
MSE的VA还需要激活许可证(L-MSE-7.0-K9)。 否则,添加辅助MSE VA时,NCS会提示。获取并添加MSE VA的激活许可证,如图所示。
如果在MSE上切换HA角色,请确保服务已完全停止。因此,请使用/init.d/msed stop命令停止服务,然后再次运行安装脚本(/mse/setup/setup.sh),如图所示。
运行gethainfo命令以获取MSE上的HA信息。这为排除或监控HA状态和更改提供了有用的信息。
[root@mse3355-2 ~]#gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Secondary Health Monitor IP Address: 10.10.10.16 Virtual IP Address: Not Applicable for a secondary Version: 7.2.103.0 UDI: AIR-MSE-3355-K9:V01:KQ45xx Number of paired peers: 2 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.10.10.22 Virtual IP Address: 10.10.10.21 Version: 7.2.103.0 UDI: AIR-MSE-3350-K9:V01:MXQ839xx Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3 Instance database port: 1524 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Up Current state: SECONDARY_ACTIVE ---------------------------- Peer configuration#: 2 ---------------------------- Health Monitor IP Address 10.10.10.17 Virtual IP Address: 10.10.10.18 Version: 7.2.103.0 UDI: AIR-MSE-3310-K9:V01:FTX140xx Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos4 Instance database port: 1525 Dataguard configuration name: dg_mse4 Primary database alias: mseop4s Direct connect used: No Heartbeat status: Up Current state: SECONDARY_ACTIVE
此外,NCS HA View是一个非常好的管理工具,用于查看MSE的HA设置,如图所示。
仅手动故障切换/回切的情况,以便更好地控制。
配置MSE HA并启动并运行后,Prime上的状态如下图所示:
以下是主MSE的getserverinfo和gethainfo:
[root@NicoMSE ~]# getserverinfo Health Monitor is running Retrieving MSE Services status. MSE services are up, getting the status ------------- Server Config ------------- Product name: Cisco Mobility Service Engine Version: 8.0.110.0 Health Monitor Ip Address: 10.48.39.238 High Availability Role: 1 Hw Version: V01 Hw Product Identifier: AIR-MSE-VA-K9 Hw Serial Number: NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 HTTPS: null Legacy Port: 8001 Log Modules: -1 Log Level: INFO Days to keep events: 2 Session timeout in mins: 30 DB backup in days: 2 ------------- Services ------------- Service Name: Context Aware Service Service Version: 8.0.1.79 Admin Status: Disabled Operation Status: Down Service Name: WIPS Service Version: 3.0.8155.0 Admin Status: Enabled Operation Status: Up Service Name: Mobile Concierge Service Service Version: 5.0.1.23 Admin Status: Disabled Operation Status: Down Service Name: CMX Analytics Service Version: 3.0.1.68 Admin Status: Disabled Operation Status: Down Service Name: CMX Connect & Engage Service Version: 1.0.0.29 Admin Status: Disabled Operation Status: Down Service Name: HTTP Proxy Service Service Version: 1.0.0.1 Admin Status: Disabled Operation Status: Down -------------- Server Monitor -------------- Server start time: Sun Mar 08 12:40:32 CET 2015 Server current time: Sun Mar 08 14:04:30 CET 2015 Server timezone: Europe/Brussels Server timezone offset (mins): 60 Restarts: 1 Used Memory (MB): 197 Allocated Memory (MB): 989 Max Memory (MB): 989 DB disk size (MB): 17191 --------------- Active Sessions --------------- Session ID: 5672 Session User ID: 1 Session IP Address: 10.48.39.238 Session start time: Sun Mar 08 12:44:54 CET 2015 Session last access time: Sun Mar 08 14:03:46 CET 2015 ---------------------------- Default Trap Destinations ---------------------------- Trap Destination - 1 ----------------- IP Address: 10.48.39.225 Last Updated: Sun Mar 08 12:34:12 CET 2015 [root@NicoMSE ~]# gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Primary Health Monitor IP Address: 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.240 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3s Instance database port: 1624 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Up Current state: PRIMARY_ACTIVE
辅助MSE的情况与此相同:
[root@NicoMSE2 ~]# getserverinfo Health Monitor is running Retrieving MSE Services status. MSE services are up and in DORMANT mode, getting the status ------------- Server Config ------------- Product name: Cisco Mobility Service Engine Version: 8.0.110.0 Health Monitor Ip Address: 10.48.39.240 High Availability Role: 2 Hw Version: V01 Hw Product Identifier: AIR-MSE-VA-K9 Hw Serial Number: NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 HTTPS: null Legacy Port: 8001 Log Modules: -1 Log Level: INFO Days to keep events: 2 Session timeout in mins: 30 DB backup in days: 2 ------------- Services ------------- Service Name: Context Aware Service Service Version: 8.0.1.79 Admin Status: Disabled Operation Status: Down Service Name: WIPS Service Version: 3.0.8155.0 Admin Status: Enabled Operation Status: Up Service Name: Mobile Concierge Service Service Version: 5.0.1.23 Admin Status: Disabled Operation Status: Down Service Name: CMX Analytics Service Version: 3.0.1.68 Admin Status: Disabled Operation Status: Down Service Name: CMX Connect & Engage Service Version: 1.0.0.29 Admin Status: Disabled Operation Status: Down Service Name: HTTP Proxy Service Service Version: 1.0.0.1 Admin Status: Disabled Operation Status: Down -------------- Server Monitor -------------- Server start time: Sun Mar 08 12:50:04 CET 2015 Server current time: Sun Mar 08 14:04:32 CET 2015 Server timezone: Europe/Brussels Server timezone offset (mins): 60 Restarts: null Used Memory (MB): 188 Allocated Memory (MB): 989 Max Memory (MB): 989 DB disk size (MB): 17191 [root@NicoMSE2 ~]# gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Secondary Health Monitor IP Address: 10.48.39.240 Virtual IP Address: Not Applicable for a secondary Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3 Instance database port: 1524 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Up Current state: SECONDARY_ACTIVE
为了手动触发,您进入Prime基础设施中的MSE HA配置,然后点击Switchover。
很快,两台服务器上的gethainfo都将转到FAILOVER_INVOKED
主要gethainfo:
[root@NicoMSE ~]# gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Primary Health Monitor IP Address: 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.240 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3s Instance database port: 1624 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Down Current state: FAILOVER_INVOKED
次要gethainfo:
[root@NicoMSE2 ~]# gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Secondary Health Monitor IP Address: 10.48.39.240 Virtual IP Address: Not Applicable for a secondary Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3 Instance database port: 1524 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Down Current state: FAILOVER_INVOKED
故障切换完成后,您将在Prime上看到以下映像:
主要的gethainfo:
[root@NicoMSE ~]# gethainfo Health Monitor is not running. Following information is from the last saved configuration ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Primary Health Monitor IP Address: 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.240 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3s Instance database port: 1624 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Last shutdown state: FAILOVER_ACTIVE
辅助:
[root@NicoMSE2 ~]# gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Secondary Health Monitor IP Address: 10.48.39.240 Virtual IP Address: Not Applicable for a secondary Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3 Instance database port: 1524 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Down Current state: FAILOVER_ACTIVE
在此阶段,故障切换完成,辅助MSE完全负责。
请注意,当您执行手动切换时,主MSE上的服务会停止(以便模拟主MSE断开的真实事件)
如果恢复主设备,其状态将为“TERMINATED”。 它是正常的,辅助设备仍然负责并显示“FAILOVER_ACTIVE”
在回切之前,您必须恢复主映像。
其状态随后为“TERMINATED”:
[root@NicoMSE ~]# gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Primary Health Monitor IP Address: 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.240 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3s Instance database port: 1624 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Down Current state: TERMINATED
当您从Prime调用回切时,两个节点都进入“FAILBACK ACTIVE”,这不是最终状态(与“failover active”相反)。
主要gethainfo :
[root@NicoMSE ~]# gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Primary Health Monitor IP Address: 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.240 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3s Instance database port: 1624 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Down Current state: FAILBACK_ACTIVE
辅助gethainfo:
[root@NicoMSE2 ~]# gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Secondary Health Monitor IP Address: 10.48.39.240 Virtual IP Address: Not Applicable for a secondary Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3 Instance database port: 1524 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Down Current state: FAILBACK_ACTIVE
Prime显示以下图片:
当故障恢复完成但辅助设备仍忙于将数据传回主设备时,主设备显示:
gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Primary Health Monitor IP Address: 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.240 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3s Instance database port: 1624 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Up Current state: FAILBACK_COMPLETE
辅助显示:
[root@NicoMSE2 ~]# gethainfo Health Monitor is running. Retrieving HA related information ---------------------------------------------------- Base high availability configuration for this server ---------------------------------------------------- Server role: Secondary Health Monitor IP Address: 10.48.39.240 Virtual IP Address: Not Applicable for a secondary Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE2_1c6b1940-b6a5-11e4-b017-005056993b66 Number of paired peers: 1 ---------------------------- Peer configuration#: 1 ---------------------------- Health Monitor IP Address 10.48.39.238 Virtual IP Address: 10.48.39.224 Version: 8.0.110.0 UDI: AIR-MSE-VA-K9:V01:NicoMSE_b950a7c0-b68c-11e4-99d9-005056993b63 Failover type: Manual Failback type: Manual Failover wait time (seconds): 10 Instance database name: mseos3 Instance database port: 1524 Dataguard configuration name: dg_mse3 Primary database alias: mseop3s Direct connect used: No Heartbeat status: Up Current state: SECONDARY_ALONE
此阶段的Prime如图所示:
完成此操作后,所有状态都恢复为原始状态:PRIMARY_ACTIVE、SECONDARY_ACTIVE和Prime HA状态再次显示为新部署。
PRIMARY_ACTIVE | 主MSE处于主状态、负责且一切正常时的状态 |
SECONDARY_ACTIVE | 辅助MSE处于启用状态但不负责时的状态(主要仍然是),准备在需要时接管 |
FAILOVER_INVOKED | 发生故障转移时,在两个节点上显示,即辅助MSE开始其服务加载主MSE的数据库 |
FAILOVER_ACTIVE | 故障切换的最终状态。辅助MSE被视为“启动并运行”,而主MSE已关闭 |
TERMINATED(已终止) | MSE节点的状态,该节点在关闭后以及当它不是负责节点时恢复服务(因此当服务重新启动且PI仍控制辅助MSE时,它可以是主节点的状态)。 这也意味着HA链路可能未启动(例如,如果其中一个MSE正在重新启动,或者根本无法ping通) |
FAILBACK_ACTIVE | 与故障切换相反,这并不是故障切换的最后阶段。这意味着已调用故障恢复,且当前正在执行。正在将数据库从辅助数据库复制回主数据库 |
FAILBACK_COMPLETE | 当主节点重新掌管但仍在忙于从辅助MSE加载数据库时的状态 |
SECONDARY_ALONE | 执行回切且主设备负责但仍加载数据时辅助MSE的状态 |
正常关闭 | 如果手动重新启动或停止另一个MSE上的服务,则触发状态,以防发生自动故障切换/故障恢复。这意味着它不会接管,因为停机是手动引发的 |
与HA相关的日志保存在/opt/mse/logs/hm目录中,其中health-monitor*.log为主日志文件。
问题:主要和次要均处于活动状态(拆分脑条件)
1.关闭辅助交换机上的虚拟IP接口(VIP)。将会是eth0:1 ifconfig eth0:1 down
2.重新启动辅助MSE上的服务
service msed stop
service msed start
3.验证辅助设备是否已开始与Prime基础设施中的主设备重新同步。
问题:辅助节点与高可用性主节点的同步长时间停滞在X%
1.停止辅助节点上的服务
service msed stop
2.删除 /opt/mse/health-monitor/resources/config/advance-c
3.如果建立HA时仍存在问题,则它可能进入不一致状态,即我们必须使用rm -rf /opt/data/*删除辅助上“data”目录下的所有内容
4.重新启动辅助设备。将其从Prime基础设施添加到主基础设施以再次启动HA。
问题:在PI无法访问辅助服务器后,无法将其删除
1.停止主交换机上的服务。
2.删除 /opt/mse/health-monitor/resources/config/advance-c
3.重新启动主上的服务。
4.从PI中删除主MSE并重新添加它。
版本 | 发布日期 | 备注 |
---|---|---|
1.0 |
21-Apr-2016
|
初始版本 |