簡介
本文說明如何在Catalyst 9800 WLC上以RP+RMI方式設定高可用性狀態切換(SSO)。
必要條件
需求
思科建議您瞭解
- Catalyst無線9800組態型號。
- HA SSO指南中介紹的高可用性概念。
採用元件
本文中的資訊係根據以下軟體和硬體版本:
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
雖然HA SSO組態僅需其中的3個,但來自無線管理介面(WMI)相同網路的4個IP位址已用來簡化對控制器GUI的存取。
背景資訊
無線控制器上的高可用性SSO功能允許接入點與活動無線控制器和活動無線控制器建立CAPWAP隧道,以便與備用無線控制器共用AP和客戶端資料庫的映象副本。發生切換時(即主用控制器發生故障,因此由備用控制器控制),加入的AP不會進入發現狀態,客戶端也不會斷開連線。在AP與處於活動狀態的無線控制器之間,一次僅維護一個CAPWAP隧道。
兩個單元通過專用RP埠(或虛擬機器的虛擬介面)形成對等連線,兩個控制器在管理介面上共用相同的IP地址。RP介面用於在運行時同步批次配置和增量配置,並確保HA對的兩個控制器的運行狀態。此外,當使用RMI + RP時,備用控制器和活動控制器均具有冗餘管理介面(RMI),該介面分配有IP地址,即用於確保網關的可達性。處於運行狀態的接入點的CAPWAP狀態也從活動無線控制器同步到熱待命無線控制器,熱待命無線控制器允許在活動無線控制器出現故障時進行狀態完全切換。當主用無線控制器發生故障時,AP不會進入「發現」狀態,而備用無線控制器將接管「主用」無線控制器,為網路提供服務。
設定
網路圖表
註:橙色突出顯示了指定為WLC2的9800-CL控制器的虛擬介面GigabitEthernet 2所分配的臨時IP地址。此IP地址被臨時定義為WLC2的WMI,並允許訪問此例項的GUI以簡化HA SSO配置。配置HA SSO後,由於一個HA SSO控制器對僅使用單個WMI,因此釋放此地址。
組態
在本示例中,高可用性(HA)狀態切換(SSO)配置在兩個9800-CL例項之間,這些例項運行相同的Cisco IOS軟體版本,這些例項已配置有獨立的WMI,並且可以通過以下網址訪問的GUI
- 第一個IP地址10.48.39.130,稱為WLC1;
- 第二個地址IP地址10.48.39.133,稱為WLC2。
除了這些IP地址外,還使用同一子網(和VLAN)中的另外2個地址,即10.48.39.131和10.48.39.132.分別是機箱1(WLC1)和機箱2(WLC2)的冗餘管理介面(RMI)IP地址。
注意:一旦在兩個控制器之間配置了HA,10.48.39.133將被釋放,10.48.39.130將成為我配置的唯一WMI。因此,配置後,只有3個IP地址在使用,即WMI和RMI中的一個。
兩台裝置在啟動HA配置之前的介面配置必須類似於本例中提供的配置。
WLC1#show running-config | s interface
interface GigabitEthernet1
shutdown
negotiation auto
no mop enabled
no mop sysid
interface GigabitEthernet2
switchport trunk allowed vlan 39
switchport mode trunk
negotiation auto
no mop enabled
no mop sysid
interface GigabitEthernet3
negotiation auto
no mop enabled
no mop sysid
interface Vlan1
no ip address
shutdown
no mop enabled
no mop sysid
interface Vlan39
ip address 10.48.39.130 255.255.255.0
no mop enabled
no mop sysid
wireless management interface Vlan39
WLC2#show running-config | s interface
interface GigabitEthernet1
shutdown
negotiation auto
no mop enabled
no mop sysid
interface GigabitEthernet2
switchport trunk allowed vlan 39
switchport mode trunk
negotiation auto
no mop enabled
no mop sysid
interface GigabitEthernet3
negotiation auto
no mop enabled
no mop sysid
interface Vlan1
no ip address
shutdown
no mop enabled
no mop sysid
interface Vlan39
ip address 10.48.39.133 255.255.255.0
no mop enabled
no mop sysid
wireless management interface Vlan39
在本範例中,WLC1指定為主要控制器(即機箱1),而WLC2是次要控制器(即機箱2)。這表示兩個控制器所構成的HA對使用WLC1的組態,且執行此程式後WLC2的一個將遺失。
步驟1.(可選)備份控制器的啟動組態和執行組態檔。
錯誤處理可能會發生,並導致配置丟失。為避免這種情況,強烈建議從HA配置中使用的兩個控制器備份啟動配置和運行配置。使用9800 GUI或CLI可輕鬆完成此操作。
在 GUI 上:
在9800 GUI的Administration → Management → Backup & Restore索引標籤(請參閱熒幕截圖)中,您可以下載控制器目前使用的啟動和執行組態。
在本範例中,啟動(左側)和組態(右側)都直接透過HTTP下載到承載瀏覽器以存取WLC GUI的裝置上。使用「Transfer Mode」欄位,您可以輕鬆調整要備份的檔案的傳輸模式和目的地。
在CLI上:
WLCx#copy running-config tftp://
/run-backup_x.cfg Address or name of remote host [
]? Destination filename [run-backup_x.cfg]? !! 19826 bytes copied in 1.585 secs (12509 bytes/sec) WLCx#copy startup-config tftp://
/start-backup_x.cfg Address or name of remote host [
]? Destination filename [start-backup_x.cfg]? !! 20482 bytes copied in 0.084 secs (243833 bytes/sec)
使用將
啟動/運行配置檔案複製到的TFTP伺服器IP替換。
步驟2.(可選)確保網路連線。
從兩台WLC GUI或CLI,您可以執行簡單的連線測試,即從兩台裝置ping閘道,並在裝置之間執行ping.這可確保兩個控制器具有設定HA所需的連線。
在 GUI 上:
9800 GUI的疑難排解索引標籤中的Ping和Traceroute工具可用於測試控制器本身之間以及每個WLC與其網路閘道之間的連線,如下圖所示。
在CLI上:
WLCx#ping 10.48.39.133
Type escape sequence to abort.
Sending 5, 100-byte ICMP Echos to 10.48.39.133, timeout is 2 seconds:
!!!!!
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/1/1 ms
WLCx#ping 10.48.39.254
Type escape sequence to abort.
Sending 5, 100-byte ICMP Echos to 10.48.39.254, timeout is 2 seconds:
!!!!!
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/1/1 ms
步驟 3.使用RMI + RP配對型別配置冗餘。
在確保每台裝置之間的連線的情況下,可以在控制器之間配置冗餘。此熒幕截圖顯示如何在9800 GUI的Administration→ Device頁面的Redundancy索引標籤中進行組態。
警告:在本範例中,WLC1已被指定為主要控制器,這表示這是其組態複製到另一個控制器的控制器。請務必套用正確的機箱優先順序/重新編號,以便對HA配對使用正確的組態,且不會遺失其中的任何部分。
讓我們來回顧一下已配置的欄位及其用途
- 冗餘配置:必須啟用此配置才能在WLC之間使用冗餘。
- 冗餘配對型別:由於本指南涵蓋使用RMI配置的HA SSO,因此配置的配對型別必須是RMI + RP,同時使用冗餘管理介面和冗餘埠。您還可以選擇僅使用冗餘埠配置冗餘。但是,如果只選擇RP,則不會檢查網關的可達性,只有冗餘WLC狀態是
- 機箱1/2的RMI IP:這些字段將提供的IP地址分配給兩個例項的指定冗餘介面。在本例中,機箱1和2的兩個RMI IP已分別配置為10.48.39.131和10.48.39.132,如前所述,如網路圖所示。
- HA介面:使用虛擬裝置時,虛擬機器監控程式的虛擬網路介面卡(vNIC)與虛擬機器的網路介面之間的對映可以採用不同方式進行配置。因此,用於冗餘的介面可配置用於Cisco Catalyst 9800-CL。根據9800-CL部署指南的建議,此處使用了GigabitEthernet 3。
註:使用物理C9800裝置時,HA和RP中使用的介面是預設介面,不可配置。實際上,硬體9800 WLC具有獨立於其網路的專用備援介面。
-
管理網關故障切換:如HA SSO配置指南中所述,此冗餘方法通過定期向網關傳送網際網路控制消息協定(ICMP)ping來實施預設網關檢查。主用和備用控制器都使用RMI IP作為這些檢查的源IP。 這些消息以1秒的間隔傳送。
-
Gateway Failure Interval:這表示網關檢查在宣告為不可達之前必須連續失敗的時間量。預設情況下,此值配置為8秒。由於網關檢查每秒傳送一次,因此這表示到達網關的連續失敗次數為8次。
-
本地/遠端IP: 這些是為機箱1和2配置的RP IP。這些IP地址自動生成為169.254.x.x,其中x.x從管理介面的最後兩個八位元派生。
-
保持連線計時器:如HA SSO配置指南中詳細介紹的,主用和備用機箱會相互傳送保持連線消息,以確保兩者仍然可用。keep alive計時器是每個機箱之間傳送2個keepalive消息的時間間隔。預設情況下,保持連線消息每100毫秒傳送一次。通常建議使用9800-CL增加此值,以避免在VM基礎架構引入小延遲(快照等……)時發生濫用切換
-
Keep Alive Retries:此字段配置對等體keepalive重試值,然後再宣告對等體已關閉。如果同時使用保持連線計時器和重試預設值,則如果以100毫秒時間間隔傳送的5條保持連線消息未獲應答(即如果冗餘鏈路已關閉500毫秒),則會宣告對等體關閉。
-
機箱重新編號:裝置必須使用的機箱編號(1或2)。
-
活動機箱優先級:用於定義HA對必須使用哪些配置的優先順序。具有最高優先順序的裝置是複製到另一個的裝置。因此具有最低優先順序的機箱配置將會丟失。
進行這些組態後,使用Apply按鈕將組態套用到控制器。
在CLI上
首先,在虛擬介面中配置一個輔助IP地址,用於在兩台裝置上配置RMI。
WLC1#configure terminal
WLC1(config)#interface vlan 39
WLC1(config-if)# ip address 10.48.39.131 255.255.255.0 secondary
WLC1(config-if)# end
WLC2#configure terminal
WLC2(config)#interface vlan 39
WLC2(config-if)# ip address 10.48.39.132 255.255.255.0 secondary
WLC2(config-if)# end
然後,在兩個裝置上啟用冗餘
WLC1#configure terminal
WLC1(config)#redundancy
WLC1(config-red)#mode sso
WLC1(config-red)#end
WLC2#configure terminal
WLC2(config)#redundancy
WLC2(config-red)#mode sso
WLC2(config-red)#end
配置機箱優先順序,例如WLC1成為主控制器
WLC1#show chassis
Chassis/Stack Mac Address : 0001.0202.aabb - Local Mac Address
Mac persistency wait time: Indefinite
H/W Current
Chassis# Role Mac Address Priority Version State IP
-------------------------------------------------------------------------------------
*1 Active 0001.0202.aabb 1 V02 Ready 169.254.39.131
WLC1#chassis 1 priority 2
WLC1#show chassis
Chassis/Stack Mac Address : 0001.0202.aabb - Local Mac Address
Mac persistency wait time: Indefinite
H/W Current
Chassis# Role Mac Address Priority Version State IP
-------------------------------------------------------------------------------------
*1 Active 0001.0202.aabb 2 V02 Ready 169.254.39.131
對WLC2(它成為輔助控制器)的機箱進行重新編號
WLC2#show chassis
Chassis/Stack Mac Address : 0001.0202.aabb - Local Mac Address
Mac persistency wait time: Indefinite
H/W Current
Chassis# Role Mac Address Priority Version State IP
-------------------------------------------------------------------------------------
*1 Active 0001.0202.aabb 1 V02 Ready 169.254.39.132
WLC2#chassis 1 renumber 2
WLC2#show chassis
Chassis/Stack Mac Address : 0001.0202.aabb - Local Mac Address
Mac persistency wait time: Indefinite
H/W Current
Chassis# Role Mac Address Priority Version State IP
-------------------------------------------------------------------------------------
*2 Active 0001.0202.aabb 1 V02 Ready 169.254.39.132
最後,在兩個裝置上配置RMI
WLC1#chassis redundancy ha-interface GigabitEthernet 3
WLC1#configure terminal
WLC1(config)#redun-management interface Vlan39 chassis 1 address 10.48.39.131 chassis 2 address 10.48.39.132
WLC1(config)#end
WLC2#chassis redundancy ha-interface GigabitEthernet 3
WLC2#configure terminal
WLC2(config)#redun-management interface Vlan39 chassis 1 address 10.48.39.131 chassis 2 address 10.48.39.132
WLC2(config)#end
註:對於GUI配置,在虛擬Catalyst 9800上,必須在可用的介面之間選擇控制器使用的介面。建議在此處使用GigabitEthernet 3,並通過命令進行配chassis redundancy ha-interface GigabitEthernet 3
置。此命令不是運行配置的一部分,但是可以在例項ROMMON環境變數中看到HA使用的介面。可以使用命令檢視這些show romvar
資訊。
步驟 4.重新載入控制器。
若要形成HA配對,並使組態生效,必須在儲存步驟3中進行的組態後,同時重新載入兩個控制器。
在 GUI 上:
您可以使用兩個GUI的Administration Reload頁面重新啟動控制器,如本螢幕截圖所示。
在 CLI 上:
WLCx#reload
Reload command is being issued on Active unit, this will reload the whole stack
Proceed with reload? [confirm]
驗證
HA對的兩個控制器發現對方並建立所需的HA對後,一個控制器(主要)能夠通過GUI或CLI監控兩個機箱。
在 GUI 上:
要通過9800 GUI監控冗餘配置,請從Monitoring > General > System頁導航到Redundancy頁籤,如本螢幕截圖所示。
在 CLI 上:
WLC#show chassis rmi
Chassis/Stack Mac Address : 0050.568d.cdf4 - Local Mac Address
Mac persistency wait time: Indefinite
H/W Current
Chassis# Role Mac Address Priority Version State IP RMI-IP
--------------------------------------------------------------------------------------------------------
*1 Active 0050.568d.cdf4 2 V02 Ready 169.254.39.131 10.48.39.131
2 Standby 0050.568d.2a93 1 V02 Ready 169.254.39.132 10.48.39.132
WLC#show redundancy
Redundant System Information :
------------------------------
Available system uptime = 22 minutes
Switchovers system experienced = 0
Standby failures = 0
Last switchover reason = none
Hardware Mode = Duplex
Configured Redundancy Mode = sso
Operating Redundancy Mode = sso
Maintenance Mode = Disabled
Communications = Up
Current Processor Information :
-------------------------------
Active Location = slot 1
Current Software state = ACTIVE
Uptime in current state = 22 minutes
Image Version = Cisco IOS Software [Cupertino], C9800-CL Software (C9800-CL-K9_IOSXE), Version 17.9.2, RELEASE SOFTWARE (fc2)
Technical Support: http://www.cisco.com/techsupport
Copyright (c) 1986-2022 by Cisco Systems, Inc.
Compiled Wed 02-Nov-22 15:12 by mcpre
BOOT = bootflash:packages.conf,12;
CONFIG_FILE =
Configuration register = 0x102
Recovery mode = Not Applicable
Fast Switchover = Enabled
Initial Garp = Enabled
Peer Processor Information :
----------------------------
Standby Location = slot 2
Current Software state = STANDBY HOT
Uptime in current state = 20 minutes
Image Version = Cisco IOS Software [Cupertino], C9800-CL Software (C9800-CL-K9_IOSXE), Version 17.9.2, RELEASE SOFTWARE (fc2)
Technical Support: http://www.cisco.com/techsupport
Copyright (c) 1986-2022 by Cisco Systems, Inc.
Compiled Wed 02-Nov-22 15:12 by mcpre
BOOT = bootflash:packages.conf,12;
CONFIG_FILE =
Configuration register = 0x102
疑難排解
一站式反射
通常不show tech wireless
包含允許正確瞭解HA對的HA故障切換或其當前狀態的命令。收集此命令,以便在單個操作中包含大多數與HA相關的命令:
WLC#show tech wireless redundancy
顯示命令
對於冗餘埠的狀態,可以使用這些命令。
WLC#show chassis detail
Chassis/Stack Mac Address : 0050.568d.2a93 - Local Mac Address
Mac persistency wait time: Indefinite
H/W Current
Chassis# Role Mac Address Priority Version State IP
-------------------------------------------------------------------------------------
1 Standby aaaa.aaaa.aaaa 2 V02 Ready 169.254.39.131
*2 Active bbbb.bbbb.bbbb 1 V02 Ready 169.254.39.132
Stack Port Status Neighbors
Chassis# Port 1 Port 2 Port 1 Port 2
--------------------------------------------------------
1 OK OK 2 2
2 OK OK 1 1
WLC#show chassis rmi
Chassis/Stack Mac Address : 0050.568d.2a93 - Local Mac Address
Mac persistency wait time: Indefinite
H/W Current
Chassis# Role Mac Address Priority Version State IP RMI-IP
--------------------------------------------------------------------------------------------------------
1 Standby aaaa.aaaa.aaaa 2 V02 Ready 169.254.39.131 10.48.39.131
*2 Active bbbb.bbbb.bbbb 1 V02 Ready 169.254.39.132 10.48.39.132
此命令顯示機箱編號和冗餘埠狀態,作為第一步故障排除很有用。
若要驗證keepalive連線埠上的keepalive計數器,可以使用以下命令。
WLC#show platform software stack-mgr chassis active R0 sdp-counters
Stack Discovery Protocol (SDP) Counters
---------------------------------------
Message Tx Success Tx Fail Rx Success Rx Fail
------------------------------------------------------------------------------
Discovery 162054 2 28 0
Neighbor 23 3 12 0
Keepalive 189856 1665 187970 0
SEPPUKU 0 0 0 0
Standby Elect Req 2 0 0 0
Standby Elect Ack 0 0 2 0
Standby IOS State 0 0 4 0
Reload Req 0 0 0 0
Reload Ack 0 0 0 0
SESA Mesg 0 0 0 0
RTU Msg 0 0 0 0
Disc Timer Stop 1 0 2 0
---------------------------------------
WLC#show platform software stack-mgr chassis standby R0 sdp-counters
Stack Discovery Protocol (SDP) Counters
---------------------------------------
Message Tx Success Tx Fail Rx Success Rx Fail
------------------------------------------------------------------------------
Discovery 14 2 19 0
Neighbor 6 2 5 0
Keepalive 175905 0 176196 0
SEPPUKU 0 0 0 0
Standby Elect Req 0 0 1 0
Standby Elect Ack 1 0 0 0
Standby IOS State 2 0 0 0
Reload Req 0 0 0 0
Reload Ack 0 0 0 0
SESA Mesg 0 0 0 0
RTU Msg 0 0 0 0
Disc Timer Stop 1 0 0 0
---------------------------------------
WLC#show platform software stack-mgr chassis standby R0 peer-timeout
Peer Chassis Peer-timeout (ms) 50% Mark 75% Mark
--------------------------------------------------------------------------
2 500 0 0
其他命令
使用以下命令,可以在控制器的備援連線埠上擷取封包擷取
WLC#test wireless redundancy packetdump start
Redundancy Port PacketDump Start
Packet capture started on RP port.
WLC#test wireless redundancy packetdump stop
Redundancy Port PacketDump Stop
Packet capture stopped on RP port.
使用這些指令進行的擷取會儲存在bootflash:
控制器的正文中,名稱下haIntCaptureLo.pcap
方。
您也可以使用此命令在備援連線埠上執行keepalive測試。
WLC#test wireless redundancy rping
Redundancy Port ping
PING 169.254.39.131 (169.254.39.131) 56(84) bytes of data.
64 bytes from 169.254.39.131: icmp_seq=1 ttl=64 time=0.316 ms
64 bytes from 169.254.39.131: icmp_seq=2 ttl=64 time=0.324 ms
64 bytes from 169.254.39.131: icmp_seq=3 ttl=64 time=0.407 ms
--- 169.254.39.131 ping statistics ---
3 packets transmitted, 3 received, 0% packet loss, time 2025ms
rtt min/avg/max/mdev = 0.316/0.349/0.407/0.041 ms
瞭解更多詳細資訊
要檢視ROMMON變數配置(該配置向我們顯示實際配置在變數上的反映方式),可以使用此命令。
WLC#show romvar
ROMMON variables:
MCP_STARTUP_TRACEFLAGS = 00000000:00000000
SWITCH_NUMBER = 2
CONFIG_FILE =
BOOTLDR =
STACK_1_1 = 0_0
BOOT = bootflash:packages.conf,12;
LICENSE_SUITE =
CHASSIS_HA_IFNAME = GigabitEthernet3
CHASSIS_HA_IFMAC = 00:50:56:8D:2A:93
SWITCH_PRIORITY = 1
RMI_INTERFACE_NAME = Vlan39
RMI_CHASSIS_LOCAL_IP = 10.48.39.132
RMI_CHASSIS_REMOTE_IP = 10.48.39.131
CHASSIS_HA_LOCAL_IP = 169.254.39.132
CHASSIS_HA_REMOTE_IP = 169.254.39.131
CHASSIS_HA_LOCAL_MASK = 255.255.255.0
RET_2_RTS =
LICENSE_BOOT_LEVEL = ,csr1000v:csr1000v;
BSI = 0
RET_2_RCALTS =
RANDOM_NUM = 193112462
此命令顯示機箱的優先順序,包括RMI和RP詳細資訊、對等超時以及更多有用的詳細資訊。
我們也可以監控WLC上執行HA SSO的進程,這兩個進程是stack_mgr和rif_mgr。
為此,請使用命令收集指向文本檔案的always on跟蹤,此處的時間引數可以調整以覆蓋我們要進行故障排除的時間範圍。
show logging process stack_mgr start last 30 minutes to-file bootflash:stack_mgr_logs.txt
show logging process rif_mgr start last 30 minutes to-file bootflash:rif_mgr_logs.txt
註:必須注意的是,當控制器充當備用埠時,待命WLC的服務埠已停用且無法訪問。
典型方案
使用者強制
如果您檢視切換歷史記錄,會看到使用者使用命令在控制器之間發起切換時出現「使用者強制redundancy force-switchover
」。
WLC#show redundancy switchover history
Index Previous Current Switchover Switchover
active active reason time
----- -------- ------- ---------- ----------
1 1 2 user forced 11:38:23 Central Fri Mar 10 2023
已移除活動裝置
如果您檢視切換歷史記錄,可以看到「活動單元已移除」,這表示兩個控制器之間的冗餘埠上通訊丟失。
WLC#show redundancy switchover history
Index Previous Current Switchover Switchover
active active reason time
----- -------- ------- ---------- ----------
2 2 1 active unit removed 11:55:36 Central Fri Mar 10 2023
如果兩個控制器之間的連結關閉,就可能會發生這種情況;但是如果一個WLC裝置突然關閉(電源故障)或崩潰,也可能會發生這種情況。監視兩個WLC以瞭解它們是否具有指示意外崩潰/重新啟動的系統報告很有意義。
活動丟失GW
如果您檢視切換歷史記錄,可以看到「活動丟失GW」,這表示與RMI埠上的網關失去通訊。
WLC#show redundancy switchover history
Index Previous Current Switchover Switchover
active active reason time
----- -------- ------- ---------- ----------
3 1 2 Active lost GW 12:00:26 Central Fri Mar 10 2023
如果作用中控制器與其閘道之間的連結關閉,就會發生這種情況。
參考資料