交换机 : Cisco Nexus 7000 系列交换机

排除故障连结7000 6.0KW AC电源模块失败

2016 年 10 月 27 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 11 月 7 日) | 反馈

简介

本文描述可能的原因和推荐的纠正措施思科连结7000 6.0KW AC电源模块失败警报的。

贡献用斯科特Laffer, Cisco TAC工程师。

先决条件

要求

Cisco 建议您具有以下主题的基础知识:

  • Cisco连结7000系列交换机(N7K)
  • 思科连结操作系统(NX-OS) CLI

使用的组件

本文档中的信息基于以下软件和硬件版本:

  • NX-OS所有版本N7K的
  • Cisco连结7010系列机箱
  • 连结7000 6.0KW AC电源模块(产品号(PID)编号N7K-AC-6.0KW)

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

背景信息

N7K电源模块可以列出作为失败几个不同的原因的,其中每一与对提供给机箱的电源的多种影响。

电源模块失败在许多位置可以报告如失败,例如:

  • 在电源模块上,故障灯闪烁红灯。

  • CLI命令的show environment power的输出表明电源在失败/关闭的状态:
    Nexus7000# show environment power
    Power Supply:
    Voltage: 50 Volts
    Power Actual Total
    Supply Model Output Capacity Status
    (Watts ) (Watts )
    ------- ------------------- ----------- ----------- --------------
    1 N7K-AC-6.0KW 350 W 6000 W Ok
    2 N7K-AC-6.0KW 470 W 6000 W Fail/Shut
    3 N7K-AC-6.0KW 313 W 6000 W Ok
    <snip>
  • 消息在Syslog出现:
    2013 Dec  1 22:29:20.814 Nexus7000  PLATFORM-2-PS_FAIL  Power supply 2
    failed or shut down (Serial number AZS1000000W)

注意:保证电源模块当前列出作为失败,在您继续进行在本文描述的信息前。

得到故障代码

当N7K电源模块出故障时,失败的原因在电源部件(PSU)的内置8位寄存器保存。在输出中为了查看这些寄存器,输入detail命令的show environment power到CLI并且寻找硬件alam_bits线路:

Nexus7000# show environment power detail

<snip>

Power Usage Summary:
--------------------
Power Supply redundancy mode (configured) PS-Redundant
Power Supply redundancy mode (operational) PS-Redundant

Total Power Capacity (based on configured mode) 12000 W
Total Power of all Inputs (cumulative) 18000 W
Total Power Output (actual draw) 3060 W
Total Power Allocated (budget) 5593 W
Total Power Available for additional modules 6407 W

Power Usage details:
--------------------
Power reserved for Supervisor(s): 420 W
Power reserved for Fabric Module(s): 500 W
Power reserved for Fan Module(s): 1273 W
Total power reserved for Sups,Fabrics,Fans: 2193 W

Are all inlet chords connected: Yes
Power supply details:
---------------------
PS_1 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0:1A, reg1: 0, reg2: 0, reg3:10
Reg0 bit1: restarted successfully
Reg0 bit3: loss of line1
Reg0 bit4: loss of line2
Reg3 bit4: reserved

PS_2 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No

Hardware alam_bits reg0: 2, reg1: 0, reg2:80, reg3: 10

Reg0 bit1: restarted successfully

PS_3 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0:1A, reg1: 0, reg2: 0, reg3:10
Reg0 bit1: restarted successfully
Reg0 bit3: loss of line1
Reg0 bit4: loss of line2
Reg3 bit4: reserved

在本例中,您能看到电源2 (PS_2)有:

  • 注册0 (reg0)集到2
  • 注册2 (reg2)集到80
  • 注册3 (reg3)集到10

变换寄存器值从十六进制到二进制

为了确定在8位寄存器设置的位,您必须变换十六进制(HEX)值到8位二进制值。示例如下:

注册十六进制值二进制值设置的位(基于的0)
reg020000 00101
reg2801000 00007
reg3100001 00004

失败原因和推荐的纠正措施

基于在此部分提供的表,请匹配设置的寄存器编号和位为了查找失败原因和推荐的纠正措施。

Reg0

默认值位名称注释建议操作
7
0
PEC错误门闩到1,如果PEC错误在SMBus检测写入周期(读周期佩奇由Supervisor检查)。重置和重现的监视器。寻找PEC错误实例其它设备的在SMBus。
6
0
无效访问门闩到1,如果一个只读或未使用寄存器或位置写入对或一个未使用位置读。重置和重现的监视器。寻找错误实例其它设备的在SMBus。
5
0
数据超出范围门闩到1,如果尝试更换控制寄存器到值无效。重置和重现的监视器。寻找错误实例其它设备的在SMBus。
4
0
损耗AC 2AC线路2是<允许的spec。锁上检查AC输入。
3
0
损耗AC 1AC线路1是<允许的spec。锁上检查AC输入。
2
0
发生的关闭门闩到1,如果被关闭的供应发生。检查PSU交换机。
1
0
顺利地开始电源模块能从关闭情况重新启动事件导致关闭是否恢复了。 一旦电源模块顺利地,开始设置此位到1。它可以被系统软件清除通过写入1对此位。此标志提供信息给事件发生解决了的控制器。此信息是有用的,因为重新启动清除所有状态,并且报警信号旗和从电源派出的中断也许仍然是未清的为了控制器能服务。信息性只。不需要采取任何操作。
0
0
Enable (event)管脚HI因为硬件恢复操作信号是HI,电源被关闭。PSU被接地内部地,预计PSU交换机是否取消。如果PSU交换机开,请再按乒乓键交换机。替换PSU。

Reg1

默认值位名称注释建议操作
7
0
内部故障失败的内部诊断。仅潜在的表面问题(参考的Cisco Bug ID CSCty78612)。重置PSU。替换PSU。
6
0
发生的重新通电锁上到1,如果被关闭的受控发生下:
1) 重新通电位寄存器40位5设置
信息性只。不需要采取任何操作。
5
0
50V 2过载电流关闭因为50V输出了2超出了额定的当前,供应关闭了。检查AC输入。重置PSU。
4
0
50V 1过载电流关闭因为50V输出了1超出的额定的当前,供应关闭了。检查AC输入。重置PSU。
3
0
3.4V过载电流关闭因为3.4V输出超出了额定的当前,供应关闭了。检查AC输入。重置PSU。
2
0
50V 2超电压关闭因为50V输出了2超出了额定的电压,供应关闭了。检查AC输入。重置PSU。
1
0
50V 1超电压关闭因为50V输出了1超出的额定的电压,供应关闭了。检查AC输入。重置PSU。
0
0
3.4V超电压关闭因为3.4V输出超出了额定的电压,供应关闭了。检查AC输入。重置PSU。

Reg2

默认值位名称注释建议操作
7
0
风扇故障如果风扇速度下降在70%正常操作速度下面,锁上1。电源模块不会关闭由于风扇故障状况。检查风扇阻碍。替换PSU。
6
0
失败的热量传感器其中一个热量传感器失败。替换PSU。
5
0
在临时的提高2。shutdown供应关闭了由于提高2过热状态。检查环境。
4
0
提高1在临时。shutdown供应关闭了由于提高1过热状态。检查环境。
3
0
在临时的50V 2。shutdown供应关闭了由于50V输出了2过热状态。检查环境。
2
0
在临时的50V 1。shutdown供应关闭了由于50V输出了1个过热状态。检查环境。
1
0
在临时的3.4V。shutdown供应关闭了由于3.4V输出的过热状态。检查环境。
0
0
Over-temp警告发出在一个热量关闭事件之前的5秒。检查环境。

Reg3

默认值位名称注释建议操作
7
0
被关闭的强制如果电源通过电源瘤密钥被关闭,则此位在逻辑1;否则,逻辑0。信息性只。不需要采取任何操作。
6
0
未使用  
5
0
未使用  
4
0
输入模式更改如果AC1或AC2输入方式更改,此位设置到1。信息性只。不需要采取任何操作。
3
0
当前共享故障如果两个模块失效对当前共享,此位设置到1。重置PSU。替换PSU。
2
0
50V模块2在电压下50V输出模块2在额定的电压之下下降了。只有当AC2打开,请警报。替换PSU。
1
0
50V模块1在电压下50V输出模块1在额定的电压之下下降了。只有当AC1打开,请警报。替换PSU。
0
0
在电压下的3.4V3.4V输出下降了下面对估计的电压。替换PSU。

示例结果

有在示例描述使用在本文中的信息,您能看到电源风扇通过设置寄存器失败2,位7。风扇被检查了阻碍(如在表建议),但是未找到什么都。PSU通过退货授权(RMA)然后替换。

相关信息



Document ID: 118956