购买与服务热线:400-810-0466

服务邮箱:Support@sugon.com

一、故障现象

服务器不间断蜂鸣,一直长响,前面板和硬盘以及电源模块指示灯都是正常,操作系统没有影响,能正常操作。

二、排查流程图

image.png

三、故障排查

诊断操作:

1、两电源模块分别单独启动,均能启动并没有报警灯,蜂鸣依旧。

2、在Raid卡界面没有看到硬盘报警,把Raid卡蜂鸣器禁用后重启,蜂鸣依旧。

3、查看BMC,所有感应器正常,日志没有显示任何告警,升级FW,蜂鸣依旧。

4、查看Raid卡日志MgFwLog,没有发现报警,但查看MgEvtLog时,发现如下报警。

seqNum: 0x00001bff

Time: Wed Jun 8 18:21:41 2016

Code: 0x000000d0

40

Class: 0

Locale: 0x04

Event Description: Enclosure PD 08(c Port 0 - 3/p1) Fan 1 returned to normal

Event Data:

===========

Device ID: 8

Enclosure Index: 1

Slot Number: 0

Index: 1

seqNum: 0x00001c00

Time: Wed Jun 8 18:21:45 2016

Code: 0x000000a8

Class: 2

Locale: 0x04

Event Description: Enclosure PD 08(c Port 0 - 3/p1) fan 1 failed

Event Data

===========

Device ID: 8

Enclosure Index: 1

41

Slot Number: 0

Index: 1

seqNum: 0x00001c01

Time: Wed Jun 8 18:31:06 2016

Code: 0x000000b3

Class: 1

Locale: 0x04

Event Description: Enclosure PD 08(c Port 0 - 3/p1) temperature sensor 0 above

warning threshold

Event Data:

===========

Device ID: 8

Enclosure Index: 1

Slot Number: 0

Index: 0

seqNum: 0x00001c02

Time: Wed Jun 8 18:31:07 2016

Code: 0x000000e9

Class: 0

42

Locale: 0x04

Event Description: Enclosure PD 08(c Port 0 - 3/p1) temperature sensor 0 returned to

normal

Event Data:

===========

Device ID: 8

Enclosure Index: 1

Slot Number: 0

Index: 0

从日志中可以看到,硬盘背板的风扇不断报警,从而导致硬盘背板的温度也不断报警,后工程师上门发现硬盘背板风扇停转,更换硬盘背板后问题消失。

四、结论

如果遇到使用12G的智能背板(含风扇),出现无指示的报警时,在BMC和指示灯都没有提示的情况下,请查看Raid卡的MgEvtLog日志,考虑是否背板风扇问题。


联系我们

售后服务

严正声明