同事發現某台機器上message日誌數量突然暴增,簡單查看了下有內存相關的報錯,所以轉交給我來查看。
Message日誌進入伺服器查看message日誌,先看看同事說的警告到底是什麼,如下圖:
還真是,通道3,第一個插槽的記憶體發生故障了。但是,我只知道A1/B1/A2/B2,所以我還是繼續。
不論怎樣,Ipmitool工具查看了下,確實是有記憶體告警,如下圖
#雖然告警,可是無法定位大具體哪根記憶體壞了呀
IDRAC-web不論怎樣,我們還有DELL自帶的IDRAC的web頁面可以查看硬體狀態,登陸看看,先看看日誌,這裡有了吧,B6內存槽故障
#再看看硬體狀態,B6記憶體存在警告
#就此,我找到了我想要的信息,定位到了B6內存故障,需要更換,至於如何更換,需要注意哪些事項,以後再說。
總結硬體安全是伺服器最底層的安全,一定要做好各項硬體監控,及時處理硬體故障,否則,你們懂的。介紹幾種常見的涉及硬體故障分析的日誌:
以上是利用日誌分析輕鬆診斷硬體故障的詳細內容。更多資訊請關注PHP中文網其他相關文章!