分析一次STP无法生效的故障
生活随笔
收集整理的這篇文章主要介紹了
分析一次STP无法生效的故障
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
今天下午,突然間收到通知,下面某個分點的故障報告:由于機房線路整改,網(wǎng)絡突然中斷。所有工作站無法連接服務器。
由于事關重要,領導要求立即趕往現(xiàn)場進行技術支援。路途中我經(jīng)過多次與分點技術人員進行交流,整理了拓撲資料:
MDF連接網(wǎng)關、服務器,部分工作站。MDF通過兩對光纖到其中一個IDF的兩臺交換機,這兩臺交換機作為匯聚,與其它接入交換機互聯(lián)。上述兩臺樓層核心互聯(lián),與MDF的交換機成環(huán)保護。IDF另備有1條到MDF的UTP作備用。
故障發(fā)生時,綠色,即所有連接到MDF的工作站連接服務器沒有問題;但紅色,即連接到該IDF的所有工作站均無法連接服務器。結合之前線路整改,由此判斷,應該是MDF與IDF之間的樓層骨干中斷。但由于局域網(wǎng)已成環(huán)保護,照理來說,即使其中一條Fiber骨干終端,STP應該能夠啟動另一條Fiber作為樓層骨干。為何STP收斂會造成上述情況呢?
由于趕到現(xiàn)場前故障已經(jīng)排除,但沒有作現(xiàn)場錄像取證,因此無法判斷屬于哪方的責任。只能從設備日志中了解相關情況。
根據(jù)現(xiàn)場工作人員的事故描述,發(fā)生故障時,在MDF檢查的工作人員沒有發(fā)現(xiàn)異常情況;而IDF檢查工作人員檢查發(fā)現(xiàn),IS1光纖模塊燈為黃色,而MS1光纖模塊燈正常。由于當時正對MDF的配線進行登記,有可能觸碰了MDF的交換機光纖線路。工作人員經(jīng)過插拔并清潔光纖口后插回,網(wǎng)絡恢復正常。 到達事故現(xiàn)場后,開始著手進行故障分析。首先登錄IS1檢查Log,發(fā)現(xiàn)備案密碼錯誤(低級錯誤,應自我檢討),于是登錄到MS1,show log,發(fā)現(xiàn)最近的Log里面居然沒有任何級聯(lián)口的提示!照例說,IS1亮黃燈,應該會造成MS1同時報警,為何MS1卻沒有告警呢?
通過現(xiàn)場不斷了解情況,我了解到當時施工方所做操作為檢查光纖跳線的連接情況。一般來說,光纖對操作,無論插拔都是每根單獨進行的。難道說是UDLD?根據(jù)UDLD描述,單進端的網(wǎng)橋STP是無法檢查出異常情況的。假如說MS1接收正常,IS1接受異常,在IS1已經(jīng)進行STP生成樹運算并要求啟用另一條Fiber時,MS1卻依然沒有進行STP計算。因此MS1有可能仍舊采用舊的MAC表地址,導致工作站無法正常連接到服務器!
由于當時正處于工作時間,不便進行測試。于稍晚時,分點工作人員有單獨進行了一次STP觸發(fā)測試,發(fā)現(xiàn)當兩對光纖同時拔下時,經(jīng)過大約9個ICMP Timeout后,STP收斂。基本證明了問題成因為單向鏈路導致IDF網(wǎng)絡中斷。
經(jīng)驗總結:這次工作總結起來還有很多做的不夠的地方。第一是安全實施不嚴謹,以為STP成環(huán)即可實現(xiàn)局域網(wǎng)線路保護,卻忽視了實驗室里極少提到的UDLD;第二是理論知識掌握不牢,對于故障成因的分析沒有抓住要點,造成分析時間過長;第三是日常管理不到位,很多資料都是由分點提供,也沒有經(jīng)過校對,影響了排查時間。
本文轉自 gole_huang 51CTO博客,原文鏈接:http://blog.51cto.com/golehuang/530453
由于事關重要,領導要求立即趕往現(xiàn)場進行技術支援。路途中我經(jīng)過多次與分點技術人員進行交流,整理了拓撲資料:
MDF連接網(wǎng)關、服務器,部分工作站。MDF通過兩對光纖到其中一個IDF的兩臺交換機,這兩臺交換機作為匯聚,與其它接入交換機互聯(lián)。上述兩臺樓層核心互聯(lián),與MDF的交換機成環(huán)保護。IDF另備有1條到MDF的UTP作備用。
故障發(fā)生時,綠色,即所有連接到MDF的工作站連接服務器沒有問題;但紅色,即連接到該IDF的所有工作站均無法連接服務器。結合之前線路整改,由此判斷,應該是MDF與IDF之間的樓層骨干中斷。但由于局域網(wǎng)已成環(huán)保護,照理來說,即使其中一條Fiber骨干終端,STP應該能夠啟動另一條Fiber作為樓層骨干。為何STP收斂會造成上述情況呢?
由于趕到現(xiàn)場前故障已經(jīng)排除,但沒有作現(xiàn)場錄像取證,因此無法判斷屬于哪方的責任。只能從設備日志中了解相關情況。
根據(jù)現(xiàn)場工作人員的事故描述,發(fā)生故障時,在MDF檢查的工作人員沒有發(fā)現(xiàn)異常情況;而IDF檢查工作人員檢查發(fā)現(xiàn),IS1光纖模塊燈為黃色,而MS1光纖模塊燈正常。由于當時正對MDF的配線進行登記,有可能觸碰了MDF的交換機光纖線路。工作人員經(jīng)過插拔并清潔光纖口后插回,網(wǎng)絡恢復正常。 到達事故現(xiàn)場后,開始著手進行故障分析。首先登錄IS1檢查Log,發(fā)現(xiàn)備案密碼錯誤(低級錯誤,應自我檢討),于是登錄到MS1,show log,發(fā)現(xiàn)最近的Log里面居然沒有任何級聯(lián)口的提示!照例說,IS1亮黃燈,應該會造成MS1同時報警,為何MS1卻沒有告警呢?
通過現(xiàn)場不斷了解情況,我了解到當時施工方所做操作為檢查光纖跳線的連接情況。一般來說,光纖對操作,無論插拔都是每根單獨進行的。難道說是UDLD?根據(jù)UDLD描述,單進端的網(wǎng)橋STP是無法檢查出異常情況的。假如說MS1接收正常,IS1接受異常,在IS1已經(jīng)進行STP生成樹運算并要求啟用另一條Fiber時,MS1卻依然沒有進行STP計算。因此MS1有可能仍舊采用舊的MAC表地址,導致工作站無法正常連接到服務器!
由于當時正處于工作時間,不便進行測試。于稍晚時,分點工作人員有單獨進行了一次STP觸發(fā)測試,發(fā)現(xiàn)當兩對光纖同時拔下時,經(jīng)過大約9個ICMP Timeout后,STP收斂。基本證明了問題成因為單向鏈路導致IDF網(wǎng)絡中斷。
經(jīng)驗總結:這次工作總結起來還有很多做的不夠的地方。第一是安全實施不嚴謹,以為STP成環(huán)即可實現(xiàn)局域網(wǎng)線路保護,卻忽視了實驗室里極少提到的UDLD;第二是理論知識掌握不牢,對于故障成因的分析沒有抓住要點,造成分析時間過長;第三是日常管理不到位,很多資料都是由分點提供,也沒有經(jīng)過校對,影響了排查時間。
本文轉自 gole_huang 51CTO博客,原文鏈接:http://blog.51cto.com/golehuang/530453
總結
以上是生活随笔為你收集整理的分析一次STP无法生效的故障的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一道笔试题--求二进制数1的个数
- 下一篇: reverse mapping chec