Cisco路由器故障诊断技术(3)
生活随笔
收集整理的這篇文章主要介紹了
Cisco路由器故障诊断技术(3)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Cisco路由器故障診斷技術(3)<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> ?? ?3.4 trace命令
?? ?trace命令提供路由器到目的地址的每一跳的信息。它通過控制IP報文的生存期(TTL)字段來實現。TTL等于1的ICMP回應請求報文將被首先發送。路徑上的第一個路由器將會丟棄該報文并且發送回標識錯誤消息的報文。錯誤消息通常是ICMP超時消息,表明報文順利到達路徑的下一跳,或者端口不可達消息,表明報文已經被目的地址接收但是不能向上傳送到IP協議棧。
?? ?為了獲得往返延遲時間的信息,trace發送三個報文并顯示平均延遲時間。然后將報文的TTL字段加1并發送3個報文。這些報文將到達路徑的第二個路由器上,并返回超時錯誤或者端口不可達消息。反復使用這一方法,不斷增加報文的TTL字段的值,直到接收到目的地址的響應消息。
?? ?在有些情況下,使用trace命令可能會導致故障。因為IOS中存在與trace命令相關的bug。這些bug的相關信息可以從CCO得到。另外一個問題是,某些目標站點不響應ICMP端口不可達消息。當命令的輸出顯示一系列星號(*)時,就可能碰到了此類站點。用戶可以使用Ctrl-Shift-6中斷命令的執行。
?? ?用戶執行模式
?? ?下面展示了一個簡單的在用戶執行模式下執行的trace命令的輸出。到達目的地的距離是3跳。TTL值為1的3個報文的響應消息是ICMP超時錯誤,并且返回報文的IP地址有兩個。因為路由器1和路由器2在同一個網段中,并且它們到路由器3的距離都是一跳,因此這些路由器都響應該報文。
下面列出了IP trace命令的輸出中出現的不同字符及其含義:
?? ?XY msec 在接收到響應消息之前的往返延遲(以毫秒為單位)
?? ?* 報文超時
?? ?? 報文類型不能識別
?? ?U 端口不可達
?? ?P 協議不可達
?? ?N 網絡不可達
?? ?H 主機不可達
?? ?Q ICMP 源抑制
?? ?特權模式擴展Trace 用于擴展ping命令的許多屬性都可以用來擴展trace命令的功能。擴展trace命令的特殊屬性有:
?? ?Numeric display
?? ?在缺省情況下,trace命令的輸出中既包括IP地址也包括其對應的DNS域名。如果用戶不需要顯示DNS域名,則可以使用該屬性。
?? ?Probe count 其缺省值為3,用戶可以根據需要進行調整。
?? ?TTL 該值可以在最大和最小TTL值之間變化。
?? ?Port number
?? ?這是一個非常有用的屬性,它可以使工程技術人員跟蹤特定的傳輸層端口。因此,不但可以確認源端與目的端之間的IP連通性,而且可以確認高層服務是否可被訪問。
?? ?與trace命令相關的另外一個問題是,如果存在到達目的地的多條路徑,返回報文的源地址可能不相同。在這種情況下,用戶需要仔細比較不同返回報文的延遲時間。如果仍不能得到明確的結果,可以遠程訪問路徑上的一個或多個路由器,使用trace命令訪問源地址和目的地址。
?? ?4 理解Cisco錯誤消息
? ?? ?4.1 錯誤消息格式
?? ?系統錯誤消息格式如下:
Facility 它指出錯誤消息涉及的設備名。該值可以是協議、硬件設備或者系統軟件模塊。
?? ?Subfacility 它僅與通道接口處理器(CIP)卡有關。詳細的信息可以參見Cisco文檔的相關章節。
?? ?Severity 它是一個范圍在0到7之間的數字。數字的值越小,嚴重程度越高。
?? ?Mnemonic 唯一標識錯誤消息的單值代碼。該代碼通常可以暗示錯誤的類型。
?? ?Message Text 它是錯誤消息的簡短描述,其中包括涉及的路由器硬件和軟件信息。
?? ?下面是一些錯誤消息的示例。用戶可以查閱CCO ISO文檔的系統錯誤消息一節,以查找這些錯誤消息的說明。
?? ?%DUAL-3-SIA:Route 171.155.148.192/26 stuck-in-active state in IP-EIGP 211.
?? ?Cleaning up
?? ?%LANCE-3-OWNERR: Unit 0, buffer ownership error
?? ?需要注意的是,并不是所有的消息都涉及到故障或者問題的狀況。某些消息顯示的是狀態方面的信息。例如,以下消息僅表明ISDN BRI
?? ?0接口與特定的遠端數據連接。
?? ?%ISDN-6-CONNECT: Interface BRI0 is now connected to 95551212
?? ?4.2 Traceback Report
?? ?某些與路由器內部錯誤相關的錯誤消息包含了traceback信息。在向Cisco TAC報告錯誤時,應在錯誤描述中加入這些信息。
?? ?5 錯誤消息和事件信息的日志
? ?? ?根據錯誤消息的重要性和有效性,Cisco錯誤消息可以被記錄到以下位置:
;; 控制臺n?? ?
;; 虛擬終端n?? ?
;; Syslog服務器n?? ?
;; 內部緩沖區n?? ?
?? ?logging on命令使日志消息的輸出到上述位置。對于Syslog服務器,必須使用下述全局配置命令指明服務器的IP地址:
?? ?logging ip-address
?? ?通過反復使用這一命令,可以建立一個服務器的列表。在管理大型網絡時,通常需要設置冗余服務器。
?? ?logging
?? ?buffered命令用于將日志信息發送到內部緩沖區。緩沖區的大小必須在4096字節以上。缺省值根據系統平臺的不同而不同。用戶需要選擇適合環境的緩沖區大小。如果緩沖區太小,新的消息將會覆蓋舊的消息。這有可能會導致問題。但是,如果緩沖區大小過大將會浪費系統緩存。no
?? ?logging buffered命令將禁止消息被寫入內部緩存。
?? ?用戶可以使用show logging命令顯示內部緩沖區的內容。如果用戶需要某一時間段的信息,首先使用NTP或者手工設置時鐘,具體操作為:
?? ?YH-Router#clock set 11:37:00 December 2000
?? ?YH-Router#sh clock
?? ?11:37:03.596 PST Fri Dec 11 2000
?? ?日志消息的時間戳和調試信息可以使用以下全局配置命令:
?? ?YH-Router (config)#service timestamps log datetime
?? ?YH-Router (config)#service timestamps debug datetime
?? ?terminal
?? ?monitor命令將在當前終端上顯示調試時的日志信息。該命令不是一個配置命令。相反,它可以通過telnet到路由器時在命令行方式下使用。
?? ?在大多數情況下,用戶可能需要顯示某一級別的日志信息。因此,日志信息被分為八個不同的級別,按照重要程度由高到低排列如下:
例如,需要在控制臺上顯示嚴重程度等于或者大于警告(Warning)的所有日志信息,可以使用下述全局配置命令:
?? ?logging console warning
?? ?類似的,將某種類型的日志信息發送到當前的終端時,使用
?? ?logging monitor level
?? ?或者將信息發送到Syslog服務器時使用
?? ?logging trap level
?? ?與terminal monitor命令不同,logging monitor命令是路由器配置的一部分。前一種命令不允許在不同的安全級別下執行。
?? ?需要注意的是,將日志記錄到不同的位置時,系統開銷變化很大。將日志記錄到控制臺的開銷比較大,然而將日志記錄到虛擬終端時開銷較小。使用Syslog服務器時開銷更小。系統開銷最小的日志寫入方式是寫入內部緩沖區。
?? ?6 核心轉儲(Core Dump)
?? ?為了查找路由器崩潰的原因,我們可以使用許多命令來獲取有效的信息。其中我們已經講解了show
?? ?stacks命令的用法。核心轉儲是系統內存映象的拷貝,它可以被寫入到TFTP服務器中。從這個二進制文件中,我們可以獲得與路由器崩潰或者嚴重誤操作相關的信息,通過這些信息可以排除可能的故障。
?? ?下面的配置命令將核心轉儲寫入到命令中IP地址對應的TFTP服務器上:
?? ?exception dump ip-address
?? ?write core命令通常用于路由器發生嚴重的誤操作但是沒有完全崩潰時,保存核心映像。
?? ?只有運行IOS v 9.0或更高版本的服務器才可以使用核心轉儲。但是,需要注意的是,在使用核心轉儲時,最好獲取有經驗的工程師或者Cisco
?? ?TAC的支持。
?? ?7 結束語
?? ?要順利地診斷并排除網絡故障,網絡工程技術人員必須掌握兩種基本的技能。首先是對網絡技術和協議要有清楚的理解,它是診斷與排除網絡故障的基礎。沒有適當的知識和經驗,故障診斷與排除工具比如路由器診斷命令和網絡分析儀都不能發揮其作用。
?? ?網絡工程技術人員必須掌握的第二種技能是將所掌握的知識以有條理的方式應用于診斷和排除網絡故障的過程中。本文雖然只闡述了一些診斷的命令,但需要強調的是:故障診斷與排除是一種結構化的方法。許多工程技術人員認為故障診斷與排除計劃不如研究和應用技術本身重要。事實上,正確的計劃在故障診斷與排除過程中往往起決定性的作用。在故障排除過程中,一個偶然的行為可能使故障得以順利解決,但是它不能替代結構化的故障診斷與排除方法。
?? ?網絡故障的排除是一項系統工程,應該經過定義問題、搜集事實、基于事實考慮可能性、建立行動計劃、實施計劃、觀察結果和循環過程等步驟,這一過程就如同軟件開發過程的瀑布模型,其重要性是不言而喻的。
?? ?trace命令提供路由器到目的地址的每一跳的信息。它通過控制IP報文的生存期(TTL)字段來實現。TTL等于1的ICMP回應請求報文將被首先發送。路徑上的第一個路由器將會丟棄該報文并且發送回標識錯誤消息的報文。錯誤消息通常是ICMP超時消息,表明報文順利到達路徑的下一跳,或者端口不可達消息,表明報文已經被目的地址接收但是不能向上傳送到IP協議棧。
?? ?為了獲得往返延遲時間的信息,trace發送三個報文并顯示平均延遲時間。然后將報文的TTL字段加1并發送3個報文。這些報文將到達路徑的第二個路由器上,并返回超時錯誤或者端口不可達消息。反復使用這一方法,不斷增加報文的TTL字段的值,直到接收到目的地址的響應消息。
?? ?在有些情況下,使用trace命令可能會導致故障。因為IOS中存在與trace命令相關的bug。這些bug的相關信息可以從CCO得到。另外一個問題是,某些目標站點不響應ICMP端口不可達消息。當命令的輸出顯示一系列星號(*)時,就可能碰到了此類站點。用戶可以使用Ctrl-Shift-6中斷命令的執行。
?? ?用戶執行模式
?? ?下面展示了一個簡單的在用戶執行模式下執行的trace命令的輸出。到達目的地的距離是3跳。TTL值為1的3個報文的響應消息是ICMP超時錯誤,并且返回報文的IP地址有兩個。因為路由器1和路由器2在同一個網段中,并且它們到路由器3的距離都是一跳,因此這些路由器都響應該報文。
| ?? ?Router3#trace 171.144.1.39 ?? ?Type escape sequence to abort. ?? ?Tracing the route to Router9 (171.144.1.39) ?? ?1 Router2 (165.48.48.2) 0 msec ?? ?Router2 (165.48.48.2) 0 msec ?? ?Router1 (165.48.48.1) 0 msec ?? ?2 165.48.48.129 12 msec ?? ?Router6 (165.48.49.129) 12 msec 12 msec ?? ?3 Router4 (171.133.1.2) 12 msec 12 msec ?? ?Router9 (171.144.1.39) 12 msec 12 msec ?? ?Router3 ?? ? |
?? ?XY msec 在接收到響應消息之前的往返延遲(以毫秒為單位)
?? ?* 報文超時
?? ?? 報文類型不能識別
?? ?U 端口不可達
?? ?P 協議不可達
?? ?N 網絡不可達
?? ?H 主機不可達
?? ?Q ICMP 源抑制
?? ?特權模式擴展Trace 用于擴展ping命令的許多屬性都可以用來擴展trace命令的功能。擴展trace命令的特殊屬性有:
?? ?Numeric display
?? ?在缺省情況下,trace命令的輸出中既包括IP地址也包括其對應的DNS域名。如果用戶不需要顯示DNS域名,則可以使用該屬性。
?? ?Probe count 其缺省值為3,用戶可以根據需要進行調整。
?? ?TTL 該值可以在最大和最小TTL值之間變化。
?? ?Port number
?? ?這是一個非常有用的屬性,它可以使工程技術人員跟蹤特定的傳輸層端口。因此,不但可以確認源端與目的端之間的IP連通性,而且可以確認高層服務是否可被訪問。
?? ?與trace命令相關的另外一個問題是,如果存在到達目的地的多條路徑,返回報文的源地址可能不相同。在這種情況下,用戶需要仔細比較不同返回報文的延遲時間。如果仍不能得到明確的結果,可以遠程訪問路徑上的一個或多個路由器,使用trace命令訪問源地址和目的地址。
?? ?4 理解Cisco錯誤消息
? ?? ?4.1 錯誤消息格式
?? ?系統錯誤消息格式如下:
| ?? ?%Facility - subfacility - Severity - Mnemonic : Message Text ?? ? |
?? ?Subfacility 它僅與通道接口處理器(CIP)卡有關。詳細的信息可以參見Cisco文檔的相關章節。
?? ?Severity 它是一個范圍在0到7之間的數字。數字的值越小,嚴重程度越高。
?? ?Mnemonic 唯一標識錯誤消息的單值代碼。該代碼通常可以暗示錯誤的類型。
?? ?Message Text 它是錯誤消息的簡短描述,其中包括涉及的路由器硬件和軟件信息。
?? ?下面是一些錯誤消息的示例。用戶可以查閱CCO ISO文檔的系統錯誤消息一節,以查找這些錯誤消息的說明。
?? ?%DUAL-3-SIA:Route 171.155.148.192/26 stuck-in-active state in IP-EIGP 211.
?? ?Cleaning up
?? ?%LANCE-3-OWNERR: Unit 0, buffer ownership error
?? ?需要注意的是,并不是所有的消息都涉及到故障或者問題的狀況。某些消息顯示的是狀態方面的信息。例如,以下消息僅表明ISDN BRI
?? ?0接口與特定的遠端數據連接。
?? ?%ISDN-6-CONNECT: Interface BRI0 is now connected to 95551212
?? ?4.2 Traceback Report
?? ?某些與路由器內部錯誤相關的錯誤消息包含了traceback信息。在向Cisco TAC報告錯誤時,應在錯誤描述中加入這些信息。
?? ?5 錯誤消息和事件信息的日志
? ?? ?根據錯誤消息的重要性和有效性,Cisco錯誤消息可以被記錄到以下位置:
;; 控制臺n?? ?
;; 虛擬終端n?? ?
;; Syslog服務器n?? ?
;; 內部緩沖區n?? ?
?? ?logging on命令使日志消息的輸出到上述位置。對于Syslog服務器,必須使用下述全局配置命令指明服務器的IP地址:
?? ?logging ip-address
?? ?通過反復使用這一命令,可以建立一個服務器的列表。在管理大型網絡時,通常需要設置冗余服務器。
?? ?logging
?? ?buffered命令用于將日志信息發送到內部緩沖區。緩沖區的大小必須在4096字節以上。缺省值根據系統平臺的不同而不同。用戶需要選擇適合環境的緩沖區大小。如果緩沖區太小,新的消息將會覆蓋舊的消息。這有可能會導致問題。但是,如果緩沖區大小過大將會浪費系統緩存。no
?? ?logging buffered命令將禁止消息被寫入內部緩存。
?? ?用戶可以使用show logging命令顯示內部緩沖區的內容。如果用戶需要某一時間段的信息,首先使用NTP或者手工設置時鐘,具體操作為:
?? ?YH-Router#clock set 11:37:00 December 2000
?? ?YH-Router#sh clock
?? ?11:37:03.596 PST Fri Dec 11 2000
?? ?日志消息的時間戳和調試信息可以使用以下全局配置命令:
?? ?YH-Router (config)#service timestamps log datetime
?? ?YH-Router (config)#service timestamps debug datetime
?? ?terminal
?? ?monitor命令將在當前終端上顯示調試時的日志信息。該命令不是一個配置命令。相反,它可以通過telnet到路由器時在命令行方式下使用。
?? ?在大多數情況下,用戶可能需要顯示某一級別的日志信息。因此,日志信息被分為八個不同的級別,按照重要程度由高到低排列如下:
| ;; Emergenciesn?? ? ;; Alertsn?? ? ;; Criticaln?? ? ;; Errorsn?? ? ;; Warningsn?? ? ;; Notificationsn?? ? ;; Informationaln?? ? ;; Debuggingn?? ? ?? ? |
?? ?logging console warning
?? ?類似的,將某種類型的日志信息發送到當前的終端時,使用
?? ?logging monitor level
?? ?或者將信息發送到Syslog服務器時使用
?? ?logging trap level
?? ?與terminal monitor命令不同,logging monitor命令是路由器配置的一部分。前一種命令不允許在不同的安全級別下執行。
?? ?需要注意的是,將日志記錄到不同的位置時,系統開銷變化很大。將日志記錄到控制臺的開銷比較大,然而將日志記錄到虛擬終端時開銷較小。使用Syslog服務器時開銷更小。系統開銷最小的日志寫入方式是寫入內部緩沖區。
?? ?6 核心轉儲(Core Dump)
?? ?為了查找路由器崩潰的原因,我們可以使用許多命令來獲取有效的信息。其中我們已經講解了show
?? ?stacks命令的用法。核心轉儲是系統內存映象的拷貝,它可以被寫入到TFTP服務器中。從這個二進制文件中,我們可以獲得與路由器崩潰或者嚴重誤操作相關的信息,通過這些信息可以排除可能的故障。
?? ?下面的配置命令將核心轉儲寫入到命令中IP地址對應的TFTP服務器上:
?? ?exception dump ip-address
?? ?write core命令通常用于路由器發生嚴重的誤操作但是沒有完全崩潰時,保存核心映像。
?? ?只有運行IOS v 9.0或更高版本的服務器才可以使用核心轉儲。但是,需要注意的是,在使用核心轉儲時,最好獲取有經驗的工程師或者Cisco
?? ?TAC的支持。
?? ?7 結束語
?? ?要順利地診斷并排除網絡故障,網絡工程技術人員必須掌握兩種基本的技能。首先是對網絡技術和協議要有清楚的理解,它是診斷與排除網絡故障的基礎。沒有適當的知識和經驗,故障診斷與排除工具比如路由器診斷命令和網絡分析儀都不能發揮其作用。
?? ?網絡工程技術人員必須掌握的第二種技能是將所掌握的知識以有條理的方式應用于診斷和排除網絡故障的過程中。本文雖然只闡述了一些診斷的命令,但需要強調的是:故障診斷與排除是一種結構化的方法。許多工程技術人員認為故障診斷與排除計劃不如研究和應用技術本身重要。事實上,正確的計劃在故障診斷與排除過程中往往起決定性的作用。在故障排除過程中,一個偶然的行為可能使故障得以順利解決,但是它不能替代結構化的故障診斷與排除方法。
?? ?網絡故障的排除是一項系統工程,應該經過定義問題、搜集事實、基于事實考慮可能性、建立行動計劃、實施計劃、觀察結果和循環過程等步驟,這一過程就如同軟件開發過程的瀑布模型,其重要性是不言而喻的。
?
轉載于:https://blog.51cto.com/ciscolj/82112
總結
以上是生活随笔為你收集整理的Cisco路由器故障诊断技术(3)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 梦到吃了一口屎好不好
- 下一篇: 百安俱乐部关于“BotNet专题讨论”资