华为OPS维护助手
? ? 幾年前,學(xué)習(xí)網(wǎng)絡(luò)的時(shí)候,有一個(gè)考點(diǎn)是思科的EEM,當(dāng)時(shí)對(duì)這個(gè)EEM有很強(qiáng)烈的興趣。時(shí)至今日,近期的現(xiàn)網(wǎng)業(yè)務(wù)也有類似的需求。研究華為產(chǎn)品手冊(cè)發(fā)現(xiàn),華為的OPS維護(hù)助手能完成同樣的需求。
Cisco EEM
? ? EEM是Cisco IOS的嵌入式事件管理器(Embeded Event Manager)的縮寫,它提供了一種分布式的、可擴(kuò)展的、可根據(jù)用戶需求而靈活定制的,用于進(jìn)行事件監(jiān)控和故障恢復(fù)的機(jī)制。利用這種機(jī)制,當(dāng)被監(jiān)控的事件發(fā)生,或者是達(dá)到某個(gè)門限值時(shí),EEM提供了進(jìn)行消息報(bào)告以及采取相應(yīng)動(dòng)作的能力。
? ? 一個(gè)完整的EEM的操作被稱作EEM Policy(EEM 策略),EEM Policy包括:定義監(jiān)控的事件以及當(dāng)被監(jiān)控事件發(fā)生時(shí)所要執(zhí)行的動(dòng)作。
? ? 隨著客戶的網(wǎng)絡(luò)規(guī)模日益龐大,單純依靠現(xiàn)有網(wǎng)管架構(gòu)下網(wǎng)管服務(wù)器與網(wǎng)絡(luò)設(shè)備之間的主從模式,很難解決網(wǎng)絡(luò)管理的成本、復(fù)雜性、擴(kuò)展性以及出現(xiàn)故障時(shí)處理的及時(shí)性等等這些越來(lái)越有挑戰(zhàn)性的問(wèn)題。因此未來(lái)的網(wǎng)絡(luò)管理需求要求網(wǎng)絡(luò)設(shè)備本身具有更高的智能,能夠根據(jù)各種不同的預(yù)定條件或網(wǎng)管人員的要求對(duì)網(wǎng)絡(luò)設(shè)備本身進(jìn)行不同的操作,減少網(wǎng)管人員的維護(hù)壓力、提高對(duì)網(wǎng)絡(luò)故障的響應(yīng)速度。?
? ? Cisco的EEM,從根本上改變了網(wǎng)絡(luò)設(shè)備的管理方式,使得網(wǎng)絡(luò)設(shè)備由現(xiàn)有網(wǎng)絡(luò)管理架構(gòu)中的被動(dòng)報(bào)告者和應(yīng)答者,轉(zhuǎn)變成為積極主動(dòng)的參與者。讓網(wǎng)絡(luò)設(shè)備本身變得更為智能、靈活,幫助網(wǎng)絡(luò)的運(yùn)維人員更輕松、更及時(shí)、更準(zhǔn)確地進(jìn)行網(wǎng)絡(luò)優(yōu)化和故障排除。未來(lái)EEM的發(fā)展將繼續(xù)延伸網(wǎng)絡(luò)設(shè)備的智能,實(shí)現(xiàn)構(gòu)建真正“自診斷、自愈合”的網(wǎng)絡(luò)的目標(biāo)。
? ? EEM的整個(gè)架構(gòu)由:EEM Server、Event Publisher(也稱作:Event Detector)和Event Subscribers (EEM Policy)三個(gè)部分組成。其中,Event Publisher 負(fù)責(zé)監(jiān)控和分析事件,并且在事件發(fā)生時(shí),負(fù)責(zé)向EEM Server 通告事件的發(fā)生。而后,EEM Server觸發(fā)EEM Policy 基于當(dāng)前的系統(tǒng)狀態(tài)以及所配置的具體動(dòng)作,例如:執(zhí)行IOS的命令行、發(fā)送SNMP Trap、發(fā)起主備引擎切換、產(chǎn)生Syslog信息等等,實(shí)施相應(yīng)的恢復(fù)措施。
? ? 目前在Cisco的絕大多數(shù)路由交換產(chǎn)品平臺(tái)上都提供了EEM的功能。
示例:
| 1 2 3 4 5 6 7 8 | event?manager?applet?track_pw318_frommaster? event?syslog?pattern?"Vl318?Grp?1?state?Master"?##?設(shè)定需要監(jiān)控的Syslog中的消息內(nèi)容? action?1.0?cli?command?"en"????##?一旦檢測(cè)到特定模式的消息出現(xiàn),則開始執(zhí)行一系列命令? action?2.0?cli?command?"config?ter"?????? action?3.0?cli?command?"no?ps?pwc318"? action?4.0?cli?command?"int?gi?4/14"? action?4.1?cli?command?"shut"? action?4.2?cli?command?"no?shut" |
HuaWei OPS
? ? 開放可編程系統(tǒng)OPS(Open Programmability System)是指設(shè)備通過(guò)提供統(tǒng)一的應(yīng)用程序接口RESTful API(Representational State Transfer Application Programming Interface)來(lái)開放系統(tǒng),使得系統(tǒng)具備可編程能力,可以運(yùn)行第三方應(yīng)用程序。
? ? OPS允許用戶或第三方開發(fā)商利用系統(tǒng)提供的基礎(chǔ)功能,通過(guò)自主編程,開發(fā)和部署自己的網(wǎng)絡(luò)應(yīng)用程序,從而迅速地實(shí)現(xiàn)業(yè)務(wù)功能擴(kuò)展和設(shè)備的智能化管理,降低運(yùn)維成本和操作的復(fù)雜度。
? ? 傳統(tǒng)的網(wǎng)絡(luò)設(shè)備只能提供有限的功能和已知的服務(wù),不具有動(dòng)態(tài)性和靈活性,而隨著網(wǎng)絡(luò)的迅猛發(fā)展和不斷普及,多樣化、差異化的需求難以得到滿足。部分用戶要求設(shè)備提供不同層次的開放性,便于開發(fā)一些自定義的功能,部署一些私有的管理策略,實(shí)現(xiàn)自動(dòng)化運(yùn)維等功能,以降低管理成本。
? ? 為此,華為公司推出OPS,提供網(wǎng)絡(luò)設(shè)備的開放可編程能力。OPS允許用戶或第三方開發(fā)商利用系統(tǒng)開放的RESTful API,開發(fā)和部署自己的網(wǎng)絡(luò)管理策略,從而迅速地實(shí)現(xiàn)業(yè)務(wù)功能擴(kuò)展、自動(dòng)部署和設(shè)備的智能化管理,降低運(yùn)維成本和操作的復(fù)雜度。通過(guò)配置OPS,實(shí)現(xiàn)設(shè)備更加靈活、智能的管理及維護(hù)。
示例:
| 1 2 3 4 5 6 7 8 9 | [~DeviceA]?ops [~DeviceA-ops]?assistant?collect_health [*DeviceA-ops-assistant-collect_health]?condition?timer?cron?0?1?*?*?*?* [*DeviceA-ops-assistant-collect_health]?execute?1?command?display?device?>?health.txt [*DeviceA-ops-assistant-collect_health]?execute?1.5?command?display?health?>>?health.txt [*DeviceA-ops-assistant-collect_health]?execute?2?command?display?ip?routing-table?>>?health.txt [*DeviceA-ops-assistant-collect_health]?execute?2.5?command?display?lldp?neighbor?brief?>>?health.txt [*DeviceA-ops-assistant-collect_health]?execute?3?command?tftp?10.2.1.1?put?health.txt [*DeviceA-ops-assistant-collect_health]?commit |
? ? 在我們的業(yè)務(wù)場(chǎng)景中,OPS的主要作用是智能化業(yè)務(wù)的切換,而感知業(yè)務(wù)質(zhì)量的方式主要是通過(guò)NQA功能。在NQA中,我們定義了對(duì)端的監(jiān)測(cè)點(diǎn)以及下一跳路徑,通過(guò)ICMP包成功率反饋NQA是否failed。OPS中使用condition關(guān)聯(lián)NQA執(zhí)行相應(yīng)的操作。
命令如下:
| 1 2 3 4 5 6 7 | ops ?assistant?test ??execute?1?command?sys ??execute?1.5?command?interface?gig?1/0/1 ??execute?2?command?shutdown ??execute?3?command?commit ??condition?event?feature?nqa?name?TEST_FAILED?TestName?eq?tcp |
本文轉(zhuǎn)自Grodd51CTO博客,原文鏈接:http://blog.51cto.com/juispan/1964331,如需轉(zhuǎn)載請(qǐng)自行聯(lián)系原作者
總結(jié)
- 上一篇: CSDN 技术社区
- 下一篇: MDN Web Docs