「客户成功故事」OneAPM 助力网上办事大厅构建阳光、高效、安全的政务服务平台...
(一) 項目背景:
網(wǎng)上辦事大廳是由省信息中心承建的電子政務(wù)核心業(yè)務(wù)系統(tǒng),致力于為全省民眾提供一站式網(wǎng)上辦事服務(wù),實現(xiàn)了政務(wù)信息網(wǎng)上公開、法人及個人事項網(wǎng)上辦理、公共決策網(wǎng)上互動、政府效能網(wǎng)上監(jiān)督五大功能。目前大廳已進(jìn)駐省級部門57個,市縣部門6318個,提供電腦版和智能終端版訪問服務(wù)。
隨著電子政務(wù)的推進(jìn),網(wǎng)上辦事大廳所涉及的系統(tǒng)規(guī)模不斷擴(kuò)大,數(shù)量日益增多,業(yè)務(wù)持續(xù)增長,再加上運維團(tuán)隊缺少了有效的管理和防護(hù)手段,平臺管理和信息安全問題日漸凸現(xiàn)。
在國家對電子政務(wù)信息系統(tǒng)安全保障工作的要求以及等級化保護(hù)“堅持積極防御、綜合防范”的方針指導(dǎo)下,急需建設(shè)一套完備的安全管理服務(wù)體系,加強(qiáng)運行環(huán)境監(jiān)控、應(yīng)用性能管理和安全防護(hù)體系的建設(shè),從不同維度監(jiān)控網(wǎng)辦平臺的可用性和性能,進(jìn)而保證系統(tǒng)安全高效的運行,實現(xiàn)省網(wǎng)上辦事大廳和政府服務(wù)的信息化、智能化。
(二) 用戶反饋:
OneAPM?幫我們打造了一個五維的安全運行監(jiān)控平臺和體系,從發(fā)現(xiàn)問題,通知問題,定位問題,解決問題,到歸納問題。過去都是系統(tǒng)出現(xiàn)問題,我們被動告知,還需要花大量時間定位問題根源,并進(jìn)行修復(fù)。通過這個平臺我們能更加直觀、主動的發(fā)現(xiàn)系統(tǒng)潛藏的問題,有效預(yù)防風(fēng)險,極大的提升了運維效率,降低了管理成本,也給民眾帶來了更加滿意的使用體驗。
(三) OneAPM 解決方案:
基于 OneAPM 基礎(chǔ)資源管理 Infrastructure Insight、應(yīng)用性能管理 APM、模擬撥測 Cloud Test、實時應(yīng)用安全防護(hù)?RASP?四大核心產(chǎn)品能力構(gòu)建的一體化運維管理平臺,從全面監(jiān)測、準(zhǔn)確預(yù)警、快速診斷、輔助優(yōu)化,到指導(dǎo)評估,建立起一套完善的安全可靠運行保障體系。
?
全面監(jiān)測,及時發(fā)現(xiàn)平臺風(fēng)險,故障主動發(fā)現(xiàn)率提升至85%
在 OneAPM 一體化運維管理平臺上線前,整個網(wǎng)上辦事大廳涉及的 IT 資源由8名運維工程師通過幾個開源工具進(jìn)行日常運維,常常是最終用戶發(fā)現(xiàn)并反饋網(wǎng)辦大廳系統(tǒng)問題之后才開始著手處理,運維工程師80%以上的時間都在“救火”。這樣的運維方式既被動,又效率低下,造成用戶滿意度較差。OneAPM 一體化運維管理平臺,提供了主動和被動兩種監(jiān)測手段,及時發(fā)現(xiàn)網(wǎng)辦平臺的運行風(fēng)險。Cloud Test 是一個應(yīng)用系統(tǒng)可用性及性能主動監(jiān)測方案,通過遍布全省的訪問監(jiān)測點,7X24小時不間斷模擬網(wǎng)辦平臺的業(yè)務(wù)訪問,詳盡了解網(wǎng)辦平臺業(yè)務(wù)的性能和可用性,在最終用戶訪問體驗受影響之前提前發(fā)現(xiàn)系統(tǒng)性能問題。Infrastructure Insight 和 APM 是一個應(yīng)用系統(tǒng)可用性及性能被動監(jiān)測方案,從運行環(huán)境和用戶體驗兩個角度,監(jiān)測應(yīng)用系統(tǒng)運行態(tài)的可用性、健康度、性能和安全性,監(jiān)測指標(biāo)覆蓋信息中心的服務(wù)器、網(wǎng)絡(luò)、操作系統(tǒng)、數(shù)據(jù)庫、中間件、應(yīng)用系統(tǒng)、瀏覽器和手機(jī) APP,以及應(yīng)用中所存在的各類安全攻擊手段,實時監(jiān)測系統(tǒng)性能、系統(tǒng)故障,以及安全攻擊行為。這兩種手段相輔相成,構(gòu)建了一個對網(wǎng)辦平臺所有 IT 資源進(jìn)行全面主動監(jiān)測的日常工作環(huán)境,幫助運維工程師對系統(tǒng)狀態(tài)做到心中有數(shù),對突發(fā)故障做到胸有成竹。
準(zhǔn)確預(yù)警,第一時間反饋風(fēng)險至責(zé)任人,告警準(zhǔn)確送達(dá)率88%
由于開源工具只提供服務(wù)器、網(wǎng)絡(luò)、操作系統(tǒng)、數(shù)據(jù)庫、中間件等基礎(chǔ)資源的實時性能數(shù)據(jù)查看功能,缺少告警模塊,運維人員無法在第一時間獲得準(zhǔn)確的系統(tǒng)異常信息。OneAPM 一體化運維管理平臺結(jié)合網(wǎng)辦平臺等保三級以及日常管理的相關(guān)指導(dǎo)文件和相關(guān)規(guī)范,主動定義各類關(guān)鍵性能指標(biāo)的最佳預(yù)警閾值,第一時間定位系統(tǒng)性能問題。對于一些有著時間周期特性的性能指標(biāo),通過動態(tài)基線算法自動擬合預(yù)警閾值,在減少告警配置工作量的同時,進(jìn)一步提升了告警的準(zhǔn)確度。運維管理平臺提供的郵件、短信、微信等多種告警方式,快速、準(zhǔn)確通知到相關(guān)責(zé)任人,實現(xiàn)被動管理到主動管理的跨越。同時,運維管理平臺通過采用模擬的手段 Cloud Test,對網(wǎng)辦平臺可用性進(jìn)行定期的訪問和監(jiān)測,確保系統(tǒng)能夠有效運行,在出現(xiàn)故障時第一時間進(jìn)行通知和預(yù)警。
快速診斷,精準(zhǔn)分析定位故障根因,平均故障檢測時間 MTTD 縮減到原來的四分之一
作為一個運維管理平臺僅僅只提供資源的指標(biāo)監(jiān)控和告警是不夠的。監(jiān)控的范圍越廣,監(jiān)控的指標(biāo)越多,系統(tǒng)產(chǎn)生的告警也就越多,運維工程師去甄別告警真?zhèn)魏透虻臅r間也就越長。這反而不利于故障的分析和定位。如何幫助運維工程師快速識別和精準(zhǔn)分析故障根因,也就成為了體現(xiàn)運維管理平臺價值的關(guān)鍵之一。
OneAPM 一體化運維管理平臺中的 APM 產(chǎn)品以真實的用戶體驗和端到端應(yīng)用性能為切入點,顛覆傳統(tǒng)運維監(jiān)控方案,實現(xiàn)自上而下的 IT 管理新模式。一體化運維管理平臺提供了對前端瀏覽器、應(yīng)用性能、中間件性能、數(shù)據(jù)庫性能、主機(jī)性能的自動關(guān)聯(lián)和分析,幫助運維工程師快速識別、定位網(wǎng)辦平臺的性能瓶頸和可用性問題。同時,運維管理平臺通過自動學(xué)習(xí)能力,識別、記錄業(yè)務(wù)交易的類型,業(yè)務(wù)代碼類執(zhí)行的效率及業(yè)務(wù)性能匹配模式,輔助運維工程師從代碼類、參數(shù)到數(shù)據(jù)庫語句,進(jìn)行完整交易鏈的性能診斷和故障定位,將平均故障檢測時間從原來的4小時縮減到1小時。
輔助優(yōu)化,專業(yè)化問題處置建議,平均故障恢復(fù)時間MTTR縮短一半
專業(yè)化的故障處置建議是縮短平均故障恢復(fù)時間的關(guān)鍵。不論是服務(wù)器和操作系統(tǒng)的配置參數(shù)調(diào)整,網(wǎng)絡(luò)的設(shè)置調(diào)整,中間件和數(shù)據(jù)庫的配置優(yōu)化,還是應(yīng)用系統(tǒng)的代碼修改,都提升網(wǎng)辦平臺處理性能的重要手段。
OneAPM 一體化運維管理平臺提供了以一星期為周期的系統(tǒng)性能診斷和優(yōu)化建議報告,通過對應(yīng)用系統(tǒng)關(guān)鍵性能指標(biāo)和參數(shù)的詳細(xì)分析,給出量化的評估效果,并提供系統(tǒng)優(yōu)化建議,包括應(yīng)用系統(tǒng)代碼優(yōu)化、數(shù)據(jù)庫性能優(yōu)化、中間件性能優(yōu)化、操作系統(tǒng)性能優(yōu)化等,指導(dǎo)運維工程師與研發(fā)工程師快速對網(wǎng)辦平臺性能瓶頸做出響應(yīng)。運維管理平臺還能提供實時故障處理建議,針對告警詳細(xì)信息,結(jié)合過往運維經(jīng)驗,提供處置方案,方便運維工程師及時對系統(tǒng)故障進(jìn)行判斷和處理。
指導(dǎo)評估,總結(jié)沉淀運維經(jīng)驗,提供決策數(shù)據(jù)支持
通過充分挖掘監(jiān)控數(shù)據(jù)的可用性,OneAPM 一體化運維管理平臺建立了一套多數(shù)據(jù)源、多用戶視角、沉淀專家經(jīng)驗的運行環(huán)境分析評估體系。通過各個維度的分析報表,建立面向客戶感知的、面向業(yè)務(wù)體驗的、面向運行質(zhì)量,圍繞性能、故障、考核主題的管理分析能力。幫助運維工程師主動分析系統(tǒng)性能、容量,預(yù)測問題,為“決策層、管理層、執(zhí)行層”人員提供決策支持。
國內(nèi)?ITOM?管理平臺?OneAPM?致力于幫助企業(yè)用戶提供全棧式的性能管理以及 IT 運維管理服務(wù),通過一個探針就能夠完成日志分析、安全防護(hù)、APM?基礎(chǔ)組件監(jiān)控、集成報警以及大數(shù)據(jù)分析等功能。想優(yōu)秀文章,請訪問 OneAPM?官方技術(shù)博客
來源:http://blog.oneapm.com/casestudy/821.html
轉(zhuǎn)載于:https://www.cnblogs.com/oneapm/p/9447642.html
總結(jié)
以上是生活随笔為你收集整理的「客户成功故事」OneAPM 助力网上办事大厅构建阳光、高效、安全的政务服务平台...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: django orm 操作符
- 下一篇: js 严格模式