云时代的智能运维平台,助力企业创新迭代
每一起嚴(yán)重事故背后,必然有29次輕微事故和300起未遂先兆以及1000起事故隱患。—— 海恩法則(Heinrich‘s Law)
隨著云計(jì)算時(shí)代的到來,大量企業(yè)將自己的業(yè)務(wù)逐步遷移上云。云計(jì)算的彈性,讓IT資源購買、擴(kuò)容等更簡單。許多企業(yè),已經(jīng)不要花費(fèi)巨大的人工時(shí)間,投入在IDC、服務(wù)器、網(wǎng)卡等物理資源的購買、擴(kuò)容、升級(jí)等等。
但隨著信息時(shí)代的發(fā)展,業(yè)務(wù)在線化,業(yè)務(wù)系統(tǒng)服務(wù)客戶規(guī)模更大,系統(tǒng)的穩(wěn)定變得更加重要。一旦出現(xiàn)故障,運(yùn)維人員無法提前預(yù)警、以及無法最快時(shí)間內(nèi)尋找出問題,極易影響到業(yè)務(wù),造成巨大損失。
面對(duì)龐大的業(yè)務(wù)系統(tǒng)、多樣的服務(wù)模塊、海量的日志與監(jiān)控信息、極致的業(yè)務(wù)需求等,如何構(gòu)建企業(yè)的快速、自動(dòng)化、智能化、全周期的智能運(yùn)維與預(yù)警系統(tǒng),已經(jīng)是企業(yè)競爭力的一部分。
因此,越來越多的企業(yè)開始搭建屬于自己的智能運(yùn)維平臺(tái),力圖減輕運(yùn)維人員的負(fù)擔(dān),以及更智能的故障預(yù)警、更快的響應(yīng)。尤其是在這個(gè)業(yè)務(wù)上云的時(shí)代,企業(yè)運(yùn)維平臺(tái)的價(jià)值密集一直在升級(jí),許多企業(yè)已經(jīng)從基礎(chǔ)的資源購買維護(hù)中,升級(jí)到對(duì)業(yè)務(wù)價(jià)值的提升上。
由于泛日志類數(shù)據(jù)的利用與分析,正在成為企業(yè)競爭力的一部分。研究報(bào)告表明,泛日志類機(jī)器數(shù)據(jù)和規(guī)模快速增長,企業(yè)需要通過更加智能的運(yùn)維平臺(tái),來為業(yè)務(wù)提供參考。加之業(yè)務(wù)系統(tǒng)的時(shí)間價(jià)值密度逐漸加大,系統(tǒng)服務(wù)的客戶指數(shù)級(jí)增長,業(yè)務(wù)系統(tǒng)的復(fù)雜度和集群規(guī)模變得越大,因此一個(gè)穩(wěn)定、高效且實(shí)惠的智能運(yùn)維平臺(tái)逐漸成為一個(gè)企業(yè)安身立命的根本。
但是在搭建智能運(yùn)維平臺(tái)時(shí),我們又經(jīng)常會(huì)遇到以下幾個(gè)挑戰(zhàn):
1、海量日志,如何快速分析告警:比如千億、萬億條日志,如何實(shí)時(shí)查詢分析?如何確保實(shí)時(shí)穩(wěn)定寫入?
2、系統(tǒng)復(fù)雜,數(shù)十個(gè)維度的數(shù)據(jù),如何更高效地多維度分析?
3、如何抽絲剝繭,從中找的最重要的信息?比如,Error日志有幾萬條,如何找到重要信息?
4、海量日志長周期保存和處理流轉(zhuǎn):從實(shí)時(shí)數(shù)據(jù)到歷史數(shù)據(jù),如何滿足不同的分析模式和存儲(chǔ)要求?
阿里云在這些年服務(wù)阿里巴巴經(jīng)濟(jì)體、以及阿里云客戶時(shí),也遇到過許多這類的問題。阿里云通過不斷打磨,推出了阿里云日志服務(wù)SLS,助力客戶構(gòu)建智能運(yùn)維平臺(tái)。
在9月18號(hào)云棲大會(huì)上,阿里云智能高級(jí)產(chǎn)品專家鏵劍為大家?guī)砹祟}為《云時(shí)代的智能運(yùn)維平臺(tái)日志服務(wù),助力企業(yè)創(chuàng)新迭代》的分享,在分享中詳細(xì)地介紹了阿里云日志服務(wù)SLS,是如何為用戶提供一站式的日志采集、告警、存儲(chǔ)、分析以及可視化的能力,幫助企業(yè)的技術(shù)運(yùn)維人員在云時(shí)代,能夠基于SLS構(gòu)建自己的智能運(yùn)維平臺(tái),快速分析系統(tǒng)狀態(tài)、洞察業(yè)務(wù),助力企業(yè)的快速迭代和業(yè)務(wù)創(chuàng)新。
阿里云日志服務(wù)SLS,具備以下幾個(gè)優(yōu)勢(shì):
1、 秒級(jí)實(shí)時(shí)分析和告警:千億條日志中,秒級(jí)返回10億條記錄
2、 多維度數(shù)據(jù)聯(lián)合分析能力:并提供高維查詢、實(shí)時(shí)分析、定時(shí)任務(wù)、可視化能力
3、 更深入細(xì)節(jié)洞察:從秒級(jí)細(xì)節(jié)、異常點(diǎn)位AI檢測、數(shù)據(jù)聚類來助力抽絲剝繭,發(fā)現(xiàn)重要信息
這些能力,幫助客戶對(duì)Logging、Metric、Tracing數(shù)據(jù)進(jìn)行統(tǒng)一采集存儲(chǔ)分析,滿足業(yè)務(wù)監(jiān)控、日志分析、安全審計(jì)等要求,輕松解決如何快速、多維、深入細(xì)節(jié)分析的挑戰(zhàn)。
同時(shí),SLS提供全周期的數(shù)據(jù)流轉(zhuǎn)能力,近期新發(fā)布的數(shù)據(jù)加工、數(shù)據(jù)投遞,可支持不同的分析模式、周期要求。利用數(shù)據(jù)加工,企業(yè)可以根據(jù)不同的分析要求,對(duì)數(shù)據(jù)進(jìn)行規(guī)整、ETL。而利用數(shù)據(jù)投遞,企業(yè)可以滿足不同時(shí)間周期的數(shù)據(jù)處理方式、保存方式的數(shù)據(jù)流轉(zhuǎn)要求。
因此在這個(gè)業(yè)務(wù)上云的時(shí)代,我們需要更智能的運(yùn)維平臺(tái),幫助我們的業(yè)務(wù)平穩(wěn)、智能、高效地運(yùn)行。我們堅(jiān)信,基于阿里云日志服務(wù)SLS搭建,企業(yè)的智能運(yùn)維平臺(tái),能真正幫助到企業(yè)進(jìn)行業(yè)務(wù)價(jià)值的創(chuàng)新迭代,助力企業(yè)客戶的業(yè)務(wù),更穩(wěn)定且快速地發(fā)展。
原文鏈接:https://developer.aliyun.com/article/772689?
版權(quán)聲明:本文內(nèi)容由阿里云實(shí)名注冊(cè)用戶自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,阿里云開發(fā)者社區(qū)不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。具體規(guī)則請(qǐng)查看《阿里云開發(fā)者社區(qū)用戶服務(wù)協(xié)議》和《阿里云開發(fā)者社區(qū)知識(shí)產(chǎn)權(quán)保護(hù)指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,填寫侵權(quán)投訴表單進(jìn)行舉報(bào),一經(jīng)查實(shí),本社區(qū)將立刻刪除涉嫌侵權(quán)內(nèi)容。總結(jié)
以上是生活随笔為你收集整理的云时代的智能运维平台,助力企业创新迭代的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 源码解析:Git的第一个提交是什么样的?
- 下一篇: 阿里云张献涛:一切从场景出发,实现计算的