传统负载均衡助力AIOps优化智能运维
生活随笔
收集整理的這篇文章主要介紹了
传统负载均衡助力AIOps优化智能运维
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
摘要:如今AIOps已經比較火熱,然而整個行業仍都處于探索的初級階段,針對預感未來的運維需求需要通過AI進行解決,如何將傳統的IT架構改造成智能運維的架構更值得人們思考。本文主要對傳統業務的變化、應用交付AD+人工智能AI、AIOps 故障發現與處理等方面的內容做了深入的分析。
本場視頻精彩回顧,戳這里!
本場視頻PPT下載,戳這里!
演講嘉賓簡介:
邱亮,深信服科技股份有限公司研發部總經理
以下內容根據演講嘉賓視頻分享以及PPT整理而成。
本次的分享主要圍繞以下三個方面:
一、數據中心背景 二、負載均衡的應用 三、深信服與阿里合作
一、 數據中心背景
數據中心進行了三代的過程演化,第一代的數據中心以計算為中心,主要把客戶原來傳統的業務變為電子化業務,提高了辦公效率和業務運營效率。第二代的數據中心以網絡和應用為中心,隨著客戶越來越多的核心業務電子化進入數據中心,數據中心的業務成為客戶生意的核心,當業務發生中斷時,很多客戶會出現無法辦公、無法做生意的情況,直接給客戶帶來財產損失。客戶對數據中心的需求表現為高可用、高可靠和高性能。第三代的數據中心以用戶為中心,客戶的很多業務從線下轉換到線上。在這種情況下,客戶對快速開發、業務彈性、未知業務產生訴求,云計算與大數據應運而生。 如圖左下方為傳統的數據中心,從網絡層面看,分為核心層、匯聚層和接入層;從應用層面看,分為web層、app層和DB層。隨著云計算的發展,很多資源已經池化,包括存儲池化、網絡池化和服務池化等,使得數據中心發生了很大的改變。
二、 負載均衡的應用 ? 數據中心的改變不同于技術,過去的投資對客戶來說屬于歷史資產,第一代的數據中心業務電子化后采用單態服務器即可承載,但是這樣的架構存在一定缺陷,當單態服務器出現故障時,客戶可能采用主備服務器的概念。正常情況下備服務器將處于被浪費狀態。同時出現故障時主備服務器的切換也會花費大量時間,接入的連接將會全部中斷。備服務器在平時沒有業務接入,是否真正實際可用無法確定。在此情況下產生應用交付,負載均衡被架在前方,同時對幾臺服務器進行負載,既保證這幾臺服務器平時的可用性,也提升了整個業務系統的健壯性和性能。
隨著越來越多的客戶核心業務進入數據中心,當單個業務系統的出口出現問題時,例如移動、電信線路斷開,鏈路不穩定使得整個業務系統無法訪問,鏈路負載由此誕生。鏈路的負載均衡可幫助進行故障時的鏈路切換,并且保障聯通的用戶訪問資源盡可能從聯通的鏈路返回,避免跨運營商訪問,減少時延提高性能。
由于越來越多的業務需要系統可靠性的保障,需要從底層到上層對系統實施很多高可用措施,從而避免任何一個點出現單點故障,例如在核心業務的存儲方面,購買兩對存儲,存儲相互之間作為鏡像,從而保證一個存儲故障時另一個存儲可用,在網上接入的存儲相關的交換機必須為兩個,并相互之間進行堆疊。上層采用多臺服務器,應用交付類的產品認為單點是不可靠的,需要支持雙機或者集群。隨著業務系統越來越多,數據中心管理變得復雜煩亂。 當大量的重要業務交給數據中心時,如果數據中心出現問題會變得非常危險,進而誕生全局負載,建設主備數據中心或者互為主備的數據中心,接著發展為兩地三中心或者多戶數據中心。面對流量如何在多個數據中心進行合理的調度,如何保證每個數據中心不會過載,當進入雙戶數據中心時,很多情況下并不是對等的雙戶,只對部分業務進行雙戶,使得一個數據中心的規模小于另一個數據中心,不能均勻地進行流量調度,此時會將應用交付應用到全局負載中。 如圖為典型的抽象數據中心,從接入層中可以看到鏈路負載,以web區為例,web接受https并進行卸載,卸載需要SSR的安全網關,SSR安全網關需要負載保證自身的穩定,SSR安全網關本身就是負載產品的一項功能,接下來對網站進行WAF清洗,防止產生漏洞,同時WAF設備本身需要保證一定的健壯性,需要進行WAF負載。真實業務中的物理或虛擬服務器同樣需要進行負載提高健壯性。圖中紅色框中都是應用交付產品即負載均衡產品,數據中心中的應用交付產品是天然的所有流量的入口,不管web訪問流量還是內部業務系統之間的交互流量,都需要經過負載均衡,作為流量的探針應用交付產品可以抓取流量中的信息,同時作為控制器可以對流量進行個性化的編程,將流量編排的結果進行輸出。深信服和阿里巴巴的合作就是基于以上基本原理。
三、 深信服與阿里合作 深信服從三個方面與阿里巴巴進行合作,第一層面為故障的發現與處理,即為常規的運維階段。第二層為用戶價值的挖掘。第三層為識別風險與阻斷攻擊。 在故障的發現與處理基本原理中,所有的流量首先經過負載均衡設備,接著發送到服務器,服務器可以把抓取的流量根據已編排的模型全部輸出給阿里巴巴的云腦,常規下AI的云腦會將現有的模型輸出數據發送給阿里,分擔流量的壓力,例如每秒新建的連接數、每秒新建的請求數、并發的連接數和吞吐量等,同時通過與阿里云平臺的聯動,可以獲取服務器的CPU、內存、IO時延,從而分擔服務器的壓力。阿里巴巴的云腦可以獲取整個業務的壓力情況和業務的服務能力情況,并對數據進行智能分析產生業務指標基線,根據異常點發現問題。云腦的分析周期保證至少40天,其中包含一個月完整的周期數據和四個星期的橫向對比,從而了解業務高峰等信息。當出現故障時,告警信息通知到阿里巴巴的云腦,云腦根據數據進行分析,得出故障嚴重性、服務器預測承擔壓力等信息供維護人員參考,從而采取合適應對措施。AIOps的應用提供預見未來風險的告警,而不是僅僅羅列大量的告警指標數據。 當建設雙戶或者多戶的數據中心時,應用交付面對故障會盡可能將流量調用給其它數據中心。當建設云計算數據中心時,對于一家公司,所有業務同一時刻不可能都處于高峰期,有些業務處于波谷,出現故障的業務可能處于高峰期,此時數據中心會彈性地擴展更多的虛擬機,將業務流量分發給出現故障的業務,自動地進行恢復處理。 當服務器出現完全過載時,應用交付產品可以遏制流量的入口,限制并發的連接數,保證已接入的用戶能夠正常訪問。 對用戶價值的挖掘層面,如圖以電商網站為例,通過可編程的方式建立模型、分析協議,通過接口將流量信息全部提取出來,包括用戶的IP、賬號、接入方式、頁面的停留時間、整個url的訪問列等。 提取的用戶信息可用于提高客戶的訪問體驗,例如根據客戶端的時延、訪問量提供系統的優化建議,根據客戶端和運營商進行調度,對弱網的用戶開啟單邊加速的功能,保證弱網的用戶也能擁有較好的訪問體驗,降低用戶的流失率,提高交易轉換率。提取的用戶信息也可以用于分析挖掘客戶的行為,例如根據用戶的喜好推薦商品、分析客戶群體的行為習慣等,提高交易轉換率。 當公司整個業務系統的承受壓力很強時,認證服務器并不一定很強,此時會遭受黑客的攻擊而瞬間癱瘓。應用交付通過訪問、認證基線分析出不正常的行為,AI針對每個API訪問做出相應的訪問限制,進而有效地阻斷攻擊。 深信服與阿里云合作帶來的價值表現為三個方面:故障的發現和處理、用戶價值的挖掘和智能地識別風險、阻斷攻擊。
本文由云棲志愿小組丁勻泰整理,編輯百見
本場視頻精彩回顧,戳這里!
本場視頻PPT下載,戳這里!
演講嘉賓簡介:
邱亮,深信服科技股份有限公司研發部總經理
以下內容根據演講嘉賓視頻分享以及PPT整理而成。
本次的分享主要圍繞以下三個方面:
一、數據中心背景 二、負載均衡的應用 三、深信服與阿里合作
一、 數據中心背景
數據中心進行了三代的過程演化,第一代的數據中心以計算為中心,主要把客戶原來傳統的業務變為電子化業務,提高了辦公效率和業務運營效率。第二代的數據中心以網絡和應用為中心,隨著客戶越來越多的核心業務電子化進入數據中心,數據中心的業務成為客戶生意的核心,當業務發生中斷時,很多客戶會出現無法辦公、無法做生意的情況,直接給客戶帶來財產損失。客戶對數據中心的需求表現為高可用、高可靠和高性能。第三代的數據中心以用戶為中心,客戶的很多業務從線下轉換到線上。在這種情況下,客戶對快速開發、業務彈性、未知業務產生訴求,云計算與大數據應運而生。 如圖左下方為傳統的數據中心,從網絡層面看,分為核心層、匯聚層和接入層;從應用層面看,分為web層、app層和DB層。隨著云計算的發展,很多資源已經池化,包括存儲池化、網絡池化和服務池化等,使得數據中心發生了很大的改變。
二、 負載均衡的應用 ? 數據中心的改變不同于技術,過去的投資對客戶來說屬于歷史資產,第一代的數據中心業務電子化后采用單態服務器即可承載,但是這樣的架構存在一定缺陷,當單態服務器出現故障時,客戶可能采用主備服務器的概念。正常情況下備服務器將處于被浪費狀態。同時出現故障時主備服務器的切換也會花費大量時間,接入的連接將會全部中斷。備服務器在平時沒有業務接入,是否真正實際可用無法確定。在此情況下產生應用交付,負載均衡被架在前方,同時對幾臺服務器進行負載,既保證這幾臺服務器平時的可用性,也提升了整個業務系統的健壯性和性能。
隨著越來越多的客戶核心業務進入數據中心,當單個業務系統的出口出現問題時,例如移動、電信線路斷開,鏈路不穩定使得整個業務系統無法訪問,鏈路負載由此誕生。鏈路的負載均衡可幫助進行故障時的鏈路切換,并且保障聯通的用戶訪問資源盡可能從聯通的鏈路返回,避免跨運營商訪問,減少時延提高性能。
由于越來越多的業務需要系統可靠性的保障,需要從底層到上層對系統實施很多高可用措施,從而避免任何一個點出現單點故障,例如在核心業務的存儲方面,購買兩對存儲,存儲相互之間作為鏡像,從而保證一個存儲故障時另一個存儲可用,在網上接入的存儲相關的交換機必須為兩個,并相互之間進行堆疊。上層采用多臺服務器,應用交付類的產品認為單點是不可靠的,需要支持雙機或者集群。隨著業務系統越來越多,數據中心管理變得復雜煩亂。 當大量的重要業務交給數據中心時,如果數據中心出現問題會變得非常危險,進而誕生全局負載,建設主備數據中心或者互為主備的數據中心,接著發展為兩地三中心或者多戶數據中心。面對流量如何在多個數據中心進行合理的調度,如何保證每個數據中心不會過載,當進入雙戶數據中心時,很多情況下并不是對等的雙戶,只對部分業務進行雙戶,使得一個數據中心的規模小于另一個數據中心,不能均勻地進行流量調度,此時會將應用交付應用到全局負載中。 如圖為典型的抽象數據中心,從接入層中可以看到鏈路負載,以web區為例,web接受https并進行卸載,卸載需要SSR的安全網關,SSR安全網關需要負載保證自身的穩定,SSR安全網關本身就是負載產品的一項功能,接下來對網站進行WAF清洗,防止產生漏洞,同時WAF設備本身需要保證一定的健壯性,需要進行WAF負載。真實業務中的物理或虛擬服務器同樣需要進行負載提高健壯性。圖中紅色框中都是應用交付產品即負載均衡產品,數據中心中的應用交付產品是天然的所有流量的入口,不管web訪問流量還是內部業務系統之間的交互流量,都需要經過負載均衡,作為流量的探針應用交付產品可以抓取流量中的信息,同時作為控制器可以對流量進行個性化的編程,將流量編排的結果進行輸出。深信服和阿里巴巴的合作就是基于以上基本原理。
三、 深信服與阿里合作 深信服從三個方面與阿里巴巴進行合作,第一層面為故障的發現與處理,即為常規的運維階段。第二層為用戶價值的挖掘。第三層為識別風險與阻斷攻擊。 在故障的發現與處理基本原理中,所有的流量首先經過負載均衡設備,接著發送到服務器,服務器可以把抓取的流量根據已編排的模型全部輸出給阿里巴巴的云腦,常規下AI的云腦會將現有的模型輸出數據發送給阿里,分擔流量的壓力,例如每秒新建的連接數、每秒新建的請求數、并發的連接數和吞吐量等,同時通過與阿里云平臺的聯動,可以獲取服務器的CPU、內存、IO時延,從而分擔服務器的壓力。阿里巴巴的云腦可以獲取整個業務的壓力情況和業務的服務能力情況,并對數據進行智能分析產生業務指標基線,根據異常點發現問題。云腦的分析周期保證至少40天,其中包含一個月完整的周期數據和四個星期的橫向對比,從而了解業務高峰等信息。當出現故障時,告警信息通知到阿里巴巴的云腦,云腦根據數據進行分析,得出故障嚴重性、服務器預測承擔壓力等信息供維護人員參考,從而采取合適應對措施。AIOps的應用提供預見未來風險的告警,而不是僅僅羅列大量的告警指標數據。 當建設雙戶或者多戶的數據中心時,應用交付面對故障會盡可能將流量調用給其它數據中心。當建設云計算數據中心時,對于一家公司,所有業務同一時刻不可能都處于高峰期,有些業務處于波谷,出現故障的業務可能處于高峰期,此時數據中心會彈性地擴展更多的虛擬機,將業務流量分發給出現故障的業務,自動地進行恢復處理。 當服務器出現完全過載時,應用交付產品可以遏制流量的入口,限制并發的連接數,保證已接入的用戶能夠正常訪問。 對用戶價值的挖掘層面,如圖以電商網站為例,通過可編程的方式建立模型、分析協議,通過接口將流量信息全部提取出來,包括用戶的IP、賬號、接入方式、頁面的停留時間、整個url的訪問列等。 提取的用戶信息可用于提高客戶的訪問體驗,例如根據客戶端的時延、訪問量提供系統的優化建議,根據客戶端和運營商進行調度,對弱網的用戶開啟單邊加速的功能,保證弱網的用戶也能擁有較好的訪問體驗,降低用戶的流失率,提高交易轉換率。提取的用戶信息也可以用于分析挖掘客戶的行為,例如根據用戶的喜好推薦商品、分析客戶群體的行為習慣等,提高交易轉換率。 當公司整個業務系統的承受壓力很強時,認證服務器并不一定很強,此時會遭受黑客的攻擊而瞬間癱瘓。應用交付通過訪問、認證基線分析出不正常的行為,AI針對每個API訪問做出相應的訪問限制,進而有效地阻斷攻擊。 深信服與阿里云合作帶來的價值表現為三個方面:故障的發現和處理、用戶價值的挖掘和智能地識別風險、阻斷攻擊。
本文由云棲志愿小組丁勻泰整理,編輯百見
總結
以上是生活随笔為你收集整理的传统负载均衡助力AIOps优化智能运维的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MongoDB基础(3.6安装及多实例)
- 下一篇: AI 趋势