带宽运营,皆为错峰
?引言?
本文是對(duì)《云平臺(tái)的成本優(yōu)化-提升資源利用率》的硬核實(shí)踐。
有個(gè)傳說(shuō),古羅馬兩匹馬屁股的間距,決定了馬車(chē)軸距、鐵路寬度、隧道寬度,最終決定了陸基運(yùn)載火箭的噴口直徑。
對(duì)于帶寬產(chǎn)品的資源運(yùn)營(yíng),也有個(gè)類(lèi)似的根源,那就是帶寬以峰值為計(jì)費(fèi)基準(zhǔn)。
無(wú)論讀者的角色是云廠(chǎng)商/IDC/CDN還是大型用戶(hù),無(wú)論產(chǎn)品是BGP、單線(xiàn)、CDN還是邊緣計(jì)算,只要我們?cè)趲掝?lèi)產(chǎn)品上消費(fèi)額過(guò)了千萬(wàn),我們就需要關(guān)注帶寬運(yùn)營(yíng)和產(chǎn)品設(shè)計(jì)的根源是錯(cuò)峰。
1. 帶寬三驚
驚嚇驚喜和驚訝
對(duì)于大帶寬云產(chǎn)品,我先總結(jié)出三個(gè)略帶驚訝的真相。
1. 驚嚇:運(yùn)營(yíng)商千萬(wàn)別降價(jià)
如果運(yùn)營(yíng)商將帶寬價(jià)格普調(diào)性降低,那會(huì)是一場(chǎng)橫掃整個(gè)云行業(yè)的災(zāi)難。
其他大營(yíng)收的云產(chǎn)品也別笑,硬件和電費(fèi)降價(jià),你們也一樣尷尬。
2. 驚喜:帶寬生意要大小搭配
大客戶(hù)讓云廠(chǎng)商有做帶寬生意的體量、也能騰挪出海量流動(dòng)資金,但小客戶(hù)錯(cuò)開(kāi)了日峰。
3. 驚訝:成本真的估不精細(xì)
多線(xiàn)BGP的成本都是估算的,調(diào)優(yōu)的效果更是一片動(dòng)態(tài)迷霧。廣域網(wǎng)互聯(lián)是一個(gè)無(wú)中心的協(xié)商系統(tǒng),線(xiàn)路成本更是超出技術(shù)范疇之外,月峰值也在給冗余的傷口撒鹽。toB產(chǎn)品都可以只做大客戶(hù),但帶寬類(lèi)產(chǎn)品最好是大小搭配。
2. 計(jì)費(fèi)繁瑣
難題和操作空間
帶寬不是資源,帶寬本質(zhì)上是運(yùn)營(yíng)商做的一層規(guī)則限制。
運(yùn)營(yíng)商的根本計(jì)費(fèi)規(guī)則就是“按月峰值計(jì)費(fèi)”,即按照每月最大使用的那個(gè)水位線(xiàn)計(jì)費(fèi),在此基礎(chǔ)上涌現(xiàn)出多種變體:
無(wú)保底峰值計(jì)費(fèi),最簡(jiǎn)單的用多少量給多少錢(qián),可以演化成無(wú)保底流量計(jì)費(fèi)。
有保底峰值計(jì)費(fèi),要收個(gè)最低月租費(fèi),比如保底1G帶寬就是實(shí)際用300M也是收1G的錢(qián)。
95峰值計(jì)費(fèi),5%的最高用量被掐尖抹掉,避免偶發(fā)高峰造成大賬單。
保底后突發(fā)流量?jī)r(jià)格變高,這是供應(yīng)商鼓勵(lì)你多交計(jì)劃內(nèi)月租,少搞突然襲擊。
保底后突發(fā)流量?jī)r(jià)格變低,這是供應(yīng)商鼓勵(lì)你資源用的越多越好,最好每根線(xiàn)都用到滿(mǎn)載。
固定帶寬計(jì)費(fèi),客戶(hù)掏的錢(qián)都是保底值,但過(guò)保底0.01%就會(huì)被限流。因?yàn)榇螯c(diǎn)統(tǒng)計(jì)的粒度太粗,肯定會(huì)漏過(guò)真實(shí)帶寬最高峰,而限流丟包時(shí)所有數(shù)據(jù)包等比例隨機(jī)丟棄,所以大家只敢用到固定帶寬的50%-85%。
共享帶寬計(jì)費(fèi),大家肯定以為這種方式早被淘汰了,但是過(guò)去租U位共享100M和現(xiàn)在買(mǎi)云主機(jī)共享5M帶寬有區(qū)別嗎?
肯定有讀者嫌棄上文太復(fù)雜了,想要求必須是“無(wú)保底流量計(jì)費(fèi)”——這就是“我可以接受漲價(jià)”或者“沒(méi)流量就不賣(mài)給你”的意思。
除了計(jì)費(fèi)規(guī)則之外,帶寬成本還有到特定區(qū)域比例限速、跨國(guó)跨區(qū)域合并保底、樓內(nèi)線(xiàn)成本、跨運(yùn)營(yíng)商冗余方案等等一大堆問(wèn)題和解決方法。
這些復(fù)雜的規(guī)則,讓掌握帶寬計(jì)費(fèi)規(guī)則成為高智商專(zhuān)業(yè)性工作,留給了云廠(chǎng)商、大型互聯(lián)網(wǎng)廠(chǎng)商的采購(gòu)、產(chǎn)品、運(yùn)營(yíng)、運(yùn)維極大的難題,也留下了極大的操作空間。
3. 現(xiàn)在的帶寬
浪費(fèi)為主也有復(fù)用
在成本不準(zhǔn)、需求不準(zhǔn)、甚至效果也不準(zhǔn)的前提下,帶寬錯(cuò)峰仍然是有實(shí)操的思路和原則。日峰(含周峰)是我們以低成本保持安全冗余的前提條件,避免出現(xiàn)新的月峰是省錢(qián)的目標(biāo),而上傳錯(cuò)峰是帶寬廠(chǎng)商夢(mèng)想的新金礦。
????1. 日峰值錯(cuò)峰求安全
日峰錯(cuò)峰的目的是保證不超過(guò)帶寬上限,保證始終有富裕帶寬平穩(wěn)運(yùn)行。
網(wǎng)絡(luò)服務(wù)是超過(guò)限速流量,就會(huì)出現(xiàn)大范圍丟包的嚴(yán)重事故,加上測(cè)量不準(zhǔn)流控不精,我們只敢用到帶寬上限的70%以下。
有些運(yùn)營(yíng)商是1:3以上的保底突發(fā)比例,大家用起來(lái)就比較放心,但有些運(yùn)營(yíng)商突發(fā)比例給的很小,甚至只給固定帶寬,這時(shí)錯(cuò)峰就是刀尖上跳舞的剛需了。
還好不同用戶(hù)的業(yè)務(wù)高峰并不相同,有白天的有晚上的甚至有后半夜的,不同用戶(hù)錯(cuò)開(kāi)業(yè)務(wù)高峰,讓業(yè)務(wù)量始終沒(méi)漫到帶寬上限;用戶(hù)錯(cuò)峰行為主要體現(xiàn)在日峰,個(gè)別會(huì)體現(xiàn)在周峰。
肯定有朋友說(shuō),我只在白天和后半夜用帶寬,因此能不能打折?這句話(huà)理論上是對(duì)的,但是有兩個(gè)現(xiàn)實(shí)問(wèn)題,一是錯(cuò)不開(kāi)峰值怎么停掉廉價(jià)帶寬,二是上游運(yùn)營(yíng)商是按照月峰計(jì)費(fèi)的。
2. 月峰值的冒尖和浪費(fèi)
對(duì)于用量突增導(dǎo)致的月峰,因?yàn)橛杏脩?hù)買(mǎi)單所以皆大歡喜;
對(duì)于短期DDOS攻擊導(dǎo)致的月峰,運(yùn)氣好能找供應(yīng)商撒嬌抹一下賬單;
如果A線(xiàn)路故障導(dǎo)致B線(xiàn)路突發(fā)峰值,A線(xiàn)路的賠償款可填不平B線(xiàn)路的突發(fā)賬單。
月峰在發(fā)生前很難壓住別冒尖,但在冒尖之后又缺乏好辦法規(guī)避浪費(fèi)。我們很難做到因?yàn)槟尘€(xiàn)路出現(xiàn)了月峰冒尖,接下來(lái)就刻意多用此線(xiàn)路。如果強(qiáng)行往月峰發(fā)生線(xiàn)纜上導(dǎo)流量,會(huì)面臨著三個(gè)問(wèn)題:
首先,要確認(rèn)這個(gè)計(jì)費(fèi)月還有幾天空閑;
然后,我們要小心該線(xiàn)路日峰爆倉(cāng)出故障;
最根本的問(wèn)題是:其他被抽掉流量的線(xiàn)纜也是保底加月峰付費(fèi)。
月峰冒尖和浪費(fèi)的根本原因是:
需求側(cè)不可控只能被動(dòng)響應(yīng);
可調(diào)度的對(duì)象只有幾個(gè)運(yùn)營(yíng)商的網(wǎng)口;
技術(shù)調(diào)度方法又非常笨拙緩慢。
3. 上行帶寬的商業(yè)化
運(yùn)營(yíng)商售出的IDC帶寬是上下行對(duì)稱(chēng),上下行中按用量最高的取值。
但實(shí)操的過(guò)程中,IDC上行帶寬基本就是贈(zèng)送的,用量最大的肯定是下行帶寬。CDN帶寬上下行不對(duì)稱(chēng),但上行帶寬也一直夠用。
這幾年直播火爆,因?yàn)橹辈I(yè)務(wù)只能回源無(wú)法緩存,CDN上行帶寬終于用起來(lái)了;隨著家用IOT場(chǎng)景的日漸普及,曾經(jīng)閑置的IDC上行帶寬逐漸緊俏起來(lái)。各個(gè)云平臺(tái)公開(kāi)的云主機(jī)裸金屬,都很精明的寫(xiě)出是買(mǎi)下行帶寬贈(zèng)送上行帶寬。隨著5G類(lèi)應(yīng)用的日漸深入,這個(gè)贈(zèng)送的帶寬早晚也要變成收費(fèi),屆時(shí)上下行錯(cuò)峰復(fù)用會(huì)成為帶寬產(chǎn)品的新利潤(rùn)增長(zhǎng)點(diǎn)。
4. 數(shù)據(jù)和產(chǎn)品
帶寬運(yùn)營(yíng)的展望
帶寬運(yùn)營(yíng)的現(xiàn)狀是糾結(jié)和浪費(fèi),但隨著技術(shù)進(jìn)步和行業(yè)變化,我們能看到帶寬運(yùn)營(yíng)在逐漸變得確定和清晰。
1. 精確預(yù)估大客戶(hù)成本
互聯(lián)網(wǎng)巨頭們的客戶(hù)量固定、業(yè)務(wù)模式也固定,他們的用戶(hù)分布、節(jié)假日變動(dòng)都已經(jīng)是明確的曲線(xiàn),開(kāi)拓新國(guó)家也有了相對(duì)固定的模式。這一些工作讓帶寬類(lèi)產(chǎn)品可以相對(duì)精確的預(yù)估大客戶(hù)成本,讓閑置資源更少、復(fù)用資源更多。
我知道多個(gè)視頻大廠(chǎng)都在研發(fā)整理峰值的技術(shù),將留給供應(yīng)商“AAA”的峰值削成“凹凸凹”的峰值,在我來(lái)看這是在緣木求魚(yú)。供應(yīng)商的利潤(rùn)就來(lái)自于錯(cuò)峰復(fù)用,一個(gè)巨頭去整理峰值是蹭其他巨頭的便宜,多個(gè)大廠(chǎng)都選擇“凹凸凹”的峰值,只會(huì)導(dǎo)致供應(yīng)商漲價(jià)。
2.線(xiàn)路分組混用互備
運(yùn)營(yíng)商之間的互聯(lián)互通能力在向集中化、簡(jiǎn)單化去演進(jìn);國(guó)內(nèi)有信號(hào),歐美已經(jīng)成為事實(shí),多個(gè)IPtransit之間的互備互通機(jī)制已經(jīng)很成熟。
我們可以將線(xiàn)路按照運(yùn)營(yíng)商進(jìn)行互備分組,也可以將線(xiàn)路按照延遲等質(zhì)量系數(shù)分類(lèi),這些分類(lèi)至少能解決保底和災(zāi)備問(wèn)題,也有望減少月峰值突發(fā)。
3. 精細(xì)化監(jiān)控和敏捷決策
傳統(tǒng)帶寬監(jiān)控的粒度太粗,也只用于觸發(fā)報(bào)警和手工決策。
帶寬監(jiān)控的正道是準(zhǔn)實(shí)時(shí)監(jiān)控,有了準(zhǔn)實(shí)時(shí)數(shù)據(jù)就能有更精細(xì)的流控機(jī)制,再加上AI技術(shù)做敏捷判斷和大數(shù)據(jù)技術(shù)做匯總統(tǒng)計(jì),人類(lèi)調(diào)配帶寬終會(huì)變成自動(dòng)調(diào)配帶寬。
4. 從需求側(cè)做新產(chǎn)品
我說(shuō)的新產(chǎn)品包括網(wǎng)絡(luò)產(chǎn)品的自我優(yōu)化,也包括應(yīng)用產(chǎn)品的見(jiàn)縫插針。
同樣是為解決日峰值中提到“如何停掉廉價(jià)帶寬”的問(wèn)題,可以將流控和QoS做到了IP層,也可以用源IP和端口去標(biāo)識(shí)出“它就是可暫停的廉價(jià)帶寬”,還要求上層應(yīng)用天然是高容錯(cuò)可暫停。
同樣是為了解決鏈路穩(wěn)定性問(wèn)題,可以是專(zhuān)線(xiàn)+冗余+BGP等IP層技術(shù),也可以設(shè)計(jì)一套傳輸協(xié)議,還可以客戶(hù)端默認(rèn)雙路推流,還可以在編解碼技術(shù)上搞容錯(cuò)。
要做出上述新產(chǎn)品,必須說(shuō)明舊產(chǎn)品線(xiàn)的現(xiàn)狀數(shù)據(jù),新技術(shù)有哪些突破,資源池有哪些臨界值。
>>?5. 結(jié)束語(yǔ)
帶寬運(yùn)營(yíng)并不是一個(gè)輕松的話(huà)題,毫厘間的差錯(cuò)就是真金白銀的損失,每一個(gè)需求方都在同時(shí)索要低價(jià)格和高價(jià)值。
但正如上一篇文章《云平臺(tái)的成本優(yōu)化》中的結(jié)束語(yǔ):
這是難做又有用途的事情,
是值得我們努力的方向。
總結(jié)
- 上一篇: 使用FFT进行快速FIR滤波
- 下一篇: 江苏自考计算机专业2020,2020年4