日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

函数计算 GB 镜像秒级启动:下一代软硬件架构协同优化

發(fā)布時間:2025/3/20 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 函数计算 GB 镜像秒级启动:下一代软硬件架构协同优化 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

作者:修蹤
審核&校對:Chang Shuai、望宸
編輯&排版:雯燕

背景

函數(shù)計算在 2020 年 8 月創(chuàng)新地提供了容器鏡像的函數(shù)部署方式。AWS Lambda 在 2020 年 12 月 Re-Invent,國內(nèi)其他 FaaS 提供商在 2021 年 6 月也相繼宣布了 FaaS 支持容器的重磅功能。冷啟動一直都是 FaaS 的痛點,引入比代碼壓縮包大幾十倍的容器鏡像后冷啟動惡化便成為開發(fā)者最大的擔(dān)憂。

函數(shù)計算在支持容器鏡像的設(shè)計階段就決定要讓開發(fā)者像使用代碼包(秒級彈性能力)一樣的體驗使用鏡像,既要易用性也要保持 FaaS 自身的極致彈性,免除用戶的糾結(jié)和取舍。理想的用戶體驗是函數(shù)調(diào)用幾乎感覺不到鏡像數(shù)據(jù)遠(yuǎn)程傳輸帶來的延遲額外消耗。

優(yōu)化鏡像加速冷啟動大致分為兩種做法:降低絕對延遲和降低冷啟動概率。自容器鏡像上線以來我們已經(jīng)通過鏡像加速技術(shù),分階段降低了絕對延遲。本文在此基礎(chǔ)上,介紹借助函數(shù)計算下一代 IaaS 底座神龍裸金屬和安全容器,進(jìn)一步降低絕對延遲且能夠大幅降低冷啟動頻率。

優(yōu)化歷程

(以某一鏡像為例)

第一代架構(gòu):ECS 虛構(gòu)機(jī)

第一階段(2021 年 3 月):按需加載,減少數(shù)據(jù)傳輸

過去的問題在于啟動鏡像前全量拉取鏡像內(nèi)部數(shù)據(jù),導(dǎo)致無用的鏡像數(shù)據(jù)也會被完整下載而占用了過多的準(zhǔn)備時間。于是我們最初的優(yōu)化方向是盡量忽略無用的鏡像數(shù)據(jù),達(dá)到按需加載。為此,我們通過鏡像加速技術(shù),省略掉了拉取無用數(shù)據(jù)的時間,實現(xiàn)了函數(shù)計算自定義鏡像冷啟動從分鐘級到秒級提升的相關(guān)技術(shù)細(xì)節(jié)。

第二階段(2021 年 6 月):記錄容器實例啟動 I/O 軌跡,在后續(xù)實例啟動中提前預(yù)取鏡像數(shù)據(jù)

我們發(fā)現(xiàn),函數(shù)實例在容器啟動和初始化階段,I/O 數(shù)據(jù)訪問模式高度一致。根據(jù) FaaS 平臺基于應(yīng)用運(yùn)行模式調(diào)度資源的特點,我們在函數(shù)實例首次啟動時記錄了 I/O 軌跡的脫敏數(shù)據(jù),在后續(xù)的實例啟動時,將軌跡數(shù)據(jù)作為提示,提前預(yù)取鏡像數(shù)據(jù)到本地,進(jìn)一步減小了冷啟動延時。

上述兩種加速優(yōu)化雖然大幅減小了冷啟動絕對延遲,但由于傳統(tǒng) ECS VM 在閑置一段時間后就會被回收,再次啟動新機(jī)器時就會重新觸發(fā)冷啟動。于是,如何減少冷啟動頻次便成為了下一階段重點攻克的題目之一。

下一代架構(gòu):彈性裸金屬服務(wù)器(神龍)+microVM

在設(shè)計下一代架構(gòu)時我們不僅考慮解決冷啟動頻次問題,也同樣注意到緩存對于啟動時延的影響。于是我們創(chuàng)新性的發(fā)明了 Serverless Caching,根據(jù)不同的存儲服務(wù)特點構(gòu)建數(shù)據(jù)驅(qū)動、智能高效的緩存體系,實現(xiàn)軟硬件協(xié)同優(yōu)化,將 Custom Container 體驗進(jìn)一步提升。函數(shù)計算后臺神龍的更迭時間遠(yuǎn)大于 ECS VM 的閑置回收時間,對于用戶側(cè)而言,熱啟動頻率大幅提升,在冷啟動后,緩存會持續(xù)保留在神龍機(jī)器上,緩存命中率可達(dá) 90% 以上。

對比 ECS 虛擬機(jī),神龍裸金屬加上微型虛擬機(jī)的架構(gòu)為鏡像加速帶來了更多的優(yōu)化空間:

  • 減小回源帶寬壓力并且減少重復(fù)數(shù)據(jù)存儲。比起 ECS VM 來,同時幾千實例啟動,對于鏡像倉庫的讀放大和磁盤存儲空間的寫放大降低至少兩個數(shù)量級。

  • 虛擬機(jī)級別的安全隔離使得函數(shù)計算組件可以安全地組成可用區(qū)級別緩存網(wǎng)絡(luò),速度傳輸速度甚至優(yōu)于云盤。

函數(shù)計算 Custom Container 登陸神龍的同時也提高了資源利用率,降低成本,這對用戶和服務(wù)端維護(hù)是雙贏。

Serverless Caching 的架構(gòu)則可以在不增加資源使用成本的同時提供更多的優(yōu)化潛力。

(L1~L4 為不同級別緩存,距離和延遲從小到大)

橫向?qū)Ρ?/h2>

到目前為止,我們已經(jīng)將鏡像加速優(yōu)化到了較高的水準(zhǔn)。我們在函數(shù)計算的公開用例里面挑選了 4 個典型的鏡像并將它們適配至國內(nèi)外幾個大型云廠商(名稱以廠商 A、廠商 B 代替)進(jìn)行橫向?qū)Ρ?#xff0c;每間隔 3 小時調(diào)用上述鏡像,重復(fù)數(shù)次,我們得到了以下結(jié)果:

1、AI 在線推理-貓狗識別

該鏡像包含了基于 TensorFlow 深度學(xué)習(xí)框架的圖像識別應(yīng)用。阿里云函數(shù)計算和廠商 A 都能正常運(yùn)行,但廠商 A 性能較差。廠商 B 則無法正常運(yùn)行。下圖中阿里云函數(shù)計算和廠商 A 的延時數(shù)據(jù)包含鏡像拉取,容器啟動,執(zhí)行推理運(yùn)算端對端的延時,而廠商 B 的數(shù)據(jù)只是拉取鏡像部分的延時,都已經(jīng)是最慢。FC 相對穩(wěn)定,可以看出函數(shù)計算在 CPU 消耗型如 AI 推理方面有著更大優(yōu)勢。

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-I7a6864E-1637584327234)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/3be17fa89dfa4b668d5580d27ad3b4d0~tplv-k3u1fbpfcp-zoom-1.image “圖片”)]以云盤熱啟動為基準(zhǔn)(灰色),對比各個廠商的額外開銷(彩色)

2、Python Flask Web Service

此鏡像為常見的網(wǎng)絡(luò)服務(wù),內(nèi)部使用 Python 搭配 Flask 服務(wù)框架。此鏡像的作用旨在測試不同云產(chǎn)品是否有能力完成高效按需加載。FC 與廠商 A 均有波動但后者的波動最為明顯。

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-UlL7s1FH-1637584327236)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/68cb5a1368194aa6b757d6263717b93b~tplv-k3u1fbpfcp-zoom-1.image “圖片”)]以云盤熱啟動為基準(zhǔn)(灰色),對比各個廠商的額外開銷(彩色)

3、Python 機(jī)器學(xué)習(xí)運(yùn)算

鏡像內(nèi)同樣是 Python 運(yùn)行環(huán)境,可以看出各個廠商依舊保持著各自的特性,廠商 B 全量下載,廠商 A 部分請求有優(yōu)化但不穩(wěn)定。

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-B6tzS9rC-1637584327237)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/0defcf9ddf734896877df4c64d5633fe~tplv-k3u1fbpfcp-zoom-1.image “圖片”)]以云盤熱啟動為基準(zhǔn)(灰色),對比各個廠商的額外開銷(彩色)

4、Cypress Headless Chrome

此鏡像包含無頭瀏覽器測試流程,廠商 A 由于編程模型限制和運(yùn)行環(huán)境不兼容無法運(yùn)行。而廠商 B 過慢只能在規(guī)定時間內(nèi)耗時 71.1 秒完成應(yīng)用初始化。不難看出函數(shù)計算在重 I/O 的鏡像方面依然有著不錯的表現(xiàn)。

以云盤熱啟動為基準(zhǔn)(灰色),對比各個廠商的額外開銷(彩色),綠色部位為優(yōu)于基準(zhǔn)線的端到端耗時04

推薦最佳實踐

支持容器技術(shù)是 FaaS 的必備特質(zhì),容器增加了可移植性和交付敏捷性,而云服務(wù)減輕了運(yùn)維與閑置成本、提供了彈性擴(kuò)縮容能力。自定義鏡像與函數(shù)計算結(jié)合最直接的解決了用戶為云廠商定制化地移植大容量業(yè)務(wù)邏輯帶來的困擾。

FaaS 運(yùn)行容器時需要盡可能消除額外開銷,使用戶體驗與本地運(yùn)行場景相近。穩(wěn)定快速的運(yùn)行同樣是優(yōu)秀 FaaS 的標(biāo)準(zhǔn),FC 提供了鏡像加載優(yōu)化的同時大大降低了冷啟動頻次為穩(wěn)定快速的運(yùn)行提供了保障。不僅如此,在應(yīng)用的可移植方面更加需要做到平滑,不限制開發(fā)模式的同時也要盡量降低用戶使用門檻。函數(shù)計算自定義鏡像支持標(biāo)準(zhǔn) HTTP 服務(wù),自由配置可用端口,可讀的同時也可寫,提供多種工具鏈以及多元化的部署方案,無強(qiáng)制等待鏡像準(zhǔn)備完成時間,自帶 HTTP 觸發(fā)而不依賴其他云服務(wù),支持自定義域名等一系列優(yōu)質(zhì)解決方案。

函數(shù)計算自定義鏡像適用但不限于人工智能推理、大數(shù)據(jù)分析、游戲結(jié)算、在線課程教育、音視頻處理等。推薦使用阿里云容器鏡像服務(wù)企業(yè)版實例 ACR EE,自帶鏡像加速功能,省去使用 ACR 鏡像時手動開啟加速拉取和加速鏡像準(zhǔn)備的步驟。

AI/ML 在線推理

推理類計算依賴大體積底層訓(xùn)練框架以及大量的數(shù)據(jù)處理,普通的 AI 框架如 Tensorflow 的鏡像可以輕松達(dá)到 GB 級,對 CPU 要求已經(jīng)很高,要再滿足擴(kuò)縮容就更是挑戰(zhàn)。函數(shù)計算自定義鏡像可以很好的解決此類需求,用戶只需直接使用底層訓(xùn)練框架鏡像并與數(shù)據(jù)處理邏輯打包至新的鏡像內(nèi)便可以輕松省去更換運(yùn)行環(huán)境所帶來的移植開銷,同時又可以滿足彈性擴(kuò)縮容帶來的快速訓(xùn)練結(jié)果。歌曲喜好推理、圖片 AI 識別分析等都可以無縫與函數(shù)計算銜接以達(dá)到彈性滿足大量動態(tài)的在線推理請求。

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-JJtapTv1-1637584327238)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/592e15e273f54158ab070267fa46af3b~tplv-k3u1fbpfcp-zoom-1.image “圖片”)]

輕量靈活 ETL

服務(wù)都依賴數(shù)據(jù),而數(shù)據(jù)處理往往需要消耗大量資源來滿足高效快速的數(shù)據(jù)變更請求。自定義鏡像與其他函數(shù)計算運(yùn)行時一樣可以滿足數(shù)據(jù)處理時的安全隔離,又同時保留了用戶將數(shù)據(jù)處理部分的業(yè)務(wù)邏輯自由的打包成鏡像的便捷能力。提供平滑遷移的同時滿足了鏡像啟動的極低額外延時,滿足了用戶針對如數(shù)據(jù)庫治理、萬物物聯(lián)等應(yīng)用場景的安全,高效,彈性的數(shù)據(jù)處理需求。

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-0wqoAeY0-1637584327239)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/232463e458b64ac3b096f9c0efb4f5cb~tplv-k3u1fbpfcp-zoom-1.image “圖片”)]

游戲戰(zhàn)斗結(jié)算

各類游戲內(nèi)通常會設(shè)置日常任務(wù)等場景短時間集聚大量玩家同時需要戰(zhàn)斗結(jié)算一類的數(shù)據(jù)處理,為了不讓游戲玩家失去耐心,戰(zhàn)斗數(shù)據(jù)校驗通常需要在短短幾秒內(nèi)完成,且單個玩家的數(shù)據(jù)結(jié)算單位時間不能隨著玩家數(shù)量增長而惡化。此類數(shù)據(jù)處理的業(yè)務(wù)邏輯通常繁雜且高度重復(fù),將玩家數(shù)據(jù)處理邏輯打包至函數(shù)計算自定義鏡像內(nèi)便可以彈性滿足短時間大量相似的玩家結(jié)算請求。

未來規(guī)劃

優(yōu)化函數(shù)計算自定義鏡像的初衷就是要讓用戶感受不到容器鏡像傳輸帶來的額外延遲,給云原生開發(fā)者最極致的體驗。優(yōu)化不會停止,我們最終的目標(biāo)是幾乎消除容器鏡像拉取的額外開銷和大量擴(kuò)容時鏡像倉庫成為瓶頸,極速伸縮。進(jìn)一步完善 Serverless Caching 的同時 Custom Container 功能未來會幫助 Kubernetes 上的 Web 應(yīng)用, Job 類工作負(fù)載無縫運(yùn)行在函數(shù)計算。Kubernetes 負(fù)責(zé)處理常駐、流量穩(wěn)定的工作負(fù)載,Serverless 服務(wù)分擔(dān)波動明顯的計算將逐漸成為云原生的最佳實踐。

1)函數(shù)計算公開用例

https://github.com/awesome-fc

2)社區(qū)官網(wǎng)

http://www.serverless-devs.com/

3)項目倉庫

https://github.com/Serverless-Devs/Serverless-Devs

4)Serverless Desktop 桌面客戶端

https://serverlessdevs.resume.net.cn/zh-cn/desktop/index.html

5)Serverless 應(yīng)用開發(fā)者套件

http://serverless-dk.oss.devsapp.net/docs/tutorial-dk/intro/react

6)Serverless Devs CLI

https://serverlessdevs.resume.net.cn/zh-cn/cli/index.html

7)Serverless Hub 應(yīng)用中心

https://serverlesshub.resume.net.cn/#/hubs/special-view

戳??此處??了解更多函數(shù)計算詳情!?

總結(jié)

以上是生活随笔為你收集整理的函数计算 GB 镜像秒级启动:下一代软硬件架构协同优化的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。