日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

实际场景中,云原生存储面临的 7 个挑战

發(fā)布時間:2025/3/20 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 实际场景中,云原生存储面临的 7 个挑战 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

作者 | Eric Li (壯懷) 阿里巴巴云原生存儲負責人

引言

隨著云原生應(yīng)用對可遷移性、擴展性和動態(tài)特性的需求,對云原生存儲也帶來了相應(yīng)的密度、速度、混合度的要求,所以對云存儲基本能力之上又提出了在效率、彈性、自治、穩(wěn)定、應(yīng)用低耦合、GuestOS 優(yōu)化和安全等方面的訴求。參考《云原生存儲和云存儲有什么區(qū)別?》

新的企業(yè)負載/智能工作負載容器化、遷云、存儲方面遇到的性能、彈性、高可用、加密、隔離、可觀測性及生命周期等方面的問題,不但需要存儲產(chǎn)品層次的改進,還需要在云原生的控制/數(shù)據(jù)平面的改進,推進云原生存儲和云存儲的演進。下文將分別介紹一下問題場景及問題,探討可行的解決方案,最終可以得出云原生存儲、云存儲目前可以做什么和未來還需要做什么。

存儲性能

長時延增加

場景

高性能計算場景中,集中處理批量數(shù)據(jù),通過容器集群,同時啟動數(shù)千 Pod,彈出數(shù)百 ECS 對共享性文件系統(tǒng)讀寫。

問題

重負載終負載下時延增加,高延遲毛刺增多,讀寫穩(wěn)定性不足。

解決方案

  • 分散負載到多文件系統(tǒng),通過容器編排分散 IO 到多文件系統(tǒng)
  • 存儲產(chǎn)品的盤古 2.0 改造

集中式高吞吐寫對共享存儲池沖擊

場景

高性能計算場景中,集中處理批量數(shù)據(jù),10Gbps 讀寫請求進入同一存儲集群。

問題

同一存儲集群中的帶寬擠占,造成訪問質(zhì)量下降。

解決方案

  • 分散負載到多文件系統(tǒng)和多個存儲集群/多個可用區(qū),通過容器編排分散 IO 到多文件系統(tǒng);
  • 使用獨占高性能并行文件系統(tǒng)。

峰值吞吐不足

場景

大規(guī)模生物數(shù)據(jù)處理, 文件數(shù)目少,峰值吞吐高 10Gbps-30Gbps,請求密集 1W/s。

問題

接近獨占集群的極限帶寬。

解決方案

  • 讀寫分流,分流讀請求到 OSS,寫請求負載分流到獨占文件系統(tǒng)和本地/遠程塊存儲,通過容器編排分散 IO 到多文件系統(tǒng);
  • 使用應(yīng)用層分布式緩存降低網(wǎng)絡(luò)讀 IO;
  • 存儲產(chǎn)品的盤古 2.0 改造。

時延增加導致 GPU 等待

場景

多機多卡 GPU 訓練,直接讀取 OSS 數(shù)據(jù),讀密集型。

問題

時延增加導致 IOwait 和 GPU 等待。

解決方案

  • 應(yīng)用層透明 POSIX 讀訪問 OSS;
  • 使用應(yīng)用層分布式緩存降低網(wǎng)絡(luò)讀 IO。

存儲彈性

場景

  • 數(shù)據(jù)庫擴容, MySQL and etc;
  • 元數(shù)據(jù)管理應(yīng)用在線擴容 Zookeeper/etcd;
  • 本地盤存儲容量無法擴容。

解決方案

  • 云盤在線擴容,應(yīng)用控制面文件系統(tǒng)/邏輯卷離線,在線擴容能力;
  • 單機云盤掛載密度;
  • 存儲產(chǎn)品 ESSD 的替換使用。

存儲高可用

場景

  • 應(yīng)用運維,系統(tǒng)運維;
  • 塊存儲隨容器遷移的穩(wěn)定性和可發(fā)現(xiàn)性。

解決方案

  • 控制平面聲明式存儲快照,備份,定時快照備份,本地快照加速備份和恢復;
  • 控制平面云盤 SerialNum 的可發(fā)現(xiàn)性改造。

存儲的加密

場景

  • 用戶應(yīng)用的全鏈路數(shù)據(jù)加密需求;
  • 操作系統(tǒng)盤加密。

解決方案

  • 產(chǎn)品存儲的 CMK,BYOK 支持
  • 控制平面的加密聲明支持
  • RAM 權(quán)限的最小化控制

存儲的隔離性

場景

  • 單盤多應(yīng)用共享,單機日志盤塊存儲切分
  • 單塊本地盤/云盤吞吐能力不足
  • 文件系統(tǒng)多租戶環(huán)境的容量配額
  • 集群級文件系統(tǒng)共享訪問的權(quán)限控制

解決方案

  • 控制面 LVM 切分,控制面塊存儲 blkio buffer IO 應(yīng)用級限速
  • 控制面 LVM 多盤聚合和條帶
  • 存儲產(chǎn)品共享文件系統(tǒng)的目錄級 Quota
  • 控制面文件系統(tǒng)的目錄級 ACL

存儲的可觀測性

場景

多租戶 Zookeeper/etcd,租戶/應(yīng)用級的 IO 指標監(jiān)控和預警。

解決方案

  • 控制面應(yīng)用級 IO Metrics 采集能力
  • 控制面設(shè)備級 IO Metrics 采集能力
  • 控制面掛載點級 IO Metrics 采集能力

存儲的生命周期

場景

共享文件系統(tǒng)/緩存系統(tǒng)的聲明式創(chuàng)建和刪除。

解決方案

  • Operator: 云盤/本地盤 (TiDB)
  • Operator: 文件系統(tǒng),CPFS
  • Operator: 對象存儲

云原生存儲 v2

針對以上在新的計算模式下,存儲方面遇到的性能,彈性,高可用,加密,隔離,可觀測性,生命周期等方面的問題,不但是需要存儲產(chǎn)品層次的改進,更需要在云原生的控制/數(shù)據(jù)平面的改進,在不久的將來實現(xiàn)穩(wěn)定,安全,自治,和效率并舉的云原生存儲 v2。

  • 穩(wěn)定:阿里云存儲的全品類支持可觀測性, Flexvolume and CSI plugins/IO metrics (CSI for 1.14);
  • 安全:全連路數(shù)據(jù)存儲的可靠/可信存儲支持,CSI 快照加密,系統(tǒng)盤加密;
  • 自治:云盤快照 /本地快照 ,離線在線的存儲擴容能力, 元數(shù)據(jù)自動發(fā)現(xiàn);
  • 效率:I/O 隔離 、可伸縮性/云盤再次分割提升密度/分布式存儲緩存。

需要在云原生應(yīng)用層、存儲云產(chǎn)品層、底層存儲適配和存儲核心層都需要做相應(yīng)的改進和提升才有可能提供更加穩(wěn)定,安全,自治和高效的面向應(yīng)用的云原生存儲。

總結(jié)

  • 云原生存儲是云存儲 UI 和效率等能力的集合;
  • 分層存儲,不重新發(fā)明輪子;
  • 新的工作負載推進云原生存儲和云存儲的演進,云原生控制平面實現(xiàn)效率,自治方面能力,從數(shù)據(jù)面提升存儲穩(wěn)定和減小安全隱患,云存儲繼續(xù)夯實性能,容量,彈性,密度等基礎(chǔ)能力,共建云原生環(huán)境下的存儲生態(tài)。

在云原生存儲 v2 的演進過程中,仍然需要容器團隊和存儲團隊,通力合作,共同提升的云原生時代的存儲能力。

“阿里巴巴云原生關(guān)注微服務(wù)、Serverless、容器、Service Mesh 等技術(shù)領(lǐng)域、聚焦云原生流行技術(shù)趨勢、云原生大規(guī)模的落地實踐,做最懂云原生開發(fā)者的公眾號。”

總結(jié)

以上是生活随笔為你收集整理的实际场景中,云原生存储面临的 7 个挑战的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。