日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

“逃离”单体,GitHub的微服务架构实践

發布時間:2024/4/11 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 “逃离”单体,GitHub的微服务架构实践 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

點擊上方“朱小廝的博客”,選擇“設為星標”

后臺回復"書",獲取

后臺回復“k8s”,可領取k8s資料

本文介紹 GitHub 如何從單體架構遷移到微服務架構,并對其中一些最佳實踐做了詳細說明。

1旅程開啟

GitHub 創建于 2008 年,其宗旨是為開發人員托管和分享代碼提供便利。GitHub 的創建者也是開源貢獻者,他們在 Ruby 社區非常有影響力。正因為如此,GitHub 的架構深深地扎根于 Ruby on Rails。

在公司的整個發展歷程中,我們雇傭了世界上最好的 Ruby 開發人員,幫助我們擴展和優化代碼庫。如今,我們的平臺上已經有超過 5000 萬名開發人員,每年有超過 8000 萬個 pull 請求合并,全球各大洲有超過 1 億個代碼存儲庫。

如你所見,這個單體架構已經帶我們走得很遠。一個演進了 12 年的代碼庫,每天要協調多次部署。我們有一個規模很大的平臺,每天處理 10 億次 API 調用,我們還提供了一個高性能的用戶界面,專注于完成這項工作。

2內部快速增長

在過去 18 個月中,GitHub 內部經歷了快速增長。我們已經有超過 2000 名員工,為代碼庫做貢獻的工程師數量已經是以前的兩倍多。這種增長既包括自身的逐步發展,也包括收購,如 Semmle、npm、Dependabot 和 Pull Panda。

此外,GitHub 是一個高度分散的團隊,在疫情發生前,我們就有超過 70% 的員工是在舊金山總部以外的地方辦公。GitHub 的員工和承包商要跨六大洲展開協作,他們工作的時區各不相同。我們有 1000 多名內部開發人員,他們有各種各樣的開發技能,涉及到許多不同的技術。

顯然,我們需要從根本上重新考慮下 GitHub 的軟件開發工作。讓每個人在參與開發之前都學習 Ruby,讓所有人都在同一個單體代碼庫上進行開發,不再是擴展 GitHub 最高效、最優化的方法。根據康威定律,任何組織設計的系統,其結構都是對組織溝通結構的復制。

反之亦然,單體架構會導致更大規模的涉眾會議,更復雜的決策過程,因為交織的邏輯和共享的數據會影響所有團隊。

3單體 vs. 微服務

因此我們就想,是不是該從 Ruby on Rails 單體遷出,轉向一種微服務架構了?如果是這樣的話,我們該如何進行?單體架構和微服務架構各有所長。

在單體環境中,配置并運行應用程序更簡單,不用考慮復雜的依賴關系,拉取所有必要的依賴項。新建一個 Hubber,只需幾個小時就可以在本機上配置好 GitHub 并運行起來。在單體架構中,代碼在有些情況下會更簡潔。例如,不用添加超時處理邏輯,也不用考慮如何優雅地處理由網絡延遲和中斷所導致的失敗。

此外,由于所有人都工作在同一個技術棧上,大家對代碼庫都很熟悉,所以可以方便地將開發人員和團隊調去開發單體的其他特性,有利于實現特性的全局最優。考慮到 GitHub 在過去 18 個月中的增長情況,微服務環境的一部分優點吸引了我們。

例如,建立具有系統級所有權的特性團隊,通過清晰定義的 API 契約確立職責邊界。在遵循 API 契約的前提下,團隊有充分的自由選擇最適合自己的技術棧。代碼庫更小意味著閱讀更容易、啟動速度更快、問題排查更簡單。開發人員不用為了提高生產力去理解一整個龐大的代碼庫的內部運行機制。最重要的是,服務現在可以根據各自的需求單獨擴展。

4務實——以賦能為出發點

在開始遷移 GitHub 之前,我們花了一些時間考慮為什么要這樣做,以及這樣做的目標是什么。對我們來說,這是文化上的巨大轉變,需要做大量的工作。我們得想好,到底要解決什么問題和痛點。

在 GitHub,這樣做可以讓超過一半的開發人員(在過去的 18 個月中加入)在單體代碼庫之外富有成效地開展工作。我們的目標是賦能而非替代。

為此,我們得接受這樣一個現實,GitHub 未來的特性將基于一個單體 - 微服務混合的環境。也就是說,對于我們來說,維護和改進現有的單體代碼庫仍然很重要。有一個很好的例子是,我們最近升級到了 Ruby2.7。感興趣的話,可以從 GitHub 官方博客上了解我們做了什么,以及我們總體上如何改進系統。

5良好的架構始于模塊化

良好的架構始于模塊化。拆分單體的第一步是考慮基于特性功能分割代碼和數據。這個過程可以在真正在微服務環境中拆分之前在單體中完成。使代碼庫易于管理,通常都是一種良好的架構實踐。確保每個服務都有自己的數據,并且能夠控制對這些數據的訪問,而且只能通過明確定義的 API 契約訪問。

我看到,在很多情況下,人們會首先抽出代碼邏輯,但仍然使用單體的共享數據庫。這往往會導致分布式單體,這是最糟糕的單體,同時也是最糟糕的分布式。沒有獲得任何好處(比如,單獨快速地向生產環境中部署一組特性),卻還要應對微服務的復雜性。

6數據拆分

正確地拆分數據是從單體架構轉向微服務的基礎。這里將稍微詳細地介紹下 GitHub 的做法。

首先,我們在現有的數據庫模式中識別功能邊界,并按照這些邊界將實際的數據庫表分組。例如,我們將所有存儲庫相關的表分到一起,所有用戶相關的分到一起,所有項目相關的分到一起。我們將生成的功能分組稱為模式域,并記錄在 YAML 定義文件中。現在,這個文件就成了事實來源。在數據庫模式中添加或刪除表,都要更新這個文件。我們通過一種靜態分析測試方法來提醒開發人員,在修改數據庫模式時,要更新這個文件。

接下來,對于每個模式域,我們找了一個分區鍵。這是一個共享字段,將一個功能組中的所有信息聯系在一起。例如,存儲庫模式域(其中包含所有與存儲庫相關的數據,如問題、pull 請求、評審意見)使用存儲庫 ID 作為分區鍵。最終,創建數據庫模式功能組幫助我們將數據拆分到微服務架構所需的不同服務器和集群上。

對于當前的跨域查詢,我們做了修復,以防數據拆分對產品造成破壞。在 GitHub,我們在單體中實現了一個查詢監視器來幫助我們檢測,并在發現跨域查詢時發出告警信息。我們會根據域邊界,把這些查詢拆分并重寫成多個,并在應用程序層實現必要的連接。在劃分完功能組后,我們開始通過一個類似的過程,進一步將數據分片到相應的租戶組。

GitHub 有超過 5000 萬用戶和 1 億個存儲庫,在這樣的規模下,功能組可能會變得非常大。這時,分區鍵就派上用場了。例如,一種簡單的方法是根據數值范圍將不同的用戶分配到不同的數據存儲。更常見的可能是根據每個數據集的特性(如區域和大小)所做的邏輯分組。Tenantizing 是一個很好的方法,可以將數據存儲故障的爆炸半徑限制在客戶的一個子集里,而不是一下子影響到所有人。

7從核心服務和共享資源入手

我們已經花了很多時間討論數據拆分的重要性。現在,我們換個話題,介紹下從單體中抽取服務的基礎工作。一定要記住,依賴方向只能從單體內到單體外,不能反過來,否則,我們最終會得到一個分布式單體。也就是說,當從單體中抽取服務時,要從核心服務入手,然后逐步到特性層面。

接下來,找出開發人員在單體環境中開發時所使用的助力工具。隨著時間的推移構建一些共享工具以方便單體開發,這是很常見的。例如,我們的特性標識,可以讓單體開發者安心地將新特性從測試環境轉到生產環境,因為在這個過程中,他們可以通過這個標識控制誰能看到這些特性。將助力工具轉移出來,讓開發人員在單體之外也可以使用這些工具。

最后,在新服務上線運行后,務必要刪除舊的代碼路徑。通過工具來識別誰在調用這個服務,并規劃好如何將流量全部導向新服務,這樣你就不用老是為兩套代碼提供支持了。在 GitHub,我們使用一個名為 Scientist 的工具幫我們處理這種上線,我們可以用它并排運行和比較新舊代碼路徑。

8AuthN/AuthZ 抽取

在 GitHub,我們決定首先抽取的核心服務是身份驗證和授權。身份驗證相當復雜,因為所有東西都依賴于它。網站和 Git 操作之間有一大堆的共享邏輯。也就是說,如果 github.com 宕掉了,那么 Git 系統就無法訪問了,即使是使用命令行窗口,也無法執行像 pull、push 這樣的 Git 操作。這就是為什么把這些基礎部分抽取出來如此重要,那可以讓主要功能脫離單體而運行。

對于我們來說,身份驗證已經很簡單,因為我們已經在單體外部將它重寫為一個鏡像服務。當前的 Rails 應用程序(即我們的單體)使用 Twirp(這是一個 gRPC 風格的服務到服務通信框架)和它通信,依賴方向是由內到外。

9運營變化

監控、CI/CD、容器化都不是什么新概念,但為了支持從單體到微服務的轉型,節省時間,加速向微服務的過渡,運營要做必要的改變。在修改這些工作流時,要時刻記著微服務的特性。與為一個大型單體運行單個高度定制化的管道相比,為眾多小型的、獨立運行的、基于不同技術棧的服務提供運營支持存在很大的差別。將監控從功能調用指標升級為網絡指標和契約接口。推動實現自動化程度更高、更可靠的 CI/CD 管道,并使其可以在服務之間共享。使用容器化技術支持各種語言和技術棧。創建工作流模板以實現重用。

例如,在 GitHub,我們創建了一個自助服務運行時平臺,可以用于微服務的打包交付。其目的是大幅減輕每個團隊創建微服務時的運營負擔。它提供了現成的 Kubernetes 模板,可自由使用的 Ingress 負載均衡設置。它可以將日志自動提取到 Splunk,并集成了我們內部的部署流程。這樣,任何團隊想要試驗或上線一個新的微服務都會更容易。

10小處著手,考慮產品 / 業務價值

到目前為止,我們主要討論的還是結構性變化,以及從單體成功過渡到微服務架構所需要的基礎工作。此后,任何新特性都應該創建成單體外的一個微服務。

下一步,找一些簡單的小特性從單體中遷移出來,例如,那些沒有復雜依賴和共享邏輯的特性。在 GitHub,我們是從 webhook 推送和語法高亮開始的。我們希望在遷移更多更大的單體功能之前,找出常見的模式和兩種架構之間的差別。我們是根據產品和業務價值來確定微服務的大小。

我們通過查找經常一起更改和部署的代碼和數據,來確定耦合度較高的特性或功能,并以此為基礎,自然地劃分成可以獨立于其他部分單獨迭代和部署的分組。此外,專注于產品和業務價值,還有助于組織內跨工程團隊、產品和設計開展緊密合作。請注意,拆分得太小往往會增加不必要的復雜度和開銷。例如,需要維護單獨的部署密鑰,更多的服務臺職責,以及由于缺少知識共享而導致的單點故障。

11實現異步性和彈性代碼

從單體轉向微服務是重大的模式轉變。在這個過程中,不管是軟件開發流程,還是實際的代碼庫,都會發生很大的變化。在最后一部分內容中,我們將快速了解下服務之間的通信以及失敗機制(designing for failure),這兩個都是微服務開發中非常重要的概念。

服務之間的通信方式有兩種:同步和異步。使用同步通信,客戶端在發送請求后會等待服務器的響應。使用異步通信, 客戶端在發送請求后不會等待響應,每條消息都可以由多個接收者處理。在 GitHub,我們使用 Twirp 實現單體與單體外部核心服務(如授權)之間的同步通信。

然而,隨著越來越多的服務移到單體之外,同步通信開始變得非常低效。而且,那還導致了服務之間的緊耦合,背離了遷移到微服務架構的初衷。更好的做法是創建一個共享的事件管道,協調多個生產者和消費者之間的消息。在 SendGrid,我們使用的就是這種架構。

由于服務不再是運行在一臺服務器上,所以考慮網絡通信中的延遲和故障非常重要。對于大部分暫時的網絡問題,使用一種簡單的重試機制,定義好重試頻率和最大重試次數,就足夠了。可以考慮使用指數退避讓重試邏輯變得更加智能。例如,隨著重試次數的增加延長等待時間,而不是間隔同樣的時間,從而緩解那些因為過載而無法響應的服務器的壓力。作為一種自我保護和自愈機制,還可以在服務之間增加斷路器。例如,在多次嘗試失敗之后,斷路器會打開,在服務恢復之前,不再允許額外的請求進入。為服務設置超時時間,這樣服務就不會一直等待外部服務的響應。設法實現優雅的失敗,可以向用戶展示友好的提示信息,或者恢復到緩存中上一個已知的良好狀態。關注用戶體驗,做對企業有益的事。

12小結

本文前 4 部分主要介紹了在開啟從單體到微服務的旅程之前應該了解的基礎內容。關注遷移原因。考慮模塊化和數據拆分。從核心服務和共享資源入手,做必要的運營調整。做好這些準備,整個組織的微服務轉型之旅就會更加令人愉快。接下來,我們討論了從哪里入手,以及如何將微服務與產品和業務價值聯系起來。最后,我們介紹了微服務的兩個關鍵概念:服務之間的通信和構建彈性系統。

出品?|?http://03ozy.cn/QhFuJ

想知道更多?掃描下面的二維碼關注我后臺回復"技術",加入技術群后臺回復“k8s”,可領取k8s資料【精彩推薦】
  • ClickHouse到底是什么?為什么如此牛逼!

  • 原來ElasticSearch還可以這么理解

  • 面試官:InnoDB中一棵B+樹可以存放多少行數據?

  • 架構之道:分離業務邏輯和技術細節

  • 星巴克不使用兩階段提交

  • 面試官:Redis新版本開始引入多線程,談談你的看法?

  • 喜馬拉雅自研網關架構演進過程

  • 收藏:存儲知識全面總結

  • 微博千萬級規模高性能高并發的網絡架構設計

總結

以上是生活随笔為你收集整理的“逃离”单体,GitHub的微服务架构实践的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。