當前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

数据库分库分表、读写分离的原理和实现，以及使用场景

發布時間：2023/12/6 数据库 47 豆豆

生活随笔收集整理的這篇文章主要介紹了数据库分库分表、读写分离的原理和实现，以及使用场景小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

2019獨角獸企業重金招聘Python工程師標準>>>

為什么要分庫分表和讀寫分離？

類似淘寶網這樣的網站，海量數據的存儲和訪問成為了系統設計的瓶頸問題，日益增長的業務數據，無疑對數據庫造成了相當大的負載，同時對于系統的穩定性和擴展性提出很高的要求。隨著時間和業務的發展，數據庫中的表會越來越多，表中的數據量也會越來越大，相應地，數據操作的開銷也會越來越大；另外，無論怎樣升級硬件資源，單臺服務器的資源（CPU、磁盤、內存、網絡IO、事務數、連接數）總是有限的，最終數據庫所能承載的數據量、數據處理能力都將遭遇瓶頸。分表、分庫和讀寫分離可以有效地減小單臺數據庫的壓力。

分庫分表的原理和實現

1.什么是分區、分表、分庫

分區

就是把一張表的數據分成N個區塊，在邏輯上看最終只是一張表，但底層是由N個物理區塊組成的，分區實現比較簡單，數據庫mysql、oracle等很容易就可支持。

分表

就是把一張表按一定的規則分解成N個具有獨立存儲空間的實體表。系統讀寫時需要根據定義好的規則得到對應的字表明，然后操作它。

分庫

一旦分表，一個庫中的表會越來越多

將整個數據庫比作圖書館，一張表就是一本書。當要在一本書中查找某項內容時，如果不分章節，查找的效率將會下降。而同理，在數據庫中就是分區。

2.什么時候考慮使用分區？

一張表的查詢速度已經慢到影響使用的時候。

sql經過優化

數據量大

表中的數據是分段的

對數據的操作往往只涉及一部分數據，而不是所有的數據

分區解決的問題

主要可以提升查詢效率

分區的實現方式（簡單），例如：

mysql5 開始支持分區功能

CREATE TABLE sales ( id INT AUTO_INCREMENT,

amount DOUBLE NOT NULL,

order_day DATETIME NOT NULL,

PRIMARY KEY(id, order_day)

) ENGINE=Innodb

PARTITION BY RANGE(YEAR(order_day)) (

PARTITION p_2010 VALUES LESS THAN (2010),

PARTITION p_2011 VALUES LESS THAN (2011),

PARTITION p_2012 VALUES LESS THAN (2012),

PARTITION p_catchall VALUES LESS THAN MAXVALUE);

3.什么時候考慮分表？

一張表的查詢速度已經慢到影響使用的時候。

sql經過優化

數據量大

當頻繁插入或者聯合查詢時，速度變慢

4.分表解決的問題

分表后，單表的并發能力提高了，磁盤I/O性能也提高了，寫操作效率提高了

查詢一次的時間短了

數據分布在不同的文件，磁盤I/O性能提高

讀寫鎖影響的數據量變小

插入數據庫需要重新建立索引的數據減少

5.分表的實現方式（復雜）

需要業務系統配合遷移升級，工作量較大。

6.常見分表、分庫常用策略：

1.平均進行分配hash(object)%N(適用于簡單架構)。

2.按照權重進行分配且均勻輪詢。

3.按照業務進行分配。

4.按照一致性hash算法進行分配(適用于集群架構，在集群中節點的添加和刪除不會造成數據丟失，方便數據遷移)。

7.分庫分表中間件

分表又分為單庫分表（表名不同）和多庫分表（表名相同），不管使用哪種策略都還需要自己去實現路由，制定路由規則等，可以考慮使用開源的分庫分表中間件，無侵入應用設計，例如淘寶的tddl等。

讀寫分離的原理和實現

1、什么是讀寫分離

讀寫分離，基本的原理是讓主數據庫處理事務性增、改、刪操作（INSERT、UPDATE、DELETE），而從數據庫處理SELECT查詢操作。數據庫復制被用來把事務性操作導致的變更同步到集群中的從數據庫。

2、為什么要讀寫分離呢？

因為數據庫的“寫”（寫10000條數據到oracle可能要3分鐘）操作是比較耗時的。

但是數據庫的“讀”（從oracle讀10000條數據可能只要5秒鐘）。

所以讀寫分離，解決的是，數據庫的寫入，影響了查詢的效率。

3、什么時候要讀寫分離？

數據庫不一定要讀寫分離，如果程序使用數據庫較多時，而更新少，查詢多的情況下會考慮使用，利用數據庫主從同步。可以減少數據庫壓力，提高性能。當然，數據庫也有其它優化方案。memcache 或是表折分，或是搜索引擎。都是解決方法。

4.主從復制、讀寫分離的基本設計

在實際的生產環境中，對數據庫的讀和寫都在同一個數據庫服務器中，是不能滿足實際需求的。無論是在安全性、高可用性還是高并發等各個方面都是完全不能滿足實際需求的。因此，通過主從復制的方式來同步數據，再通過讀寫分離來提升數據庫的并發負載能力。

一臺主、多臺從，主提供寫操作，從提供讀操作。

讀寫分離的實現：

我們只需要實現讀寫分離，主從復制數據一般由數據庫級來實現同步，當然也可以自己去實現同步，只是需要考慮的點比較多。

分庫分表、讀寫分離總結

1.分區

對業務透明，分區只不過把存放數據的文件分成了許多小塊，根據一定的規則把數據文件(MYD)和索引文件（MYI）進行了分割，分區后的表呢，還是一張表。

2.分表

當數據量大到一定程度的時候，都會導致處理性能的不足，這個時候就沒有辦法了，只能進行分表處理。也就是把數據庫當中數據根據按照分庫原則分到多個數據表當中，這樣，就可以把大表變成多個小表，不同的分表中數據不重復，從而提高處理效率。

3.分庫

分表和分區都是基于同一個數據庫里的數據分離技巧，對數據庫性能有一定提升，但是隨著業務數據量的增加，原來所有的數據都是在一個數據庫上的，網絡IO及文件IO都集中在一個數據庫上的，因此CPU、內存、文件IO、網絡IO都可能會成為系統瓶頸。

當業務系統的數據容量接近或超過單臺服務器的容量、QPS/TPS接近或超過單個數據庫實例的處理極限等此時，往往是采用垂直和水平結合的數據拆分方法，把數據服務和數據存儲分布到多臺數據庫服務器上。

4.讀寫分離方案

當數據庫讀遠大于寫，查詢多的情況，就可以考慮主數據負責寫操作，從數據庫負責讀操作，一主多重，從而把數據讀寫分離，最后還可以結合redis等緩存來配合分擔數據的讀操作，大大的降低后端數據庫的壓力。

轉載于:https://my.oschina.net/u/3778090/blog/2051657

總結

以上是生活随笔為你收集整理的数据库分库分表、读写分离的原理和实现，以及使用场景的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： azkaban使用
下一篇：数据库时区那些事儿 - MySQL的时区

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

数据库

数据库分库分表、读写分离的原理和实现，以及使用场景

總結