當前位置：首頁 > 运维知识 > windows >内容正文

windows

如何快速优化几千万数据量的订单表

發(fā)布時間：2023/12/24 windows 31 coder

生活随笔收集整理的這篇文章主要介紹了如何快速优化几千万数据量的订单表小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

前言

為了保證有一個更健康的身體，所以慢慢降低了更新頻率，在有了更多休息時間的前提下，思考了一下接下來準備分享的一些內容。

決定在更新一些技術干貨的同時，會穿插一些架構知識，放在單獨的專欄里面，希望大家能喜歡，里面包含了這些年工作中遇到的一些內容，以及自己充電后總結的一些知識，希望大家會喜歡。

標題做了較為詳細的劃分，大家不必一次看完，以免視覺疲勞。

場景

本篇分享以前在廣州一家互聯(lián)網公司工作時遇到的狀況及解決方案，這家公司有一個項目是SOA的架構，這個架構那幾年是很流行的，哪怕是現(xiàn)在我依然認為這個理念在當時比較先進。

我在這家公司待的時間不長，但因為平臺不錯，確實學習和實踐了一點東西，所以整理一下分享給大家。

當時的項目背景大概是這樣，這家公司用的是某軟提供的方案（這公司賊喜歡提供方案且要錢多，忍不住吐槽哈），項目已經運行3年多，整體穩(wěn)定。

數(shù)據(jù)庫是MySQL，訂單表的數(shù)據(jù)量已經達到3000多萬條記錄，并且隨著項目的推廣，最近那一年訂單表數(shù)據(jù)量也在快速增長。

結果就是，客戶方查詢訂單相關的業(yè)務時速度越來越慢，后期不論打開還是刷新都差不多要七八秒。

可以說已經嚴重影響了客戶體驗，降低了對方日常辦事的效率，要求我們盡快解決，且敦促我們這是一件優(yōu)先級非常高的事情。

在客戶和公司領導的雙重壓力下，如何快速優(yōu)化幾千萬數(shù)據(jù)的訂單表，對于當時的團隊著實是一個難題擺在面前。

我依稀記得自己當時還比較青澀，更多的是一個聽眾，不敢參與深入討論哈哈。

整體方案

首先常規(guī)方案能想到的無非是這些：增加合理的數(shù)據(jù)庫索引、優(yōu)化核心SQL語句、優(yōu)化代碼等。

我這里可以告訴大家，一般的IT公司，但凡團隊Leader是個有經驗的人，這些基礎方案都是會提前做的，會對項目上線后可能遇到的瓶頸有個基本的評估，因為真正運營周期變長以后，數(shù)據(jù)量逐漸增多，修改生產庫是一種風險操作。

我不知道大家有沒有過給某個生產庫數(shù)據(jù)量比較大的表添加字段或索引的經歷，而且是在白天上班操作，或者說你自己見過別人這么干，我只能說……這些都是狠人，要對其常懷敬畏之心。

我目前所在的公司就比較規(guī)范，研發(fā)人員建表時一定要提交申請走流程，且附帶合理的索引，一起提交審核，最終通過了才能由主管審核執(zhí)行。

至于這種流程怎么走，其實工具挺多，我這里就提一個用過的開源項目：Yearning，大家可以自己去了解下。

話題扯回來，正因前面所講，在當前的問題下，這些基礎方案實際上已經存在，在這里顯然是用不上了，加上緊急問題緊急處理，沒有那么多時間給你去對既有架構大動干戈。

因此，當時立馬能想到且有效的臨時性方案迅速在團隊討論中率先冒出來，就是數(shù)據(jù)庫分區(qū)。

1、數(shù)據(jù)庫分區(qū)

理解數(shù)據(jù)庫分區(qū)，只需要記住以下兩點：

數(shù)據(jù)庫分區(qū)是把一張表的數(shù)據(jù)分在了不同的硬盤上，但仍是一張表，說硬盤可能不完全準確，但就這樣理解是最容易的。
不要把數(shù)據(jù)庫分區(qū)和分庫分表混淆，一個是數(shù)據(jù)庫級別的操作，一個是代理工具的操作，前者限制較多，后者更靈活。

知道這兩點其實就足夠了，數(shù)據(jù)庫分區(qū)和分庫分表也是面試中喜歡問的，因為確實有一些類似的地方。

好了，有了基本認識，那接下來就說下數(shù)據(jù)庫分區(qū)如何操作的，先看個圖有個畫面。

接著舉個示例，我們假設有一張訂單表，那么對這張訂單表按照年份進行分區(qū)的命令如下：

-- 創(chuàng)建訂單表
CREATE TABLE orders (
    id INT PRIMARY KEY AUTO_INCREMENT,
    order_number VARCHAR(20),
    order_date DATE,
    customer_id INT,
    total_amount DECIMAL(10, 2)
);

-- 按照年份對訂單表進行分區(qū)
ALTER TABLE orders
PARTITION BY RANGE(YEAR(order_date)) (
    PARTITION p2018 VALUES LESS THAN (2019),
    PARTITION p2019 VALUES LESS THAN (2020),
    PARTITION p2020 VALUES LESS THAN (2021),
    PARTITION p2021 VALUES LESS THAN (2022),
    PARTITION p2022 VALUES LESS THAN (2023),
    PARTITION p2023 VALUES LESS THAN (2024)
);

這樣一來，數(shù)據(jù)庫就會將這張表的數(shù)據(jù)按照YEAR(order_date)的值分別存在 p2018 ~ p2023 這6個分區(qū)中。

如果結合本篇的問題，3000多萬條記錄，那么按照年份分區(qū)，大概一個分區(qū)是1000萬記錄左右，然后可以優(yōu)化查詢語句只去掃描特定的分區(qū)，是不是一下就輕松了很多。

再深入點，按照年份一個分區(qū)1000萬還是有點多了，我們是不是可以找到一個更合理的分區(qū)字段，讓每個分區(qū)的數(shù)據(jù)更少呢？

這里就要結合實際業(yè)務了，沒有真正的通用方案。

你要先明確一點，做分區(qū)的目的，最終是為了讓某個業(yè)務環(huán)節(jié)的查詢更快，就比如本篇這里，主要是為了讓客戶查詢訂單相關業(yè)務更快，那么你就要先把這塊的查詢語句摘取出來，分析一下里面的where條件有哪些。

比如，客戶要查詢某個或某些狀態(tài)的訂單，可能會這樣寫：where order_status in (?)；
比如，客戶要查詢某個特定群體的訂單，可能會這樣寫：where user_flag_id = ?；
比如，客戶要查詢某個或多個業(yè)務類型的訂單，可能會這樣寫：where order_type in (?)；

甚至，還可能有其他的組合條件摻雜進來，你千萬別以為你去的每個公司都把表設計的很漂亮很合理，我這么多年工作下來，真見過不少奇葩設計，訂單表里面能給你塞上openId或者某些單純?yōu)榱朔奖愣拥娜哂嘧侄危耆延唵伪碜陨淼墓δ苄源蛩椤?/p>

這個時候，如果分區(qū)字段本身存在，且剛好能把分區(qū)數(shù)據(jù)分的很合理，有利于查詢，比如前面按照年份劃分，每個分區(qū)如果只有兩三百萬記錄，再結合本身的索引，查詢就會很快，那么一切安好，搞完收工。

但如果分區(qū)字段很難定位，就像上面講的，一些主要SQL語句的where條件并不包含相同的字段，那就頭大了。

而且MySQL還有一個需要注意的點，就是它的分區(qū)本身是有限制的。

MySQL分區(qū)字段必須是唯一索引的一部分。

也就是說，如果沒有其他能用的唯一索引，我們只能結合主鍵ID，和分區(qū)字段組成復合主鍵才行。

這就更難了，純粹看這表長什么樣了。

話到這里，其實大家也看出來了，數(shù)據(jù)庫分區(qū)的優(yōu)缺點很明顯。

優(yōu)點：遇到合適的場景，優(yōu)化起來就是一個命令的事情。

缺點：限制太多，稍微復雜一點的場景你就很難定位分區(qū)字段。

那么，真的就沒法分了嗎？其實還有一個迂回的方案。

2、迂回方案

我們可以在表中新增一個專門為了分區(qū)而量身定做的字段，比如archive_flag，表示一種數(shù)據(jù)歸檔狀態(tài)，當值為1時表示已歸檔，值為0時表示未歸檔。

這個字段可以沒有業(yè)務意義，但一定要有分區(qū)意義。

我們可以把半年內的數(shù)據(jù)刷成 archive_flag=0，半年以外的數(shù)據(jù)刷成 archive_flag=1。

接下來，我們按照歸檔狀態(tài)進行分區(qū)即可，半年內的活躍數(shù)據(jù)是一個分區(qū)，其他非活躍數(shù)據(jù)是一個分區(qū)。

最后，只需要把核心的查詢語句where條件中都新增一個 archive_flag=0 就可以了，這樣就會掃描這個非歸檔狀態(tài)的分區(qū)，也就是活躍數(shù)據(jù)的分區(qū)。

試想一下，這個分區(qū)只有半年的記錄，按照本篇的場景，最多也就是500萬了，結合自身表索引，已經完全可以解決當前存在的問題。

好了，這個迂回方案其實挺不錯的，但一定有人會有疑問。

1）、加字段真的好嗎？

2）、為什么一定要半年內的數(shù)據(jù)？

首先解答第一個問題，答案是不好，在我這里的話甚至可以說非常不好，幾千萬數(shù)據(jù)量的表，為了解決一個查詢問題刻意新增一個沒有實際意義的字段，是舍本逐末的行為，如果除了這張表，還有其他表也有類似問題，難道每個都要加字段嗎？顯然是不可行，也是不安全的。

第二個問題，半年內的數(shù)據(jù)完全可以結合實際業(yè)務做修改。

舉個簡單的例子，你如果經常逛京東商城購物，一定會打開我的訂單看看，實際上給你展示的就是近3個月的訂單，你可以理解成這就是非歸檔的活躍數(shù)據(jù)。

當你想查詢以前的記錄時，就會給你一個鏈接叫歷史記錄，點擊后跳轉到歷史記錄列表，或者通過其他方式如下拉框，讓你選擇其他更早時間的訂單數(shù)據(jù)，這種其實就是已經歸檔的數(shù)據(jù)。

這些數(shù)據(jù)一般不會直接從業(yè)務表里查出來，而是從其他歸檔表，或者非關系型數(shù)據(jù)庫如mongodb、EasticSearch等查詢出來。

這種方式就類似做了分區(qū)，把你經常訪問的數(shù)據(jù)和訪問頻率較低的數(shù)據(jù)分布存儲，達到一個數(shù)據(jù)分離的目的。

這樣你就懂了，數(shù)據(jù)分區(qū)大體就是這樣的思考方式。

現(xiàn)在回過頭來想想前面說的優(yōu)缺點，數(shù)據(jù)庫分區(qū)真的合適嗎？

實際情況下，很少有情況合適，主要原因還是前面講過的，限制真的太多了，而業(yè)務往往又是復雜的。

另外，數(shù)據(jù)庫分區(qū)對于很多程序員來說，其實是陌生的，在中小企業(yè)更是如此，有這樣的現(xiàn)實擺在面前，加上短期內就要解決問題，隨便使用的話對于團隊來講也是一種風險。

所以，另一種更合理的方案也就呼之欲出了，數(shù)據(jù)的冷熱分離。

3、冷熱分離

前面講了那么多，其實就是為了過渡到這里來，上面的迂回方案或多或少已經摸到了冷熱分離的邊緣，主要是為了讓大家知其然并知其所以然。

1）、基本概念

冷熱分離聽起來很高端，其實本質很簡單，就是把活躍數(shù)據(jù)和非活躍數(shù)據(jù)區(qū)分開，一熱一冷，頻率高的查詢只操作熱數(shù)據(jù)，頻率低的只操作冷數(shù)據(jù)。

2）、存儲方案

既然要分離，就要考慮清楚熱數(shù)據(jù)和冷數(shù)據(jù)分別放在哪里。

這里我提供兩種選擇：

中小企業(yè)，我推薦依然用MySQL。

一來是不需要額外成本（降本增效？哈哈），二來是中小企業(yè)相對大廠，業(yè)務復雜度低一點且數(shù)據(jù)量小很多，那么此時完全可以用MySQL新增一張表來存儲某個業(yè)務的冷數(shù)據(jù)，比如訂單。

如果需要冷熱分離的業(yè)務較多，也可以建一個單獨的冷庫，來專門存放冷數(shù)據(jù)，不過這種我也不太推薦，因為涉及到跨庫查詢，增加了維護難度，咱們程序員盡量對自己好一點哈。

一個項目里面，其實兩三張冷表的出現(xiàn)已經可以處理核心業(yè)務數(shù)據(jù)冷熱分離的問題了，如果真有那么多大數(shù)據(jù)的表，我覺得要從其他方面找問題了（一些老項目，設計上本身有問題，那是真的沒好辦法）。

大廠，推薦HBase。

大廠的資源較多，平臺較大，冷熱分離不單是解決這種問題的唯一方案，但大廠比較推薦更合適的數(shù)據(jù)庫來存儲這樣的冷數(shù)據(jù)。

其中HBase是我從各種資料中見過的最多的一種，當然也有其他的，但HBase應該是里面最受歡迎的一類。

當然，我個人是沒有大廠經驗的，我只能把我掌握到的訊息告訴你們。

如果有興趣的話，可以去學習下HBase，它是一種在 Hadoop 上構建的分布式、可擴展的列式數(shù)據(jù)庫。

它最大的優(yōu)勢就是快速讀寫海量數(shù)據(jù)，且具有強一致性。

一般大廠對于冷數(shù)據(jù)的處理，往往都是因為冷數(shù)據(jù)在業(yè)務中也有相當?shù)牟樵凅w量，如果太慢也不符合大廠維護項目的標準，所以有必要專門優(yōu)化。

好了，這里之所以提到HBase，主要是為了擴充大家的知識面，其實中小企業(yè)的工程師也沒啥必要特地去學，依靠自身興趣驅動即可。

3）、區(qū)分冷熱數(shù)據(jù)

既然要冷熱分離，那么一張表中，如何區(qū)分哪些是熱數(shù)據(jù)，哪些是冷數(shù)據(jù)？

要分析這張表的字段特征，拿訂單表舉例，馬上能想到的就是：訂單狀態(tài)、創(chuàng)建時間。

訂單狀態(tài)的話，其實也類似于前面數(shù)據(jù)庫分區(qū)提過的歸檔狀態(tài)，你可以將狀態(tài)是已完成的數(shù)據(jù)歸類為冷數(shù)據(jù)，而待處理、處理中的都歸類為熱數(shù)據(jù)，這個要視你們自己的業(yè)務決定。

創(chuàng)建時間的話，就比較常見了，也是我推薦中小企業(yè)使用的方法，因為幾乎所有的核心業(yè)務表，都一定會有創(chuàng)建時間這個字段，我們可以把查詢頻繁的時間區(qū)間的數(shù)據(jù)歸類為熱數(shù)據(jù)，其他時間都歸類為冷數(shù)據(jù)。

比如本篇我講的案例，當時我們公司就是半年內的數(shù)據(jù)是查詢非常頻繁的，因此直接按照最近半年作為區(qū)分冷熱數(shù)據(jù)的規(guī)則。

4）、如何冷熱分離

這里有四種方案：

代碼中處理

這個很好理解，比如訂單表中，當狀態(tài)從處理中改為已完成時，你就可以將這條記錄歸類為冷數(shù)據(jù)，放到冷表或冷庫中。

優(yōu)點是很靈活，而且實時性高。

缺點是相關的代碼位置你都要做修改，另外如果是按照時間做冷熱分離，這個方案基本就不可取。

你想想，你怎么判斷呢？我們按照半年內的數(shù)據(jù)作為熱數(shù)據(jù)，那么你在哪個方法哪個事件觸發(fā)時將這筆訂單歸類為冷數(shù)據(jù)？可以說做不到。

任務調度處理

這種就是定時任務去掃描數(shù)據(jù)庫，比如xxl-job，新建一個調度任務，定時去掃描數(shù)據(jù)庫，判斷哪些是冷數(shù)據(jù)，然后歸檔到冷表或冷庫中去。

這種的優(yōu)點，一來是不用大量修改代碼，二來就是非常適合按照時間劃分冷熱數(shù)據(jù)的場景。因為它是一種延遲處理方式，你可以設置為半夜去運行。

比如我之前的那家公司，就是設置為凌晨以后執(zhí)行，因為那個時候很少有用戶在使用了，沒有什么新的訂單產生，哪怕有新的訂單，也屬于誤差范圍內，可以接受。

監(jiān)聽binlog

這種方案我是從書本上獲取到的，給我漲了點知識。

監(jiān)聽binlog的目的說白了，就是判斷訂單狀態(tài)是否變化，和代碼中處理很類似，唯一的區(qū)別在于，如果你維護的這個項目又老又復雜，代碼很難改也改不全，監(jiān)聽binlog就是很好的方案了，你可以不改代碼，監(jiān)聽數(shù)據(jù)庫變更日志然后做相應處理即可。

當然，缺點和前面一樣，當按照時間來劃分冷熱數(shù)據(jù)時，這種方案也不可取，因為你不知道如何監(jiān)聽。

人工遷移

冷熱分離操作的最終還是數(shù)據(jù)，分離實質上也就是一種數(shù)據(jù)遷移，因此，人工干預其實是很靠譜的選擇。

上面每種方案都有自己的優(yōu)勢，但也有各自的局限性。

代碼處理，你只能處理發(fā)布上線以后的新數(shù)據(jù)。

任務調度，當數(shù)據(jù)量龐大的情況下，你一次可能根本無法完成分離，對于緊急的要快速優(yōu)化的場景顯然不適合。

監(jiān)聽binlog，除了前面提到的缺點，還需要工程師對其比較熟悉，否則短時間內上手容易帶來不確定性。

此時，DBA或集成工程師(俗稱打雜工程師)的優(yōu)勢就體現(xiàn)出來了，備份后，抽某天晚上，直接把半年以外的數(shù)據(jù)遷移到冷庫即可。

這樣不僅簡單，也避免了其他技術方案可能存在的問題及風險。專業(yè)的人，做專業(yè)的事，才是最靠譜的。

4、最終方案

通過上面簡述的幾種方案，我們已經有了較為清晰的認知。

現(xiàn)在我可以告訴大家，當初的公司所采用的方案是其中兩種方案的結合：人工遷移 + 任務調度。

人工遷移用于一次遷移完成冷數(shù)據(jù)到冷庫，任務調度用于對后續(xù)新產生的數(shù)據(jù)進行解耦且延遲的冷熱分離。

思維導圖大概是這樣：

基本步驟如下：

1）、定位冷熱分離的規(guī)則，比如本篇，就是按照訂單交易完成時間，以半年內和半年外作為分離的基準；
2）、冷數(shù)據(jù)遷移，由公司的DBA或集成工程師對數(shù)據(jù)進行備份，然后在發(fā)布當晚將冷數(shù)據(jù)遷移到冷庫中去；
3）、開發(fā)人員新建一個調度任務，并實現(xiàn)任務調用的接口，專門掃描數(shù)據(jù)庫，將超過半年的訂單數(shù)據(jù)通過程序邏輯遷移到冷庫，保證熱數(shù)據(jù)一直維持在半年內，任務可以每天凌晨執(zhí)行一次，或根據(jù)自身業(yè)務決定調度頻率。

這樣一來，既解決了冷熱分離規(guī)則的問題，不管是什么規(guī)則，你最終都可以通過人工遷移數(shù)據(jù)來做到分離。

也解決了時間上的緊迫性，你只需要開發(fā)一個用于調度的接口，不再需要考慮其他任何技術層面的影響，時間成倍縮短。

這在中小企業(yè)算是比較適合的方案了，當初我們在一周內就優(yōu)化完成了，研發(fā)工程師用了1天完成調度接口的實現(xiàn)，剩下的時間都是集成工程師進行數(shù)據(jù)遷移的演練。

最終客戶還是很滿意的，核心業(yè)務的查詢速度一下就提升了近10倍。

優(yōu)缺點

好了，臨近尾聲，我們來說一下冷熱分離方案整體的優(yōu)缺點吧。

1、優(yōu)點

優(yōu)點我歸納了3點：

1）、提高性能

很明顯，冷熱分離后，將更多計算資源集中在了熱數(shù)據(jù)上，將查詢性能最大化。

2）、降低成本

對于千萬級的數(shù)據(jù)表，冷熱分離方案不需要額外的第三方中間件，極大地節(jié)約了成本。尤其是在中小公司，老板對成本還是很在意的。

3）、簡化維護

冷熱分離之后，對于數(shù)據(jù)的維護更直觀，可以把更多精力放在熱數(shù)據(jù)的處理上。

比如備份策略，冷熱數(shù)據(jù)可以分別采用不同的策略維護，更關注熱數(shù)據(jù)備份，簡化冷數(shù)據(jù)備份。

2、缺點

缺點我歸納了2點：

1）、場景限制多

冷熱分離并不是萬能的，一定要根據(jù)業(yè)務來分析，查詢的復雜度較高，很可能你冷熱分離后，熱數(shù)據(jù)的查詢依然沒有得到明顯優(yōu)化。

比如你有一張表，查詢的語句關聯(lián)很多，表數(shù)據(jù)量也挺大，那么這個時候冷熱分離一點作用都沒有，因為你分離完了，查詢語句還是關聯(lián)那么多，速度依然很慢。

這個時候，類似的場景就無法使用冷熱分離方案了，而是要考慮其他方案，比如讀寫分離，比如查詢分離，這樣才能從根源上解決查詢慢的問題。

2）、統(tǒng)計效率低

這種也是冷熱分離方案比較明顯的一個缺點，當你們的業(yè)務中，需要對數(shù)據(jù)做一些復雜的統(tǒng)計分析，甚至要求一定的實時性。

那么這個時候，因為已經冷熱分離，冷數(shù)據(jù)的統(tǒng)計分析效率會非常低，對于客戶提出的一些五花八門的統(tǒng)計分析就難以操作了。

因此，又需要引入其他方案來配合，比如ElasticSearch，這樣又增加了額外的成本，不僅要考慮ES的資源成本，還要考慮諸如部署方案、維護方案、安全性問題等等。

今年我們內部就公布了一個小道消息，某家業(yè)內還挺不錯的互聯(lián)網公司因為ElasticSearch的未授權漏洞導致千萬用戶敏感信息被泄露，直接被行業(yè)除名了。

所以，在實際工作中，中間件的引入是個需要審慎考慮的問題，而不是你想當然了就可以使用。

總結

通篇寫的還是挺長的，主要是一開始列出了大綱，但在寫的過程中又想起了新的知識點，就一起加進來了。

前面講的數(shù)據(jù)庫分區(qū)等方案，主要是為了過渡，因為這是一個線性的思維，展現(xiàn)出來讓大家知道一個方案最終落地的脈絡是怎樣的。

今后還會繼續(xù)寫一些架構相關的知識，放在單獨的專欄里面，希望大家支持和喜歡。

如果喜歡，請點贊+關注↓↓↓，持續(xù)分享工作經驗及各種干貨哦！

總結

以上是生活随笔為你收集整理的如何快速优化几千万数据量的订单表的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。