當(dāng)前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

找出MySQL瓶颈的基准测试和剖析

發(fā)布時間：2025/5/22 数据库 33 豆豆

生活随笔收集整理的這篇文章主要介紹了找出MySQL瓶颈的基准测试和剖析小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

????? 有些時候，我們需要優(yōu)化MySQL。那我們要對MySQL進行哪些改進呢？一條特殊的query?數(shù)據(jù)庫模式？服務(wù)器硬件？唯一的辦法是測量你的系統(tǒng)在做什么，在各種條件下測量它的性能。這就是我們下面要學(xué)習(xí)的。

????? 最好的策略就是找出最弱的環(huán)節(jié)，并加強你的應(yīng)用程序鏈的組成。這非常有用，如果你不知道什么阻止最優(yōu)性能，或者以后什么將要阻止最優(yōu)性能的發(fā)揮。

????? 基準(zhǔn)測試和剖析是兩條基本的找出瓶頸的方法。它們是有關(guān)聯(lián)的，但是它們又不完全相同。基準(zhǔn)測試你的系統(tǒng)的性能。這將有助于確定系統(tǒng)的承受能力，向你展示哪些改變有用哪些沒用，或者顯示在不同的數(shù)據(jù)下你的應(yīng)用程序的性能。

?????? 相反，剖析幫助你找出你的應(yīng)用程序在哪里花費了大量的時間，或者消耗了大量的資源。換句話說，基準(zhǔn)可以回答“這種執(zhí)行表現(xiàn)怎么樣？”，而剖析可以回答“為什么它會這個樣子執(zhí)行?”

?????? 我們準(zhǔn)備在這個章節(jié)中講述兩部分內(nèi)容，基準(zhǔn)測試和剖析。我們開始討論基準(zhǔn)測試的原因和對策，然后引入特定的基準(zhǔn)測試的標(biāo)桿（或者尺子）。我們先向你展示如何計劃和設(shè)計基準(zhǔn)測試，為精確的結(jié)果做設(shè)計，執(zhí)行基準(zhǔn)測試和分析結(jié)果。最后，來看看基準(zhǔn)測試工具和如何使用它們的例子。

?????? 剩下的章節(jié)講述如何優(yōu)化應(yīng)用程序和MySQL。我們將會詳細地展示我們已經(jīng)應(yīng)用于生產(chǎn)幫助分析應(yīng)用程序的性能，真實的優(yōu)化代碼。我們也會展示怎樣記錄MySQL的query語句，分析日志，使用MySQL的狀態(tài)計數(shù)器，以及用來查看MySQL和你的query語句怎樣做的其它工具。

為什么需要基準(zhǔn)？

????? 很多大中型的MySQL部署有專門的標(biāo)桿用在基準(zhǔn)測試?yán)铩Ｈ欢?#xff0c;每個開發(fā)者和DBA也應(yīng)該熟悉基礎(chǔ)的基準(zhǔn)測試和操作，因為它們非常有用。下面是基準(zhǔn)測試可以幫助你的一些事情：

?測量你的應(yīng)用程序當(dāng)前是怎樣執(zhí)行的。如果你不知道你的應(yīng)用程序當(dāng)前執(zhí)行多快，你不能確定哪些改變有用。你還可以用歷史基準(zhǔn)結(jié)果，來診斷比不能預(yù)期的問題。
證實你系統(tǒng)的可擴充性。你可以用基準(zhǔn)測試來模仿比你的生產(chǎn)環(huán)境能處理的多得多的負載，比如成千上百倍的增加用戶。
計劃增長。基準(zhǔn)測試能幫助你評估將來你的預(yù)計負荷需要多少硬件，網(wǎng)絡(luò)容量和其它資源。這能在升級或者大量應(yīng)用程序改變的時候，幫助減少風(fēng)險。
測試你的應(yīng)用程序在一個變化的環(huán)境里的承受能力。例如，你可以找出你的應(yīng)用程序，在并發(fā)下不定時的峰值或者不同的服務(wù)器的配置的情況下，是怎樣執(zhí)行的，或者你可以看到在不同的數(shù)據(jù)分布下它是怎樣處理的。
測試不同的硬件、軟件和操作系統(tǒng)配置。對于你的系統(tǒng)來說，是RAID5還是RAID10更好?當(dāng)你從ATA磁盤切換到SAN存儲的時候，隨機寫的性能是怎樣變化的？2.4的Linux內(nèi)核比2.6的更好嗎？MySQL的升級有助于提高性能嗎？對于你的數(shù)據(jù)，不同的存儲引擎有影響嗎？你可以用不同的基準(zhǔn)來回答這些問題。

????? 對于其他目的，你也可以用基準(zhǔn)測試，例如，為你的應(yīng)用程序創(chuàng)建一個單元測試套件，但是在這里我們僅僅關(guān)注性能相關(guān)方面。

??? 2.基準(zhǔn)策略

???? 有兩條基本的基準(zhǔn)測試策略：你可以對應(yīng)用程序作為一個整體，或者隔離MySQL，用基準(zhǔn)問題測試。這兩種策略分別以全棧和單組件基準(zhǔn)測試聞名。有以下幾點測試整個應(yīng)用程序而不僅僅是MySQL：

你測試整個應(yīng)用程序，包括web服務(wù)，應(yīng)用程序代碼和數(shù)據(jù)庫。這非常有用，因為你不僅僅關(guān)注MySQL的性能，更關(guān)心整個應(yīng)用程序。
MySQL并不總是應(yīng)用的瓶頸，全站基準(zhǔn)測試可以證明這一點。
只有測試整個應(yīng)用，你才能知道每個部分的緩存行為。
基準(zhǔn)測試在某種程度上是好的，因為它反映了你的應(yīng)用的真正行為，當(dāng)你單獨測試某個模塊的時候，很難發(fā)現(xiàn)的行為。

?? 另一方面，應(yīng)用程序基準(zhǔn)測試很難創(chuàng)建，甚至很難正確地安裝。如果你的基準(zhǔn)測試設(shè)計的很糟糕，你就會得出錯誤的結(jié)論，因為結(jié)果不能反映真實情況。

?? 然而，有時你不想了解整個應(yīng)用。在最初階段，可能你只想了解MySQL基準(zhǔn)測試。下面的基準(zhǔn)測試是有用的：

你想比較不同的模式或者query語句
你想測試應(yīng)用中一個特殊的問題
相比長篇大論的基準(zhǔn)測試來說，你更傾向短的基準(zhǔn)測試，能向你展示標(biāo)記和測量改變的快的“循環(huán)時間”。

??? 當(dāng)你在真實數(shù)據(jù)集的環(huán)境中，一次又一次的重復(fù)你的應(yīng)用query語句時，基準(zhǔn)測試MySQL是非常有用的。數(shù)據(jù)集本身和數(shù)據(jù)集的大小都必須是真實的。如果可能的話，做一個生產(chǎn)環(huán)境中的數(shù)據(jù)快照。

??? 不幸的是，建立一個真實的基準(zhǔn)，是非常復(fù)雜和耗時的；如果你能得到生產(chǎn)環(huán)境中的數(shù)據(jù)集的復(fù)制品，算你走運。當(dāng)然，這有可能是不可行的。比如,你可能開發(fā)了一個新的應(yīng)用程序，只有少數(shù)的用戶和數(shù)據(jù)。如果你想知道，如果它變得龐大時，將會有什么問題發(fā)生，除了模擬更大應(yīng)用數(shù)據(jù)和負載，你沒得選擇。

??? 測試什么？

??? 在你開始基準(zhǔn)測試之前，甚至是在你設(shè)計測試之前，你需要確定你的目標(biāo)。你的目標(biāo)將會決定你的工具和技術(shù)，以便得到精確地有意義的結(jié)果。用問題來設(shè)計你的目標(biāo)，比如“CPU是多的好嗎？”或者“新的索引是不是比現(xiàn)在的索引執(zhí)行的更快？”

??? 它不可能是顯而易見的，這就需要你用不同的方法來測試不同的事情，例如：延遲和吞吐量需要不同的基準(zhǔn)測試。

??? 考慮以下幾個量度和它們?nèi)绾瓮晟颇愕男阅苣繕?biāo)：

?? 單位時間的交易量

????這是一個經(jīng)典的歷史為基準(zhǔn)的數(shù)據(jù)庫應(yīng)用程序。標(biāo)準(zhǔn)化測試，如TPC-C標(biāo)準(zhǔn)(見http://www.tpc.org)被廣泛引用，很多數(shù)據(jù)庫提供商，工作非常努力以使它們工作的好。這些基準(zhǔn)測試在線處理（OLTP）性能，這些基準(zhǔn)最適合多用戶交易應(yīng)用程序。通常的測量單位是每秒交易量。

??? 吞吐量這個詞通常的意思是等同于單位時間內(nèi)的交易量（或者工作的其它單元）。

??? 響應(yīng)時間或延遲?

??? 這測量了一個任務(wù)需要的總時間。依賴你的應(yīng)用，你可能需要測量毫秒，秒或者分鐘。從這里你可以得出平均響應(yīng)時間，最小響應(yīng)時間和最大響應(yīng)時間。

??? 最大響應(yīng)時間是很少有用的度量，因為基準(zhǔn)測試運行時間越長，可能最大響應(yīng)時間越大。它并不總是能重復(fù)的，這就可能會在運行的過程中拉大差距。正是因為這個原因，很多人使用百分比的響應(yīng)時間。例如，如果95%的響應(yīng)時間是5毫秒，你就可以知道任務(wù)可以在總時間的95%內(nèi)少于5毫秒完成。

??? 畫出基準(zhǔn)測試的結(jié)果，為圖形或者線性圖（例如，平均值和95%百分比）或者是散列圖，將是非常有幫助的，因為這樣你就可以看到結(jié)果的分布情況。通過這些圖形，可以看出在長時間運行過程中，基準(zhǔn)測試是怎樣執(zhí)行的。

?? 假設(shè)你的系統(tǒng)每小時做一分鐘檢測。在檢測期間，系統(tǒng)“拋錨”，沒有交易完成。95%的響應(yīng)時間不會顯示峰值，所以結(jié)果會掩蓋這個問題。然而，一個圖形會顯示響應(yīng)時間內(nèi)的周期性峰值。圖2-1會闡述這點。

?? 圖2-1顯示了每分鐘的交易量。線條顯示了象征性的超過平均值的峰值。第一個峰值是因為服務(wù)器的緩存被冷凍了，另一個峰值顯示了服務(wù)器刷新臟頁穩(wěn)定性到磁盤花費的時間。如果沒有圖形我們很難看到這些差異。

???穩(wěn)定性

?? 對于系統(tǒng)來說，穩(wěn)定性測試非常重要，因為系統(tǒng)需要在變化的工作負載下保持性能。

?? “在一個變化的工作負載下保持性能”是一個很抽象的概念。性能是可以被度量的，例如，吞吐量和響應(yīng)時間；工作負載隨著數(shù)據(jù)庫大小，當(dāng)前連接數(shù)，或者硬件不同，可能會存在差異。

????穩(wěn)定性測試，對于評估系統(tǒng)承載能力來說是好的，因為它能展示出你的應(yīng)用中的薄弱環(huán)節(jié)，而在其它基準(zhǔn)測試中不會展示。

圖2-1 30分鐘運行的結(jié)果

???? 例如，在單鏈接（不好的測試策略）的情況下做響應(yīng)時間測試，你設(shè)計的系統(tǒng)性能良好；但是在任何等級的并發(fā)下，你應(yīng)用可能會表現(xiàn)糟糕。一個測試關(guān)注的是在不斷增加的連接下的持續(xù)響應(yīng)時間，這樣才可以看到設(shè)計的瑕疵。

???? 有一些活動，例如搜集顆粒數(shù)據(jù)創(chuàng)建總結(jié)性數(shù)據(jù)表的周期性批量作業(yè)，僅僅需要快速響應(yīng)時間。單純地測試響應(yīng)時間是好的，但是也要關(guān)心他們和其它活動是怎么交互（相互影響）的。批量作業(yè)可能會導(dǎo)致交互的query語句表現(xiàn)較差，反之亦然。

????? 并發(fā)

????? 并發(fā)是很重要的，但是很多時候都被濫用和被錯誤地衡量。例如，有一種很流行的說法，有多少用戶在同時瀏覽網(wǎng)站。然而，HTTP是無狀態(tài)的，大多數(shù)用戶只是簡單地閱讀瀏覽器展示的內(nèi)容，所以這并不能轉(zhuǎn)化為web服務(wù)器的并發(fā)。同樣地，在web服務(wù)器上的并發(fā)并不一定轉(zhuǎn)化到數(shù)據(jù)庫服務(wù)器上。有直接關(guān)聯(lián)的就是你的會話存儲機制能處理多少數(shù)據(jù)。一個更精確的測試web服務(wù)器的并發(fā)的方法是在峰值的時候，用戶每秒請求的次數(shù)。

?????? 你也可以在應(yīng)用程序的不同地方測試并發(fā)。在web服務(wù)器上的并發(fā)越高，可能引起更高的數(shù)據(jù)庫并發(fā)等級。但是語言和工具套件可能影響它。例如，Java的連接池可能會比持續(xù)連接的PHP，會降低MySQL服務(wù)器的并發(fā)連接。

????? 更重要的是在一個給定時間內(nèi)運行query語句的并發(fā)數(shù)量。一個很好的設(shè)計應(yīng)用程序可能會打開MySQL服務(wù)器的數(shù)以百計的并發(fā)，但是其中的一少部分應(yīng)該會同時執(zhí)行query語句。這樣，一個“50,000用戶同時在線”的web站點，可能在MySQL服務(wù)器上只需要10~15個同時執(zhí)行query語句。

????? 換句話說，你要真正關(guān)心的基準(zhǔn)測試就是工作并發(fā)，或者線程數(shù)量，或者同時工作連接。測試當(dāng)并發(fā)增加的時候，性能掉下來多少。如果是這樣的話，你的應(yīng)用程序可能就無法處理高負載下的峰值。

????? 你也需要確保性能不會很快地降下來，或者設(shè)計應(yīng)用程序，這樣就不會在應(yīng)用程序的各個部分產(chǎn)生不能處理的高并發(fā)了。在通常情況下，你要設(shè)計限制MySQL服務(wù)器的并發(fā)，如應(yīng)用隊列。

????? 并發(fā)不能完全等同于響應(yīng)時間和穩(wěn)定性：它并不是一個結(jié)果，而是你怎樣建立基準(zhǔn)測試的一個屬性。你應(yīng)該在不同的并發(fā)水平下測試應(yīng)用程序的性能，而不是測試你的應(yīng)用程序的能達到的并發(fā)。

????? 總之，你應(yīng)該測試對用戶來說重要的東西。測試衡量性能，但是“性能”對不同的人意味著不同的東西。收集一些關(guān)于系統(tǒng)應(yīng)當(dāng)怎樣測量的需求（正式或非正式的），能接受的響應(yīng)時間，期望的并發(fā)類型，等等。然后，嘗試設(shè)計你的測試來解釋所有的需求，而不是“井底之蛙”排除其他東西關(guān)注某項東西。

????? 3.測試標(biāo)桿

??????在有個大致了解的情況下，讓我們轉(zhuǎn)向怎樣設(shè)計和執(zhí)行基準(zhǔn)測試上來。在我們討論如何把基準(zhǔn)測試做好之前，先讓我們看下一些常見的錯誤，這些錯誤能導(dǎo)致不能用或者不精確地結(jié)果：

使用真實數(shù)據(jù)大小的子集，例如，當(dāng)應(yīng)用程序不得不處理好幾百G的數(shù)據(jù)時，我們只使用其中的1G數(shù)據(jù)；或者當(dāng)你準(zhǔn)備擴大你的應(yīng)用程序時，使用現(xiàn)在的數(shù)據(jù)集
使用錯誤的數(shù)據(jù)分布，例如當(dāng)真實系統(tǒng)數(shù)據(jù)中的“熱點”規(guī)則的數(shù)據(jù)分布（隨機生成的數(shù)據(jù)通常是不切實際的分布）。
使用不切實際的分布參數(shù)，例如，假設(shè)所有用戶的配置文件同樣地被瀏覽。
在多用戶應(yīng)用中，使用單用戶場景。
在單臺服務(wù)器上測試分布式應(yīng)用。
和真實用戶的行為錯誤地比較，例如web頁面上的“思考時間”。真實用戶請求并閱讀它；他們不會一個接一個沒有停頓地點擊鏈接。
在一個循環(huán)里執(zhí)行相同的query語句。真實的query語句是不同的，所以它們會引起緩存未命中的情況。相同的query語句將會在某種級別全部或者部分被緩存。
未能檢查錯誤。如果一個基準(zhǔn)測試的結(jié)果沒有意義-例如，如果一個慢操作突然非常快地完成，那么就該檢查錯誤。你就能測試出在一個SQL查詢時，MySQL能多快地探測到語法錯誤！原則性來說，每次測試完后都應(yīng)該檢查錯誤日志。
當(dāng)系統(tǒng)還沒有變熱的時候，忽略系統(tǒng)是怎樣執(zhí)行的，例如，系統(tǒng)剛剛重啟后。有時你需要知道你的服務(wù)器重啟后，需要多長時間達到承載能力，所以你需要在熱啟動期間注意觀察。相反地，如果你想研究它的正常性能，你需要關(guān)心，如果你的測試正好在重啟后，許多緩存將被冷凍，那么測試結(jié)果將不會反映，在緩存在變熱后，在負載下得到的結(jié)果。
使用默認(rèn)的服務(wù)設(shè)置。

???? 僅在避免這些錯誤上就會花費你很長時間來改進你的結(jié)果質(zhì)量。

???? 對于別的所有事情都是同樣的，你應(yīng)該在盡可能真實的環(huán)境中做測試。盡管有時，使用一個稍微不真實的測試也是明智的。例如，假如說你的應(yīng)用程序在不同的主機上。使用相同的配置執(zhí)行測試，將會更接近真實情況，但是這樣做就會增加更多變量，例如，網(wǎng)絡(luò)負載多少，多快。在單節(jié)點上測試往往很簡單，然而在某些情況下，將會更精確。什么時候使用最合適，完全取決于你的判斷。

?????? 設(shè)計和規(guī)劃測試

?? 規(guī)劃測試的第一步就是確定問題和目標(biāo)。然后，決定是否使用標(biāo)準(zhǔn)的測試還是你自己設(shè)計。

??????如果你使用標(biāo)準(zhǔn)測試，要保證你選用的測試符合你的需求。例如，不要使用TCP測試你的電子商務(wù)系統(tǒng)。用TCP自己的話說，TCP“”。所以對于OLTP系統(tǒng)來說，不是一個合適的測試。

??????設(shè)計你自己的測試是一個復(fù)雜的反復(fù)的進程。開始，使用你生產(chǎn)環(huán)境中的數(shù)據(jù)集的快照。確保你能為后來的運行恢復(fù)這些數(shù)據(jù)集。

??????然后，你需要在數(shù)據(jù)里運行query語句。你可以在基本測試?yán)锾砑訂卧獪y試套件，多次執(zhí)行，但是這和你怎樣真實地使用數(shù)據(jù)庫，不大可能匹配。一個比較好的方法是在一個典型的時間框架內(nèi)，記錄你生產(chǎn)環(huán)境中的所有的query語句，例如，在峰值負載內(nèi)的一個小時，或者一整天。如果你在很短的時間框架內(nèi)，記錄了query語句，你可能需要選擇幾個時間框架。這將會使你覆蓋所有系統(tǒng)活動，例如，每周報告query語句，或者在低峰值的時期，執(zhí)行計劃任務(wù)。

??????你可以在不同等級下記錄query語句。例如，如果你需要全棧測試的話，你就可以記錄WEB服務(wù)器上的HTTP請求。你也可以啟用MySQL的查詢?nèi)罩?#xff0c;但是如果你重放查詢?nèi)罩?#xff0c;要確保重新創(chuàng)建單獨的線程，代替線性地重放每條query語句。在日志里為每個連接創(chuàng)建一個單獨的線程也是非常重要的，避免線程間的query阻塞。查詢?nèi)罩撅@示了哪個連接執(zhí)行了哪條query語句。

?????? 即使你還沒有構(gòu)建自己的測試，你可以寫下你的測試計劃。你可以使測試跑很多遍，你需要重新精確地構(gòu)建你的測試。也為將來打算。你可能不是下次執(zhí)行這個測試的人，即使你是，你可能也不太記得你第一次是怎么執(zhí)行它的。你的計劃應(yīng)該包括測試數(shù)據(jù)，安裝系統(tǒng)的步驟和熱啟動計劃。

???? 設(shè)計一些規(guī)范參數(shù)和結(jié)果的方法，并詳細地記錄每次執(zhí)行。你的文檔方法可能如電子表格或者筆記那么簡單，也可能如定做的數(shù)據(jù)庫那么復(fù)雜（但是要記住，你要寫一些腳本來幫助分析測試結(jié)果，所以沒有比打開電子表格和文本文件更容易的方法了）。

???? 你可能會發(fā)現(xiàn)創(chuàng)建一個測試目錄，包含每次執(zhí)行的結(jié)果的子目錄，會很有用。在相應(yīng)地的子目錄，你可以放結(jié)果，配置文件，和每次執(zhí)行的筆記。如果你的測試比你預(yù)想的多，而且你也很感興趣，無論如何記錄額外的數(shù)據(jù)。錯過記錄重要的數(shù)據(jù)總比不需要的數(shù)據(jù)要好，可能以后你會發(fā)現(xiàn)額外數(shù)據(jù)非常有用。在測試期間盡可能多地記錄附加信息，如CPU的使用情況，磁盤I/O,和網(wǎng)絡(luò)流量統(tǒng)計;SHOW GLOBAL STATUS的計數(shù)器，等等。

?????獲得精確結(jié)果

???? 獲得精確結(jié)果的最好方法是，設(shè)計你的測試來回答你想要的問題。你有選擇正確的測試嗎？你捕捉到你需要的答案的數(shù)據(jù)了嗎？你的測試有錯誤的標(biāo)準(zhǔn)嗎？例如，你有運行一個計算密集型的測試來預(yù)測I/O密集型的應(yīng)用程序的性能嗎？

???? 接著，確保你的測試結(jié)果可以重復(fù)的。盡量確保你的系統(tǒng)在每次開始執(zhí)行的時候，是處在相同狀態(tài)的。如果測試很重要，你應(yīng)當(dāng)在每次執(zhí)行后重啟系統(tǒng)。如果你需要一個預(yù)熱過的服務(wù)器，正常來講，你也應(yīng)當(dāng)確保你的系統(tǒng)已經(jīng)有足夠長的預(yù)熱。例如，如果預(yù)熱過程包含了隨機query查詢，那么你的測試結(jié)果將會不可重復(fù)。

???? 如果測試改變了測試數(shù)據(jù)或數(shù)據(jù)庫模式，在每次執(zhí)行的時候，用快照重新設(shè)置它。向一個表中插入一千行記錄和向一個表中插入一百萬行記錄，不會給出相同的的結(jié)果。在磁盤上的數(shù)據(jù)存儲和分布也會使結(jié)果不可重復(fù)。一個方法是確保物理布局相近，做一個快速的格式和文件拷貝分區(qū)。

???? 當(dāng)心額外負載，優(yōu)化和監(jiān)控系統(tǒng)，詳細記錄日志，計劃任務(wù)，以及其它因素能使你的結(jié)果發(fā)生偏移。

?????

轉(zhuǎn)載于:https://www.cnblogs.com/sunss/archive/2010/09/27/1836543.html

總結(jié)

以上是生活随笔為你收集整理的找出MySQL瓶颈的基准测试和剖析的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：马上消费金融会上征信吗谨慎应对征信系统
下一篇：远程管理MAC OS