CPU消耗,跟踪定位理论与实践
CPU消耗,跟蹤定位理論與實(shí)踐
一.性能指標(biāo)之資源指標(biāo)定位方案
1、打tprof報(bào)告方法
抓取perfpmr文件 60秒。
perfpmr.sh 60
從結(jié)果文件中取出tprof.sum
或直接抓取tprof
tprof –uskejzlt –x sleep 60
2、分析思路
首先看是Kernel、User、Shared
Library中的那個(gè)方面占比消耗高。例如,如果是share
lib占比比較高,則找到對(duì)應(yīng)的share
lib分頁,查看具體哪個(gè)lib占用CPU高,再查看這個(gè)特定的lib中哪個(gè)函數(shù)占用CPU高。
如果通過以上方法不能定位到一個(gè)應(yīng)用層的函數(shù),而是定位到消耗CPU最高的是個(gè)系統(tǒng)函數(shù)。不但不認(rèn)識(shí)這個(gè)系統(tǒng)函數(shù),也看不出誰調(diào)用了這個(gè)系統(tǒng)函數(shù),因?yàn)橐恍┫到y(tǒng)層的函數(shù)是通用函數(shù)(比如h_cede_end_point),從這類函數(shù)并不能看出是誰在調(diào)用。這種情況,可以通過這個(gè)系統(tǒng)函數(shù)相鄰的那些能看懂的函數(shù)來猜測,因?yàn)檎加肅PU高的函數(shù)往往是同一個(gè)應(yīng)用、同一個(gè)模塊、同一類系統(tǒng)調(diào)用導(dǎo)致,他們具有扎堆出現(xiàn)的特點(diǎn)。
如果是kernal->lock占 2~3%
cpu就是很多了。
如果定位到一個(gè)進(jìn)程有問題,可以用Truss
–c –p pid查看一個(gè)進(jìn)程在干什么,比如,是在做fork,還是文件讀寫。
- 示例
二.理論分析,到底誰在消耗cpu?
用戶+系統(tǒng)+IO等待+軟硬中斷+空閑
禍?zhǔn)资钦l?
用戶
用戶空間CPU消耗,各種邏輯運(yùn)算
正在進(jìn)行大量tps
函數(shù)/排序/類型轉(zhuǎn)化/邏輯IO訪問…
用戶空間消耗大量cpu,產(chǎn)生的系統(tǒng)調(diào)用是什么?那些函數(shù)使用了cpu周期?
IO等待
等待IO請(qǐng)求的完成
此時(shí)CPU實(shí)際上空閑
如vmstat中的wa 很高。但I(xiàn)O等待增加,wa也不一定會(huì)上升(請(qǐng)求I/O后等待響應(yīng),但進(jìn)程從核上移開了)
產(chǎn)生影響
用戶和IO等待消耗了大部分cpu
吞吐量下降(tps)
查詢響應(yīng)時(shí)間增加
慢查詢數(shù)增加
對(duì)mysql的并發(fā)陡增,也會(huì)產(chǎn)生上訴影響
三.如何減少CPU消耗?
減少等待
減少IO量
SQL/index,使用合適的索引減少掃描的行數(shù)(需平衡索引的正收益和維護(hù)開銷,空間換時(shí)間)
提升IO處理能力
加cache/加磁盤/SSD
減少計(jì)算
減少邏輯運(yùn)算量
避免使用函數(shù),將運(yùn)算轉(zhuǎn)移至易擴(kuò)展的應(yīng)用服務(wù)器中 如substr等字符運(yùn)算,dateadd/datesub等日期運(yùn)算,abs等數(shù)學(xué)函數(shù)
減少排序,利用索引取得有序數(shù)據(jù)或避免不必要排序 如union
all代替 union,order by 索引字段等
禁止類型轉(zhuǎn)換,使用合適類型并保證傳入?yún)?shù)類型與數(shù)據(jù)庫字段類型絕對(duì)一致 如數(shù)字用tiny/int/bigint等,必需轉(zhuǎn)換的在傳入數(shù)據(jù)庫之前在應(yīng)用中轉(zhuǎn)好
簡單類型,盡量避免復(fù)雜類型,降低由于復(fù)雜類型帶來的附加運(yùn)算。更小的數(shù)據(jù)類型占用更少的磁盤、內(nèi)存、cpu緩存和cpu周期
減少邏輯IO量
index,優(yōu)化索引,減少不必要的表掃描 如增加索引,調(diào)整組合索引字段順序,去除選擇性很差的索引字段等等
table,合理拆分,適度冗余
如將很少使用的大字段拆分到獨(dú)立表,非常頻繁的小字段冗余到“引用表”
SQL,調(diào)整SQL寫法,充分利用現(xiàn)有索引,避免不必要的掃描,排序及其他操作 如減少復(fù)雜join,減少order by,盡量union all,避免子查詢等
數(shù)據(jù)類型,夠用就好,減少不必要使用大字段 如tinyint夠用就別總是int,int夠用也別老bigint,date夠用也別總是timestamp
減少query請(qǐng)求量(非數(shù)據(jù)庫本身)
適當(dāng)緩存,降低緩存數(shù)據(jù)粒度,對(duì)靜態(tài)并被頻繁請(qǐng)求的數(shù)據(jù)進(jìn)行適當(dāng)?shù)木彺?如用戶信息,商品信息等
·
優(yōu)化實(shí)現(xiàn),盡量去除不必要的重復(fù)請(qǐng)求 如禁止同一頁面多次重復(fù)請(qǐng)求相同數(shù)據(jù)的問題,通過跨頁面參數(shù)傳遞減少訪問等
·
合理需求,評(píng)估需求產(chǎn)出比,對(duì)產(chǎn)出比極端底下的需求合理去除
升級(jí)cpu若經(jīng)過減少計(jì)算和減少等待后還不能滿足需求,cpu利用率還高T_T 是時(shí)候拿出最后的殺手锏了,升級(jí)cpu,是選擇更快的cpu還是更多的cpu了?
低延遲(快速響應(yīng)),需要更快的cpu(每個(gè)查詢只能使用一個(gè)cpu)
·
高吞吐,同時(shí)運(yùn)行很多查詢語句,能從多個(gè)cpu處理查詢中收益
總結(jié)
以上是生活随笔為你收集整理的CPU消耗,跟踪定位理论与实践的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CMOS图像传感器理解
- 下一篇: 机器视觉光源