深入理解 latch: cache buffers chains
事件背景:? ?
一個客戶的數據庫發生了宕機事件,查看了數據庫的awr報告,原來是由于出現大量的latch: cache buffers chains等待事件導致系統消耗量大量的CPU,最終導致系統hang住;
說明:? ?
要理解latch: cache buffers chains并解決這個問題,就需要深入的了解Buffer Cache及其原理。
1、Buffer Cache概述:? ?
Buffer Cache是SGA的一部分,Oracle利用Buffer Cache來管理data block,Buffer Cache的最終目的就是盡可能的減少磁盤I/O。Buffer Cache中主要有3大結構用來管理Buffer Cache:Hash Bucket、Hash Chain List、LRU List;? ?
Hash Bucket & Hash Chain List?:Hash Bucket與Hash Chain List用來實現data block的快速定位。? ?
LRU List?:掛載有指向具體的free buffer, pinned buffer以及還沒有被移動到?write list的dirty buffer?等信息。所謂的free buffer就是指沒有包含任何數據的buffer,所謂的pinned buffer,就是指當前正在被訪問的buffer。? ?
Write(Dirty)List?:掛載有指向具體的?dirty block的信息。所謂的dirty block,就是指在?buffer cache中被修改過但是還沒有被寫入到磁盤的block。
2、Hash Bucket的原理:? ?
如果所有的Buffer Cache中所有的Buffer都通過同一個結構管理,當需要確定某個Block在Buffer中是否存在時,將需要遍歷整個結構,性能會相當低下;? ?
為了提高效率,Oracle引入了Bucket的數據結構,Oracle把管理所有的Buffer通過一個內部的Hash算法運算后,存放到不同Hash Bucket中,這樣通過Hash Bucket進行分割之后,眾多的Buffer被分布到一定數量的Bucket之中,當用戶需要在Buffer中定位數據是否存在是,只需要通過同樣的算法獲得Hash值,然后到相應的Bucket中查找少量的Buffer即可確定。每個Buffer存放的Bucket由Buffer的數據塊地址運算決定;(這個算法從ORACLE官方得到的信息很少,可以用索引的知識去理解)Bucket內部,通過Cache Buffer Chain將所有的Buffer通過Buffer Header信息聯系起來;?
為了保護Bucket中的數據,每次訪問的時候都需要先在內存中獲取latches后才能訪問,整個訪問的結構如圖:?
用戶內存中讀數據的順序:
a)?對該Block運用Hash算法,得到Hash值。
b)獲得獲得cache buffers chains latch
c)?到相應的Hash Bucket中搜尋相應Buffer Header
b)獲得cache buffers chains latch;
d)?如果找到相應的Buffer Header,然后判斷該Buffer的狀態,看是否需要構造CR Block,或者Buffer處于pin的狀態,最后讀取。e)?如果找不到,就從磁盤讀入到Buffer Cache中。
3、latch:cache buffers chains等待事件 ?? ?
在Oracle9i以前,如果其它用戶進程已經獲得了這個latch,那么新的進程就必須等待,直到該用戶進程搜索完畢(搜索完畢之后就會釋放該latch)。從Oracle9i開始?cache buffers chains latch可以只讀共享,也就是說用戶進程A以只讀(select)的方式訪問Block,這個時候獲得了該latch,同時用戶進程B也以只讀的方式訪問Block,那么這個時候由于是只讀的訪問,用戶進程B也可以獲得該latch。但是,如果用戶進程B要以獨占的方式訪問Block,那么用戶進程B就會等待用戶進程A釋放該latch,這個時候Oracle就會對用戶進程B標記一個latch:cache buffers chains的等待事件。
4、latch:cache buffers chains出現的原因? ?
4.1?不夠優化的SQL。? ?
大量邏輯讀的SQL語句就有可能產生非常嚴重的latch:cache buffers chains等待,因為每次要訪問一個block,就需要獲得該latch,由于有大量的邏輯讀,那么就增加了latch:cache buffers chains爭用的機率。???對于正在運行的SQL語句,產生非常嚴重的latch:cache buffers chains爭用,可以利用下面SQL查看執行計劃,并設法優化SQL語句。
select * from table(dbms_xplan.display_cursor('sql_id',sql_child_number));? ?
如果SQL已經運行完畢,我們就看AWR報表里面的SQL Statistics->SQL ordered by Gets->Gets per Exec,試圖優化這些SQL。
4.2熱點塊爭用??
?1)查找數據庫是否存在latch的爭用
select sid,event,p1text,p1raw from v$session_wait where event='latch: cache buffers chains';? ?
2)下面查詢查出Top 5?的爭用的latch address。
select * from( select CHILD#,ADDR,GETS ,MISSES,SLEEPS from v$latch_children where name = 'cache buffers chains' and misses>0 and sleeps>0 order by 5 desc, 1, 2, 3) where rownum<6;?
3)然后利用下面查詢找出Hot block。????
?select?/*+?RULE?*/? ? ?? e.owner?||'.'||?e.segment_name??segment_name,? ? ?? e.extent_id??extent#,? ? ?? x.dbablk?-?e.block_id?+?1??block#,? ? ?? x.tch, /* sometimes tch=0,we need to see tim */x.tim ,l.child#???? from? ? ?? v$latch_children??l,? ? ?? x$bh??x,? ? ?? dba_extents??e???? where? ? ?? x.hladdr??=?'&ADDR'?and? ? ?? e.file_id?=?x.file#?and? ? ?? x.hladdr?=?l.addr?and? ? ?? x.dbablk?between?e.block_id?and?e.block_id?+?e.blocks?-1? ?? order?by?x.tch?desc?;? ? ?? e.owner?||'.'||?e.segment_name??segment_name,? ? ?? e.extent_id??extent#,? ? ?? x.dbablk?-?e.block_id?+?1??block#,? ? ?? x.tch, /* sometimes tch=0,we need to see tim */x.tim ,l.child#???? from? ? ?? v$latch_children??l,? ? ?? x$bh??x,? ? ?? dba_extents??e???? where? ? ?? x.hladdr??=?'&ADDR'?and? ? ?? e.file_id?=?x.file#?and? ? ?? x.hladdr?=?l.addr?and? ? ?? x.dbablk?between?e.block_id?and?e.block_id?+?e.blocks?-1? ?? order?by?x.tch?desc?;?
4.3?Hash Bucket太少? ?需要更改_db_block_hash_buckets隱含參數。其實在Oracle9i之后,我們基本上不會遇到這個問題了,除非遇到Bug。所以這個是不推薦的,記住,在對Oracle的隱含參數做修改之前一定要咨詢Oracle Support。?
5、latch:cache buffers chains的模擬測試
5.1?創建表
SQL> create table john (no int,object_name varchar2(50));?
5.2??插入數據S
QL> declare i int;beginfor i in 1..5 loopinsert into john? select? rownum as no,object_name from dba_objects;end loop;end;/?
5.3?創建存儲過程SQL> create or replace procedure p_john isi int;icount int;beginfor i in 1..1000 loopselect count(*) into icount from john;end loop;end;/?
5.4?模擬20并發全表掃描
SQL> var job_no number;S
QL> beginfor idx in 1..20 loopdbms_job.submit(:job_no,'p_john;');commit;end loop ;end;/?
5.5查看爭用情況
SQL>?select sid,event,p1text,p1raw from v$session_wait where event='latch: cache buffers chains';
顯示存大量的latch等待;
?5.6 ?latch: cache buffers chains等待事件在awr報告中的特征??
?
總結以上的特征:
a)??占用大量的CPU資源;
b)??邏輯讀比正常情況要多很多;
c)??等待事件里面肯定有latch: cache buffers chains
d)??Latch的命中率一般在95%以下,嚴重的在90%以下;
6、latch:cache buffers chains的個人解決方法很多時候應用的問題,其實是由于SQL質量導致的,很多DBA吐槽:DBA和開發是不同的部門,所以要讓開發配合起來進行SQL調優難度較大,可行性較小。對于這種觀點本人表示不贊同:當系統出現大的問題的時候,會導致系統性能下降,甚至宕機,那么如果這個系統重要的話,那么DBA完全可以把問題的原因及解決方法發送給開發人員,并抄送公司領導,并說明原因及解決的方法,由于這個時候DBA是唯一知道問題的根源及解決方法的,所以領導也會支持你的;另外:SQL調優是最有效的調優方法,建議DBA別從系統的角度去進行處理,避免填了一個坑又冒出一個坑;
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
本文作者:JOHN?
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
?
來自 “ ITPUB博客 ” ,鏈接:http://blog.itpub.net/12679300/viewspace-1244578/,如需轉載,請注明出處,否則將追究法律責任
總結
以上是生活随笔為你收集整理的深入理解 latch: cache buffers chains的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【C语言练习4】根据公式计算π的值,π=
- 下一篇: 一起学WEB HTML5 第1讲