當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Sql优化文档

發(fā)布時間：2023/12/18 编程问答 38 豆豆

生活随笔收集整理的這篇文章主要介紹了 Sql优化文档小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

sql 優(yōu)化

目的

數(shù)據(jù)庫參數(shù)進行優(yōu)化所獲得的性能提升全部加起來只占數(shù)據(jù)庫應(yīng)用系統(tǒng)性能提升的40%左右，其余60%的系統(tǒng)性能提升全部來自對應(yīng)用程序的優(yōu)化。許多優(yōu)化專家甚至認為對應(yīng)用程序的優(yōu)化可以得到80%的系統(tǒng)性能提升。因此可以肯定，通過優(yōu)化應(yīng)用程序來對數(shù)據(jù)庫系統(tǒng)進行優(yōu)化能獲得更大的收益。

對應(yīng)用程序的優(yōu)化通常可分為兩個方面: 源代碼的優(yōu)化和SQL語句的優(yōu)化。由于涉及到對程序邏輯的改變，源代碼的優(yōu)化在時間成本和風(fēng)險上代價很高(尤其是對正在使用中的系統(tǒng)進行優(yōu)化) 。另一方面，源代碼的優(yōu)化對數(shù)據(jù)庫系統(tǒng)性能的提升收效有限，因為應(yīng)用程序?qū)?shù)據(jù)庫的操作最終要表現(xiàn)為SQL語句對數(shù)據(jù)庫的操作。

????????對SQL語句進行優(yōu)化有以下一些直接原因：

1. SQL語句是對數(shù)據(jù)庫(數(shù)據(jù)) 進行操作的惟一途徑，應(yīng)用程序的執(zhí)行最終要歸結(jié)為SQL語句的執(zhí)行，SQL語句的效率對數(shù)據(jù)庫系統(tǒng)的性能起到了決定性的作用。

2. SQL語句消耗了70%～90%的數(shù)據(jù)庫資源。

3. SQL語句獨立于程序設(shè)計邏輯，對SQL語句進行優(yōu)化不會影響程序邏輯，相對于對程序源代碼的優(yōu)化，對SQL語句的優(yōu)化在時間成本和風(fēng)險上的代價都很低。

4. SQL語句可以有不同的寫法，不同的寫法在性能上的差異可能很大。

5. SQL語句易學(xué)，難精通。SQL語句的性能往往同實際運行系統(tǒng)的數(shù)據(jù)庫結(jié)構(gòu)、記錄數(shù)量等有關(guān)，不存在普遍適用的規(guī)律來提升性能。

二. 優(yōu)化數(shù)據(jù)庫的思想：

1、關(guān)鍵字段建立索引。

2、使用存儲過程，它使SQL變得更加靈活和高效。

3、備份數(shù)據(jù)庫和清除垃圾數(shù)據(jù)。

4、SQL語句語法的優(yōu)化。

5、清理刪除日志。

三．SQL語句優(yōu)化的原則：

????不要以為只有SELECT語句是查詢。實際上，帶有任何WHERE條件的 DML(INSERT、UPDATE、DELETE)語句中都包含查詢要求，在后面的文章中，當說到查詢時，不一定只是指SELECT語句，也有可能指 DML語句中的查詢部分。

????我們知道，SQL語句同其它語言(如C語言)的語句不一樣，它是非過程化(non-procedural)的語句，即當你要取數(shù)據(jù)時，不需要告訴數(shù)據(jù)庫通過何種途徑去取數(shù)據(jù)，如到底是通過索引取數(shù)據(jù)，還是應(yīng)該將表中的每行數(shù)據(jù)都取出來，然后再通過一一比較的方式取數(shù)據(jù)(即全表掃描)。

????為了實現(xiàn)一個查詢，內(nèi)核必須為每個查詢定制一個查詢策略，或為取出符合條件的數(shù)據(jù)生成一個執(zhí)行計劃(execution plan)。典型的，對于同一個查詢，可能有幾個執(zhí)行計劃都符合要求，都能得到符合條件的數(shù)據(jù)。例如，參與連接的表可以有多種不同的連接方法，這取決于連接條件和優(yōu)化器采用的連接方法。為了在多個執(zhí)行計劃中選擇最優(yōu)的執(zhí)行計劃，優(yōu)化器必須使用一些實際的指標來衡量每個執(zhí)行計劃使用的資源(I/0次數(shù)、 CPU等)，這些資源也就是我們所說的代價(cost)。如果一個執(zhí)行計劃使用的資源多，我們就說使用執(zhí)行計劃的代價大。以執(zhí)行計劃的代價大小作為衡量標準，優(yōu)化器選擇代價最小的執(zhí)行計劃作為真正執(zhí)行該查詢的執(zhí)行計劃，并拋棄其它的執(zhí)行計劃。

????3.1 選擇最有效率的表名順序

????在FROM子句中包含多個表的情況下,你必須選擇記錄條數(shù)最少的表作為基礎(chǔ)表.首先,掃描第一個表(FROM子句中最后的那個表)并對記錄進行派序,然后掃描第二個表(FROM子句中最后第二個表),最后將所有從第二個表中檢索出的記錄與第一個表中合適記錄進行合并.

基礎(chǔ)表(Driving Table)是指被最先訪問的表(通常以全表掃描的方式被訪問).
例如:
表 TAB1 16,384 條記錄
表 TAB2 1 條記錄
選擇TAB2作為基礎(chǔ)表 (最好的方法)
select count(*) from tab1,tab2 執(zhí)行時間0.96秒 oracle測試標準
選擇TAB2作為基礎(chǔ)表 (不佳的方法)
select count(*) from tab2,tab1 執(zhí)行時間26.09秒
如果有3個以上的表連接查詢, 那就需要選擇交叉表(intersection table)作為基礎(chǔ)表, 交叉表是指那個被其他表所引用的表.
例如:
EMP表描述了LOCATION表和CATEGORY表的交集.
SELECT *
FROM LOCATION L ,
CATEGORY C,
EMP E
WHERE E.EMP_NO BETWEEN 1000 AND 2000
AND E.CAT_NO = C.CAT_NO
AND E.LOCN = L.LOCN

將比下列SQL更有效率
SELECT *
FROM EMP E ,
LOCATION L ,
CATEGORY C
WHERE E.CAT_NO = C.CAT_NO
AND E.LOCN = L.LOCN
AND E.EMP_NO BETWEEN 1000 AND 2000
3.3 WHERE子句中的連接順序

采用自下而上的順序解析WHERE子句,根據(jù)這個原理,表之間的連接必須寫在其他WHERE條件之前, 那些可以過濾掉最大數(shù)量記錄的條件必須寫在WHERE子句的末尾。同時在鏈接的表中能過濾的就應(yīng)該先進行過濾。

例如:
(低效,執(zhí)行時間156.3秒)
SELECT …
FROM EMP E
WHERE SAL > 50000
AND JOB = 'MANAGER'
AND 25 < (SELECT COUNT(*) FROM EMP
WHERE MGR=E.EMPNO);
(高效,執(zhí)行時間10.6秒)
SELECT …
FROM EMP E
WHERE 25 < (SELECT COUNT(*) FROM EMP
WHERE MGR=E.EMPNO)
AND SAL > 50000
AND JOB = 'MANAGER';

3.2 SELECT子句中避免使用 ' * '

當你想在SELECT子句中列出所有的COLUMN時,使用動態(tài)SQL列引用 '*' 是一個方便的方法.但這是一個非常低效的方法. 實際上,在解析的過程中, 會將'*' 依次轉(zhuǎn)換成所有的列名, 這個工作是通過查詢數(shù)據(jù)字典完成的, 這意味著將耗費更多的時間.

3.3 盡量多使用COMMIT

????只要有可能,在程序中盡量多使用COMMIT, 這樣程序的性能得到提高,需求也會因為COMMIT所釋放的資源而減少:
COMMIT所釋放的資源:
a. 回滾段上用于恢復(fù)數(shù)據(jù)的信息.
b. 被程序語句獲得的鎖
c. redo log buffer 中的空間
3.4 計算記錄條數(shù)

和一般的觀點相反, count(*) 比count(1)稍快 , 當然如果可以通過索引檢索,對索引列的計數(shù)仍舊是最快的. 例如 COUNT(EMPNO)

3.5 用Where子句替換HAVING子句

避免使用HAVING子句, HAVING 只會在檢索出所有記錄之后才對結(jié)果集進行過濾. 這個處理需要排序,總計等操作. 如果能通過WHERE子句限制記錄的數(shù)目,那就能減少這方面的開銷.

例如:
低效:
SELECT REGION，AVG(LOG_SIZE)
FROM LOCATION
GROUP BY REGION
HAVING REGION REGION != 'SYDNEY'
AND REGION != 'PERTH'
高效
SELECT REGION，AVG(LOG_SIZE)
FROM LOCATION
WHERE REGION REGION != 'SYDNEY'
AND REGION != 'PERTH'
GROUP BY REGION；

HAVING 中的條件一般用于對一些集合函數(shù)的比較,如COUNT() 等等. 除此而外,一般的條件應(yīng)該寫在WHERE子句中

3.6通過內(nèi)部函數(shù)提高SQL效率

3.7 使用表的別名(Alias)
當在SQL語句中連接多個表時, 請使用表的別名并把別名前綴于每個Column上.這樣一來,就可以減少解析的時間并減少那些由Column歧義引起的語法錯誤.

3.8用EXISTS替代IN

3.9用NOT EXISTS替代NOT IN

3.10 用表連接替換EXISTS

通常來說 , 采用表連接的方式比EXISTS更有效率
SELECT ENAME
FROM EMP E
WHERE EXISTS (SELECT 'X'
FROM DEPT
WHERE DEPT_NO = E.DEPT_NO
AND DEPT_CAT = 'A');
(更高效)
SELECT ENAME
FROM DEPT D,EMP E
WHERE E.DEPT_NO = D.DEPT_NO
AND DEPT_CAT = 'A' ;

3.11用索引提高效率

索引是表的一個概念部分,用來提高檢索數(shù)據(jù)的效率.

雖然使用索引能得到查詢效率的提高,但是我們也必須注意到它的代價. 索引需要空間來存儲,也需要定期維護, 每當有記錄在表中增減或索引列被修改時, 索引本身也會被修改. 這意味著每條記錄的INSERT , DELETE , UPDATE將為此多付出4 , 5 次的磁盤I/O . 因為索引需要額外的存儲空間和處理,那些不必要的索引反而會使查詢反應(yīng)時間變慢.

3.12避免在索引列上使用計算

WHERE子句中，如果索引列是函數(shù)的一部分．優(yōu)化器將不使用索引而使用全表掃描

舉例:
低效：
SELECT …
FROM DEPT
WHERE SAL * 12 > 25000;
高效:
SELECT …
FROM DEPT
WHERE SAL > 25000/12;
非常實用的規(guī)則，請務(wù)必牢記

3.13 自動選擇索引
如果表中有兩個以上（包括兩個）索引，其中有一個唯一性索引，而其他是非唯一性．
在這種情況下，ORACLE將使用唯一性索引而完全忽略非唯一性索引．
舉例:
SELECT ENAME
FROM EMP
WHERE EMPNO = 2326
AND DEPTNO = 20 ;
這里，只有EMPNO上的索引是唯一性的，所以EMPNO索引將用來檢索記錄．
TABLE ACCESS BY ROWID ON EMP
INDEX UNIQUE SCAN ON EMP_NO_IDX

3.14 避免在索引列上使用NOT
通常，　我們要避免在索引列上使用NOT, NOT會產(chǎn)生在和在索引列上使用函數(shù)相同的
影響.

3.15 用>=替代>
如果DEPTNO上有一個索引,
高效:
SELECT *
FROM EMP
WHERE DEPTNO >=4
低效:
SELECT *
FROM EMP
WHERE DEPTNO >3
兩者的區(qū)別在于, 前者DBMS將直接跳到第一個DEPT等于4的記錄而后者將首先定位到DEPTNO=3的記錄并且向前掃描到第一個DEPT大于3的記錄.

3.16 用UNION替換OR (適用于索引列)
通常情況下, 用UNION替換WHERE子句中的OR將會起到較好的效果. 對索引列使用OR將造成全表掃描. 注意, 以上規(guī)則只針對多個索引列有效. 如果有column沒有被索引, 查詢效率可能會因為你沒有選擇OR而降低.
在下面的例子中, LOC_ID 和REGION上都建有索引.
高效:
SELECT LOC_ID , LOC_DESC , REGION
FROM LOCATION
WHERE LOC_ID = 10
UNION
SELECT LOC_ID , LOC_DESC , REGION
FROM LOCATION
WHERE REGION = "MELBOURNE"
低效:
SELECT LOC_ID , LOC_DESC , REGION
FROM LOCATION
WHERE LOC_ID = 10 OR REGION = "MELBOURNE"
如果你堅持要用OR, 那就需要返回記錄最少的索引列寫在最前面.

3.17 用IN來替換OR

低效:
SELECT….
FROM LOCATION
WHERE LOC_ID = 10
OR LOC_ID = 20
OR LOC_ID = 30
高效
SELECT…
FROM LOCATION
WHERE LOC_IN IN (10,20,30);
3.18 避免在索引列上使用IS NULL和IS NOT NULL
避免在索引中使用任何可以為空的列，

3.19 總是使用索引的第一個列

如果索引是建立在多個列上, 只有在它的第一個列(leading column)被where子句引用時,優(yōu)化器才會選擇使用該索引.

3.20 用UNION-ALL 替換UNION ( 如果有可能的話)
當SQL語句需要UNION兩個查詢結(jié)果集合時,這兩個結(jié)果集合會以UNION-ALL的方式被合并, 然后在輸出最終結(jié)果前進行排序.
如果用UNION ALL替代UNION, 這樣排序就不是必要了. 效率就會因此得到提高.

UNION 將對結(jié)果集合排序,這個操作會使用到SORT_AREA_SIZE這塊內(nèi)存

union:如果查詢出來的結(jié)果中有重復(fù)記錄，那么就去重，英文稱之為"distinct"
union all:就顯示所有的符合條件的記錄，重復(fù)也保留

3.21 ORDER BY 子句只在兩種嚴格的條件下使用索引.
ORDER BY中所有的列必須包含在相同的索引中并保持在索引中的排列順序.
ORDER BY中所有的列必須定義為非空.

3.22 避免改變索引列的類型.
當比較不同數(shù)據(jù)類型的數(shù)據(jù)時,自動對列進行簡單的類型轉(zhuǎn)換.
假設(shè) EMPNO是一個數(shù)值類型的索引列.
SELECT …
FROM EMP
WHERE EMPNO = '123'
實際上,經(jīng)過ORACLE類型轉(zhuǎn)換, 語句轉(zhuǎn)化為:
SELECT …
FROM EMP
WHERE EMPNO = TO_NUMBER('123')
幸運的是,類型轉(zhuǎn)換沒有發(fā)生在索引列上,索引的用途沒有被改變.
現(xiàn)在,假設(shè)EMP_TYPE是一個字符類型的索引列.
SELECT …
FROM EMP
WHERE EMP_TYPE = 123
這個語句被ORACLE轉(zhuǎn)換為:
SELECT …
FROM EMP
WHERE TO_NUMBER(EMP_TYPE)=123
因為內(nèi)部發(fā)生的類型轉(zhuǎn)換, 這個索引將不會被用到!為了避免ORACLE對你的SQL進行隱式的類型轉(zhuǎn)換, 最好把類型轉(zhuǎn)換用顯式表現(xiàn)出來. 注意當字符和數(shù)值比較時, ORACLE會優(yōu)先轉(zhuǎn)換字符類型到數(shù)字類型.
3.23 需要當心的WHERE子句
某些SELECT 語句中的WHERE子句不使用索引. 這里有一些例子.
在下面的例子里, '!=' 將不使用索引. 記住, 索引只能告訴你什么存在于表中, 而不能告訴你什么不存在于表中. '+'是數(shù)學(xué)函數(shù). 就象其他數(shù)學(xué)函數(shù)那樣, 停用了索引

3.24 避免使用耗費資源的操作
帶有DISTINCT,UNION,MINUS,INTERSECT,ORDER BY的SQL語句會啟動SQL引擎
執(zhí)行耗費資源的排序(SORT)功能. DISTINCT需要一次排序操作, 而其他的至少需要執(zhí)行兩次排序.

轉(zhuǎn)載于:https://www.cnblogs.com/jianglai11/archive/2010/04/09/1708321.html

總結(jié)

以上是生活随笔為你收集整理的Sql优化文档的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

文档
SQL

上一篇： RMI实现方案
下一篇： ViewState机制由浅入深1

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

Sql优化文档

總結(jié)