mysql top 1效率_TOP 1比不加TOP慢的疑惑
問題描述: 有一個查詢?nèi)缦?#xff0c;去掉 TOP 1 的時候,很快就出來結(jié)果了,但加上 TOP 1 的時候,一般要 2~3 秒才出數(shù)據(jù),何解? SELECT TOP 1 ??? A . INVNO FROM A , B WHERE A . Item = B . ItemNumber ??? AND B . OwnerCompanyCode IS NOT NULL ? 問題原因分
問題描述:
有一個查詢?nèi)缦?#xff0c;去掉
TOP 1
的時候,很快就出來結(jié)果了,但加上
TOP 1
的時候,一般要
2~3
秒才出數(shù)據(jù),何解?
SELECT
TOP
1
???
A.
INVNO
FROM
A,
B
WHERE
A.
Item =
B.
ItemNumber
???
AND
B.
OwnerCompanyCode IS
NOT
NULL
?
問題原因分析:
在使用
TOP 1
的時候,
SQL Server
會盡力先找出這條
TOP 1
的記錄,這就導(dǎo)致它采用了與不加
TOP
時不一致的掃描算法,
SQL Server
查詢優(yōu)化器始終認(rèn)為,應(yīng)該可以比較快的找到匹配的第
1
條記錄,所以一般是使用嵌套循環(huán)的聯(lián)接,則不加
TOP 1
時,
SQL Server
會根據(jù)結(jié)構(gòu)和數(shù)據(jù)的統(tǒng)計信息決策出聯(lián)接策略。
嵌套循環(huán)一般適用于聯(lián)系的兩個表,一個表的數(shù)據(jù)較大,而另一個表的數(shù)據(jù)較小的情況
,如果查詢匹配的值出現(xiàn)在掃描的前端,則在取
TOP 1
的情況下,是符合嵌套循環(huán)聯(lián)系的使用條件的,但當(dāng)匹配的數(shù)據(jù)出現(xiàn)在掃描的后端,或者是基本上沒有匹配的數(shù)據(jù)時,則嵌套循環(huán)要掃描完成兩個大表,這顯然是不適宜的,也正是因為這種情況,導(dǎo)致了
TOP 1
比不加
TOP 1
的效率慢很多
?
關(guān)于此問題的模擬環(huán)境:
USE
tempdb
GO
?
SET
NOCOUNT
ON
--======================================
--
創(chuàng)建測試環(huán)境
--======================================
RAISERROR
(
'
創(chuàng)建測試環(huán)境
'
,
10,
1)
WITH
NOWAIT
-- Table A
CREATE
TABLE
[dbo].
A(
???
[TranNumber] [int] IDENTITY
(
1,
1)
NOT
NULL,
???
[INVNO] [char](
8)
NOT
NULL,
???
[ITEM] [char](
15)
NULL
DEFAULT
(
''
),
???
PRIMARY
KEY
(
[TranNumber])
)
?
CREATE
INDEX
[indexONinvno] ON
[dbo].
A(
[INVNO])
CREATE
INDEX
[indexOnitem] ON
[dbo].
A (
[ITEM])
CREATE
INDEX
[indexONiteminnvo] ON
[dbo].
A(
[INVNO],
[ITEM])
GO
?
-- Table B
CREATE
TABLE
[dbo].
B(
???
[ItemNumber] [char](
15)
NOT
NULL
DEFAULT
(
''
),
???
[CompanyCode] [char] (
4)
NOT
NULL,
???
[OwnerCompanyCode] [char](
4)
NULL,
???
PRIMARY
KEY
(
[ItemNumber],
[CompanyCode])
)
?
CREATE
INDEX
[ItemNumber] ON
[dbo].
B(
[ItemNumber])
CREATE
INDEX
[CompanyCode] ON
[dbo].
B(
[CompanyCode])
CREATE
INDEX
[OwnerCompanyCode] ON
[dbo].
B(
[OwnerCompanyCode])
GO
?
--======================================
--
生成測試數(shù)據(jù)
--======================================
RAISERROR
(
'
生成測試數(shù)據(jù)
'
,
10,
1)
WITH
NOWAIT
INSERT
[dbo].
A(
[INVNO],
[ITEM])
SELECT
LEFT(
NEWID
(),
8),
RIGHT(
NEWID
(),
15)
FROM
syscolumns A,
syscolumns B
?
INSERT
[dbo].
B(
[ItemNumber],
[CompanyCode],
[OwnerCompanyCode])
SELECT
RIGHT(
NEWID
(),
15),
LEFT(
NEWID
(),
4),
LEFT(
NEWID
(),
4)
FROM
syscolumns A,
syscolumns B
GO
?
速度測試腳本:
--======================================
--
進(jìn)行查詢測試
--======================================
RAISERROR
(
'
進(jìn)行查詢測試
'
,
10,
1)
WITH
NOWAIT
DECLARE
@dt DATETIME
,
@id int
,
@loop int
DECLARE
@ TABLE
(
???
id int
IDENTITY
,
???
[TOP 1] int
,
???
[WITHOUT TOP] int
)
?
SET
@loop =
0
WHILE
@loop <
10
BEGIN
???
SET
@loop =
@loop +
1
???
RAISERROR
(
'test %d'
,
10,
1,
@loop)
WITH
NOWAIT
???
SET
@dt =
GETDATE
()
???????
SELECT
TOP
1
???????????
A.
INVNO
???????
FROM
A,
B
???????
WHERE
A.
Item =
B.
ItemNumber
???????????
AND
B.
OwnerCompanyCode IS
NOT
NULL
???
INSERT
@([TOP 1])
VALUES
(
DATEDIFF
(
ms,
@dt,
GETDATE
()))
???
SELECT
@id =
SCOPE_IDENTITY
(),
@dt =
GETDATE
()
???????
SELECT
--TOP 1
???????????
A.
INVNO
???????
FROM
A,
B
???????
WHERE
A.
Item =
B.
ItemNumber
???????????
AND
B.
OwnerCompanyCode IS
NOT
NULL
???
UPDATE
@ SET
[WITHOUT TOP] =
DATEDIFF
(
ms,
@dt,
GETDATE
())
???
WHERE
id =
@id
END
SELECT
*
FROM
@
UNION
ALL
SELECT
NULL,
SUM
(
[TOP 1]),
SUM
(
[WITHOUT TOP])
FROM
@
GO
?
測試數(shù)據(jù)的變更腳本:
DECLARE
@value char
(
15),
@value1 char
(
15)
SELECT
???
@value =
LEFT(
NEWID
(),
15),
???
@value1 =
LEFT(
NEWID
(),
15)
?
UPDATE
A
SET
Item =
@value
FROM
A
???
INNER
JOIN(
???????
SELECT
TOP
1
???????????
[TranNumber]
???????
FROM
(
???????????
SELECT
TOP
20
PERCENT
???????????????
[TranNumber]
???????????
FROM
A
???????????
ORDER
BY
[TranNumber]
???????
)
AA
???????
ORDER
BY
[TranNumber] DESC
???
)
B
???????
ON
A.
[TranNumber] =
B.
[TranNumber]
?
UPDATE
B
SET
ItemNumber =
@value
FROM
B
???
INNER
JOIN(
???
???
SELECT
TOP
1
???????????
[ItemNumber],
[CompanyCode]
???????
FROM
(
???????????
SELECT
TOP
20 PERCENT
???????????????
[ItemNumber],
[CompanyCode]
???????????
FROM
B
???????????
ORDER
BY
[ItemNumber],
[CompanyCode]
???????
)
BB
???????
ORDER
BY
[ItemNumber] DESC
,
[CompanyCode] DESC
???
)
B1
???????
ON
B.
[ItemNumber] =
B1.
[ItemNumber]
???????????
AND
B.
[CompanyCode] =
B1.
[CompanyCode]
GO
?
測試說明:
1.??
在剛建立好測試環(huán)境的時候,是沒有任何匹配項的,這時候,
TOP 1
會掃描兩個表的所有數(shù)據(jù),運(yùn)行“速度測試腳本
”可以看到此時有無
TOP 1
的效率差異:
TOP 1
明顯比不加
TOP
慢
2.??
修改“測試數(shù)據(jù)的變更腳本
”中,紅色的
20
,
讓匹配的數(shù)據(jù)出現(xiàn)在掃描的頂端、中間和尾端,分別使用
“速度測試腳本
”測試,可以看到,匹配的值靠近掃描的前端的時候,
TOP 1
比不加
TOP
快,隨著匹配數(shù)據(jù)很后端的推移,這種效率差異會越來越小,到后面就變成
TOP 1
比不加
TOP 1
慢。
注意:
每次變更數(shù)據(jù),并且完成“速度測試腳本
”測試后,需要修改“測試數(shù)據(jù)的變更腳本
”中,紅色的
@
value
為
@value1
,讓剛才設(shè)置匹配的數(shù)據(jù)再變回為不匹配
?
附:聯(lián)接的幾種方式
1.????
嵌套循環(huán)聯(lián)接
嵌套循環(huán)聯(lián)接也稱為
“
嵌套迭代
”
,它將一個聯(lián)接輸入用作外部輸入表(顯示為圖形執(zhí)行計劃中的頂端輸入),將另一個聯(lián)接輸入用作內(nèi)部(底端)輸入表。外部循環(huán)逐行處理外部輸入表。內(nèi)部循環(huán)會針對每個外部行執(zhí)行,在內(nèi)部輸入表中搜索匹配行。
最簡單的情況是,搜索時掃描整個表或索引;這稱為
“
單純嵌套循環(huán)聯(lián)接
”
。如果搜索時使用索引,則稱為
“
索引嵌套循環(huán)聯(lián)接
”
。如果將索引生成為查詢計劃的一部分(并在查詢完成后立即將索引破壞),則稱為
“
臨時索引嵌套循環(huán)聯(lián)接
”
。查詢優(yōu)化器考慮了所有這些不同情況。
如果外部輸入較小而內(nèi)部輸入較大且預(yù)先創(chuàng)建了索引,則嵌套循環(huán)聯(lián)接尤其有效。在許多小事務(wù)中(如那些只影響較小的一組行的事務(wù)),索引嵌套循環(huán)聯(lián)接優(yōu)于合并聯(lián)接和哈希聯(lián)接。但在大型查詢中,嵌套循環(huán)聯(lián)接通常不是最佳選擇。
?
2.????
合并聯(lián)接
合并聯(lián)接要求兩個輸入都在合并列上排序,而合并列由聯(lián)接謂詞的等效
(ON)
子句定義。通常,查詢優(yōu)化器掃描索引(如果在適當(dāng)?shù)囊唤M列上存在索引),或在合并聯(lián)接的下面放一個排序運(yùn)算符。在極少數(shù)情況下,雖然可能有多個等效子句,但只用其中一些可用的等效子句獲得合并列。
由于每個輸入都已排序,因此
Merge Join
運(yùn)算符將從每個輸入獲取一行并將其進(jìn)行比較。例如,對于內(nèi)聯(lián)接操作,如果行相等則返回。如果行不相等,則廢棄值較小的行并從該輸入獲得另一行。這一過程將重復(fù)進(jìn)行,直到處理完所有的行為止。
合并聯(lián)接操作可以是常規(guī)操作,也可以是多對多操作。多對多合并聯(lián)接使用臨時表存儲行。如果每個輸入中有重復(fù)值,則在處理其中一個輸入中的每個重復(fù)項時,另一個輸入必須重繞到重復(fù)項的開始位置。
如果存在駐留謂詞,則所有滿足合并謂詞的行都將對該駐留謂詞取值,而只返回那些滿足該駐留謂詞的行。
合并聯(lián)接本身的速度很快,但如果需要排序操作,選擇合并聯(lián)接就會非常費(fèi)時。然而,如果數(shù)據(jù)量很大且能夠從現(xiàn)有
B
樹索引中獲得預(yù)排序的所需數(shù)據(jù),則合并聯(lián)接通常是最快的可用聯(lián)接算法。
?
3.????
哈希聯(lián)接
哈希聯(lián)接有兩種輸入:生成輸入和探測輸入。查詢優(yōu)化器指派這些角色,使兩個輸入中較小的那個作為生成輸入。
哈希聯(lián)接用于多種設(shè)置匹配操作:內(nèi)部聯(lián)接;左外部聯(lián)接、右外部聯(lián)接和完全外部聯(lián)接;左半聯(lián)接和右半聯(lián)接;交集;聯(lián)合和差異。此外,哈希聯(lián)接的某種變形可以進(jìn)行重復(fù)刪除和分組,例如
SUM(salary) GROUP BY department
。這些修改對生成和探測角色只使用一個輸入。
以下幾節(jié)介紹了不同類型的哈希聯(lián)接:內(nèi)存中的哈希聯(lián)接、
Grace
哈希聯(lián)接和遞歸哈希聯(lián)接。
內(nèi)存中的哈希聯(lián)接
哈
希聯(lián)接先掃描或計算整個生成輸入,然后在內(nèi)存中生成哈希表。根據(jù)計算得出的哈希鍵的哈希值,將每行插入哈希存儲桶。如果整個生成輸入小于可用內(nèi)存,則可以
將所有行都插入哈希表中。生成階段之后是探測階段。一次一行地對整個探測輸入進(jìn)行掃描或計算,并為每個探測行計算哈希鍵的值,掃描相應(yīng)的哈希存儲桶并生成
匹配項。
Grace
哈希聯(lián)接
如果生成輸入大于內(nèi)存,哈希聯(lián)接將分為幾步進(jìn)行。這稱為
“Grace
哈希聯(lián)接
”
。
每一步都分為生成階段和探測階段。首先,消耗整個生成和探測輸入并將其分區(qū)(使用哈希鍵上的哈希函數(shù))為多個文件。對哈希鍵使用哈希函數(shù)可以保證任意兩個
聯(lián)接記錄一定位于相同的文件對中。因此,聯(lián)接兩個大輸入的任務(wù)簡化為相同任務(wù)的多個較小的實(shí)例。然后將哈希聯(lián)接應(yīng)用于每對分區(qū)文件。
遞歸哈希聯(lián)接
如果生成輸入非常大,以至于標(biāo)準(zhǔn)外部合并的輸入需要多個合并級別,則需要多個分區(qū)步驟和多個分區(qū)級別。如果只有某些分區(qū)較大,則只需對那些分區(qū)使用附加的分區(qū)步驟。為了使所有分區(qū)步驟盡可能快,將使用大的異步
I/O
操作以便單個線程就能使多個磁盤驅(qū)動器繁忙工作。
border: 1pt solid #dedfef; padding: 0cm
本文原創(chuàng)發(fā)布php中文網(wǎng),轉(zhuǎn)載請注明出處,感謝您的尊重!
總結(jié)
以上是生活随笔為你收集整理的mysql top 1效率_TOP 1比不加TOP慢的疑惑的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 房贷越还越少叫什么
- 下一篇: mysql数据库开发笔记_MySQL数据