索引和索引调整向导
索引和索引調(diào)整向?qū)?/font>
索引是一種加快檢索表中數(shù)據(jù)的方法。
數(shù)據(jù)庫(kù)的索引類似于書籍的索引。在書籍中,索引允許用戶不必翻閱整本書就能迅速地找到所需的信息。在數(shù)據(jù)庫(kù)中,索引也允許數(shù)據(jù)庫(kù)程序迅速地找到表中的數(shù)據(jù),而不必掃描整個(gè)數(shù)據(jù)庫(kù)。在書籍中,索引就是內(nèi)容和相應(yīng)頁(yè)號(hào)的清單。在數(shù)據(jù)庫(kù)中,索引就是表中數(shù)據(jù)和相應(yīng)存儲(chǔ)位置的列表。索引可以大大減少數(shù)據(jù)庫(kù)管理系統(tǒng)查找數(shù)據(jù)的時(shí)間。索引調(diào)整向?qū)且环N工具,它通過(guò)使用查詢優(yōu)化器來(lái)分析查詢?nèi)蝿?wù)的工作量,向有大量工作量的數(shù)據(jù)庫(kù)推薦一種最佳的索引混合方式,以加快數(shù)據(jù)庫(kù)的查詢速度。SQL Server現(xiàn)在用交叉索引和聯(lián)合索引來(lái)完成對(duì)一個(gè)數(shù)據(jù)庫(kù)的多次索引。
索引和索引調(diào)整向?qū)Ь哂邢铝幸恍┨攸c(diǎn):
●索引可以加快數(shù)據(jù)庫(kù)的檢索速度。
●索引增加了數(shù)據(jù)庫(kù)插入、修改和刪除等維護(hù)任務(wù)的時(shí)間。
●索引創(chuàng)建在表上,不能創(chuàng)建在視圖上。
●索引有兩種類型,即聚簇索引和非聚簇索引。
●聚簇索引與基表的物理順序相同,非聚簇索引與基表的物理順序不相同。
●索引既可以直接創(chuàng)建,也可以間接創(chuàng)建。
●可以在優(yōu)化隱藏中使用索引。
●使用查詢處理器執(zhí)行SQL語(yǔ)句,在一個(gè)表上一次只能使用一個(gè)索引。
●使用索引調(diào)整向?qū)г谝粋€(gè)表上一次可以使用多個(gè)索引。
●使用索引調(diào)整向?qū)枰峁┕ぷ髁孔鳛檎{(diào)整的對(duì)象。
索引的優(yōu)點(diǎn)和缺點(diǎn)
為什么要?jiǎng)?chuàng)建索引呢?這是因?yàn)閯?chuàng)建索引可以大大提高系統(tǒng)的性能。第一,通過(guò)創(chuàng)建唯一性索引,可以保證數(shù)據(jù)庫(kù)表中每一行數(shù)據(jù)的唯一性。第二,可以大大加快數(shù)據(jù)的檢索速度,這也是創(chuàng)建索引的最主要原因。第三,可以加速表和表之間的連接,這在實(shí)現(xiàn)數(shù)據(jù)的參考完整性方面特別有意義。第四,在使用分組和排序子句進(jìn)行數(shù)據(jù)檢索時(shí),同樣可以顯著減少查詢中分組和排序的時(shí)間。第五,通過(guò)使用索引,可以在查詢的過(guò)程中使用優(yōu)化隱藏器,提高系統(tǒng)的性能。
也許有人會(huì)問(wèn):增加索引有如此多的優(yōu)點(diǎn),為什么不對(duì)表中的每一個(gè)列創(chuàng)建一個(gè)索引呢?這種想法固然有其合理性,然而也有其片面性。雖然索引有許多優(yōu)點(diǎn),但為表中的每一列都增加索引是非常不明智的。這是因?yàn)樵黾铀饕灿性S多不利的方面。第一,創(chuàng)建索引和維護(hù)索引要耗費(fèi)時(shí)間,這種時(shí)間隨著數(shù)據(jù)量的增加而增加。第二,除了數(shù)據(jù)表占數(shù)據(jù)空間之外,每一個(gè)索引還要占一定的物理空間,如果要建立聚簇索引,需要的空間就會(huì)更大。第三,當(dāng)對(duì)表中的數(shù)據(jù)進(jìn)行增加、刪除和修改的時(shí)候,索引也要?jiǎng)討B(tài)的維護(hù),這樣就降低了數(shù)據(jù)的維護(hù)速度。
索引是建立在數(shù)據(jù)庫(kù)表中某些列上的。因此,在創(chuàng)建索引的時(shí)候,應(yīng)該仔細(xì)考慮在哪些列上可以創(chuàng)建索引,在哪些列上不能創(chuàng)建索引。一般來(lái)說(shuō),選擇創(chuàng)建索引的列時(shí),可以參考以下的原則:在經(jīng)常需要搜索的列上創(chuàng)建索引,加快搜索的速度;在作為主鍵的列上創(chuàng)建索引,強(qiáng)制該列的唯一性和組織表中數(shù)據(jù)的排列結(jié)構(gòu);在經(jīng)常用于連接的列(這些列主要是一些外鍵)上創(chuàng)建索引,加快連接的速度;在經(jīng)常需要根據(jù)范圍進(jìn)行搜索的列上創(chuàng)建索引,因?yàn)樗饕呀?jīng)排序,其指定的范圍是連續(xù)的;在經(jīng)常需要排序的列上創(chuàng)建索引,因?yàn)樗饕呀?jīng)排序,這樣查詢可以利用索引的排序,加快查詢速度;在經(jīng)常使用于WHERE子句中的列上創(chuàng)建索引,加快條件的判斷速度。
同樣,對(duì)于有些列不應(yīng)該創(chuàng)建索引。一般來(lái)說(shuō),不應(yīng)該創(chuàng)建索引的列具有下列特點(diǎn):第一,對(duì)于那些在查詢中很少使用或者參考的列不應(yīng)該創(chuàng)建索引。這是因?yàn)?#xff0c;既然這些列很少用到,因此有無(wú)索引并不能明顯改變查詢速度。相反,由于增加了索引,反而降低了系統(tǒng)的維護(hù)速度和增大了空間需求。第二,對(duì)于那些只有很少數(shù)據(jù)值的列也不應(yīng)該增加索引。由于這些列的取值很少,例如人事表的性別列,在查詢的結(jié)果中,結(jié)果集的數(shù)據(jù)行占了表中數(shù)據(jù)行的很大比例,即需要在表中搜索的數(shù)據(jù)行的比例很大。增加索引并不能明顯加快檢索速度。第三,對(duì)于那些定義為text、image和bit數(shù)據(jù)類型的列不應(yīng)該增加索引。因?yàn)檫@些列的數(shù)據(jù)量要么相當(dāng)大,要么取值很少。第四,當(dāng)修改性能遠(yuǎn)遠(yuǎn)大于檢索性能時(shí),不應(yīng)該創(chuàng)建索引。修改性能和檢索性能是互相矛盾的。當(dāng)增加索引時(shí),會(huì)提高檢索性能,但是會(huì)降低修改性能。當(dāng)減少索引時(shí),會(huì)提高修改性能,降低檢索性能。因此,當(dāng)修改性能遠(yuǎn)遠(yuǎn)大于檢索性能時(shí),不應(yīng)該創(chuàng)建索引。
創(chuàng)建索引的方法
創(chuàng)建索引有多種方法,這些方法包括直接創(chuàng)建索引的方法和間接創(chuàng)建索引的方法。直接創(chuàng)建索引可以使用CREATE INDEX語(yǔ)句或者使用創(chuàng)建索引向?qū)?#xff1b;間接創(chuàng)建索引可以在表中定義主鍵約束或者唯一性鍵約束,同時(shí)也創(chuàng)建了索引。雖然這兩種方法都可以創(chuàng)建索引,但它們創(chuàng)建索引的具體內(nèi)容是有區(qū)別的。
直接創(chuàng)建法是最基本的索引創(chuàng)建方法,它最具靈活性,并且可以定制創(chuàng)建出符合自己需要的索引。在使用這種方式創(chuàng)建索引時(shí),可以使用許多選項(xiàng),例如指定數(shù)據(jù)頁(yè)的充滿度、排序、整理統(tǒng)計(jì)信息等,這樣可以優(yōu)化索引。使用這種方法,可以指定索引的類型、唯一性和復(fù)合性,也就是說(shuō),既可以創(chuàng)建聚簇索引,也可以創(chuàng)建非聚簇索引;既可以在一個(gè)列上創(chuàng)建索引,也可以在兩個(gè)或者兩個(gè)以上的列上創(chuàng)建索引。
間接創(chuàng)建法是具有約束性的索引創(chuàng)建方法。主鍵約束是一種保持?jǐn)?shù)據(jù)完整性的邏輯,它限制表中的記錄有相同的主鍵。在創(chuàng)建主鍵約束時(shí),系統(tǒng)自動(dòng)創(chuàng)建了一個(gè)唯一性的聚簇索引。雖然邏輯上主鍵約束是一種重要的結(jié)構(gòu),但在物理結(jié)構(gòu)上,與主鍵約束相對(duì)應(yīng)的結(jié)構(gòu)是唯一性的聚簇索引。換句話說(shuō),在物理實(shí)現(xiàn)上,不存在主鍵約束,只存在唯一性的聚簇索引。同樣,在創(chuàng)建唯一性鍵約束時(shí)也同時(shí)創(chuàng)建了索引,這種索引是唯一性的非聚簇索引。因此,當(dāng)使用約束創(chuàng)建索引時(shí),索引的類型和特征基本上都已經(jīng)確定了,由用戶定制的余地比較小。
當(dāng)在表上定義主鍵或者唯一性鍵約束時(shí),如果表中已經(jīng)有了使用CREATE INDEX語(yǔ)句創(chuàng)建的標(biāo)準(zhǔn)索引,那么主鍵約束或者唯一性鍵約束創(chuàng)建的索引將覆蓋以前創(chuàng)建的標(biāo)準(zhǔn)索引。也就是說(shuō),主鍵約束或者唯一性鍵約束創(chuàng)建的索引的優(yōu)先級(jí)高于使用CREATE INDEX語(yǔ)句創(chuàng)建的索引。
索引的特征
索引有兩個(gè)特征,即唯一性索引和復(fù)合索引。
唯一性索引保證在索引列中的全部數(shù)據(jù)是唯一的,不會(huì)包含冗余數(shù)據(jù)。如果表中已經(jīng)有一個(gè)主鍵約束或者唯一性鍵約束,那么當(dāng)創(chuàng)建表或者修改表時(shí),SQL Server自動(dòng)創(chuàng)建一個(gè)唯一性索引。然而,如果必須保證唯一性,那么應(yīng)該創(chuàng)建主鍵約束或者唯一性鍵約束,而不是創(chuàng)建一個(gè)唯一性索引。當(dāng)創(chuàng)建唯一性索引時(shí),應(yīng)該認(rèn)真考慮這些規(guī)則:當(dāng)在表中創(chuàng)建主鍵約束或者唯一性鍵約束時(shí),SQL Server自動(dòng)創(chuàng)建一個(gè)唯一性索引;如果表中已經(jīng)包含有數(shù)據(jù),那么當(dāng)創(chuàng)建索引時(shí),SQL Server檢查表中已有數(shù)據(jù)的冗余性;每當(dāng)使用插入語(yǔ)句插入數(shù)據(jù)或者使用修改語(yǔ)句修改數(shù)據(jù)時(shí),SQL Server檢查數(shù)據(jù)的冗余性,如果有冗余值,SQL Server取消該語(yǔ)句的執(zhí)行,并且返回一個(gè)錯(cuò)誤消息;確保表中的每一行數(shù)據(jù)都有一個(gè)唯一值,這樣可以確保每一個(gè)實(shí)體都可以唯一確認(rèn);只能在可以保證實(shí)體完整性的列上創(chuàng)建唯一性索引,例如,不能在人事表中的姓名列上創(chuàng)建唯一性索引,因?yàn)槿藗兛梢杂邢嗤男彰?/p>
復(fù)合索引就是一個(gè)索引創(chuàng)建在兩個(gè)列或者多個(gè)列上。在搜索時(shí),當(dāng)兩個(gè)或者多個(gè)列作為一個(gè)關(guān)鍵值時(shí),最好在這些列上創(chuàng)建復(fù)合索引。當(dāng)創(chuàng)建復(fù)合索引時(shí),應(yīng)該考慮這些規(guī)則:最多可以把16個(gè)列合并成一個(gè)單獨(dú)的復(fù)合索引,構(gòu)成復(fù)合索引的列的總長(zhǎng)度不能超過(guò)900字節(jié),也就是說(shuō)復(fù)合列的長(zhǎng)度不能太長(zhǎng);在復(fù)合索引中,所有的列必須來(lái)自同一個(gè)表中,不能跨表建立復(fù)合索引;在復(fù)合索引中,列的排列順序是非常重要的,因此要認(rèn)真排好列的順序。原則上,應(yīng)該首先定義最唯一的列,如在(COL1,COL2)上的索引與在(COL2,COL1)上的索引是不相同的,因?yàn)閮蓚€(gè)索引的列的順序不同;為了使查詢優(yōu)化器使用復(fù)合索引,查詢語(yǔ)句中的WHERE子句必須參考復(fù)合索引中第一個(gè)列;當(dāng)表中有多個(gè)關(guān)鍵列時(shí),復(fù)合索引是非常有用的;使用復(fù)合索引可以提高查詢性能,減少在一個(gè)表中所創(chuàng)建的索引數(shù)量。
索引的類型
根據(jù)索引的順序與數(shù)據(jù)表的物理順序是否相同,可以把索引分成兩種類型。一種是數(shù)據(jù)表的物理順序與索引順序相同的聚簇索引,另一種是數(shù)據(jù)表的物理順序與索引順序不相同的非聚簇索引。
聚簇索引的體系結(jié)構(gòu)
索引的結(jié)構(gòu)類似于樹狀結(jié)構(gòu),樹的頂部稱為葉級(jí),樹的其他部分稱為非葉級(jí),樹的根部屬于非葉級(jí)。同樣,在聚簇索引中,聚簇索引的葉級(jí)和非葉級(jí)構(gòu)成了一個(gè)樹狀結(jié)構(gòu),索引的最低級(jí)是葉級(jí)。在聚簇索引中,表中的數(shù)據(jù)所在的數(shù)據(jù)頁(yè)是葉級(jí),在葉級(jí)之上的索引頁(yè)是非葉級(jí),索引數(shù)據(jù)所在的索引頁(yè)是非葉級(jí)。在聚簇索引中,數(shù)據(jù)值的順序總是按照升序排列的。
應(yīng)該在表中經(jīng)常搜索的列或者按照順序訪問(wèn)的列上創(chuàng)建聚簇索引。當(dāng)創(chuàng)建聚簇索引時(shí),應(yīng)該考慮這些因素:每一個(gè)表只能有一個(gè)聚簇索引,因?yàn)楸碇袛?shù)據(jù)的物理順序只能有一個(gè);表中行的物理順序和索引中行的物理順序是相同的,在創(chuàng)建任何非聚簇索引之前創(chuàng)建聚簇索引,這是因?yàn)榫鄞厮饕淖兞吮碇行械奈锢眄樞?#xff0c;數(shù)據(jù)行按照一定的順序排列,并且自動(dòng)維護(hù)這個(gè)順序;關(guān)鍵值的唯一性要么使用UNIQUE關(guān)鍵字明確維護(hù),要么由一個(gè)內(nèi)部的唯一標(biāo)識(shí)符明確維護(hù),這些唯一性標(biāo)識(shí)符是系統(tǒng)自己使用的,用戶不能訪問(wèn);聚簇索引的平均大小大約是數(shù)據(jù)表的5%,但是,實(shí)際的聚簇索引的大小常常根據(jù)索引列的大小而變化;在索引的創(chuàng)建過(guò)程中,SQL Server臨時(shí)使用當(dāng)前數(shù)據(jù)庫(kù)的磁盤空間,當(dāng)創(chuàng)建聚簇索引時(shí),需要1.2倍的表空間的大小,因此,一定要保證有足夠的空間來(lái)創(chuàng)建聚簇索引。
當(dāng)系統(tǒng)訪問(wèn)表中的數(shù)據(jù)時(shí),首先應(yīng)確定在相應(yīng)的列上是否存在索引和該索引是否對(duì)要檢索的數(shù)據(jù)有意義。如果索引存在并且該索引非常有意義,那么系統(tǒng)使用該索引訪問(wèn)表中的記錄。系統(tǒng)從索引開始瀏覽到數(shù)據(jù),索引瀏覽則從樹狀索引的根部開始。從根部開始,搜索值與每一個(gè)關(guān)鍵值相比較,確定搜索值是否大于或者等于關(guān)鍵值。這一步重復(fù)進(jìn)行,直到碰上一個(gè)比搜索值大的關(guān)鍵值,或者該搜索值大于或等于索引頁(yè)上所有的關(guān)鍵值為止。
非聚簇索引的體系結(jié)構(gòu)
非聚簇索引的結(jié)構(gòu)也是樹狀結(jié)構(gòu),與聚簇索引的結(jié)構(gòu)非常類似,但是也有明顯的不同。
在非聚簇索引中,葉級(jí)僅包含關(guān)鍵值,而沒(méi)有包含數(shù)據(jù)行。非聚簇索引表示行的邏輯順序。非聚簇索引又有兩種體系結(jié)構(gòu):一種體系結(jié)構(gòu)是在沒(méi)有聚簇索引的表上創(chuàng)建非聚簇索引,另一種體系結(jié)構(gòu)是在有聚簇索引的表上創(chuàng)建非聚簇索引。
如果一個(gè)數(shù)據(jù)表中沒(méi)有聚簇索引,那么這個(gè)數(shù)據(jù)表也稱為數(shù)據(jù)堆。當(dāng)非聚簇索引在數(shù)據(jù)堆的頂部創(chuàng)建時(shí),系統(tǒng)使用索引頁(yè)中的行標(biāo)識(shí)符指向數(shù)據(jù)頁(yè)中的記錄。行標(biāo)識(shí)符存儲(chǔ)了數(shù)據(jù)所在位置的信息。數(shù)據(jù)堆是通過(guò)使用索引分配圖(IAM)頁(yè)來(lái)維護(hù)的。IAM頁(yè)包含了數(shù)據(jù)堆所在簇的存儲(chǔ)信息。在系統(tǒng)表sysindexes中,有一個(gè)指針指向與數(shù)據(jù)堆相關(guān)的第一個(gè)IAM頁(yè)。系統(tǒng)使用IAM頁(yè)在數(shù)據(jù)堆中瀏覽和尋找可以插入新的記錄行的空間。這些數(shù)據(jù)頁(yè)和在這些數(shù)據(jù)頁(yè)中的記錄沒(méi)有任何的順序并且也沒(méi)有鏈接在一起。在這些數(shù)據(jù)頁(yè)之間唯一的連接是IAM中記錄的順序。當(dāng)在數(shù)據(jù)堆上創(chuàng)建了非聚簇索引時(shí),葉級(jí)中包含了指向數(shù)據(jù)頁(yè)的行標(biāo)識(shí)符。行標(biāo)識(shí)符指定記錄行的邏輯順序,由文件ID、頁(yè)號(hào)和行ID組成。這些行的標(biāo)識(shí)符維持唯一性。非聚簇索引的葉級(jí)頁(yè)的順序不同于表中數(shù)據(jù)的物理順序。這些關(guān)鍵值在葉級(jí)中以升序維持。
當(dāng)非聚簇索引創(chuàng)建在有聚簇索引的表上的時(shí)候,系統(tǒng)使用索引頁(yè)中的指向聚簇索引的聚簇鍵。聚簇鍵存儲(chǔ)了數(shù)據(jù)的位置信息。如果某一個(gè)表有聚簇索引,那么非聚簇索引的葉級(jí)包含了映射到聚簇鍵的聚簇鍵值,而不是映射到物理的行標(biāo)識(shí)符。當(dāng)系統(tǒng)訪問(wèn)有非聚簇索引的表中數(shù)據(jù),并且這種非聚簇索引創(chuàng)建在聚簇索引上時(shí),它首先從非聚簇索引來(lái)找到指向聚簇索引的指針,然后通過(guò)使用聚簇索引來(lái)找到數(shù)據(jù)。
當(dāng)需要以多種方式檢索數(shù)據(jù)時(shí),非聚簇索引是非常有用的。當(dāng)創(chuàng)建非聚簇索引時(shí),要考慮這些情況:在缺省情況下,所創(chuàng)建的索引是非聚簇索引;在每一個(gè)表上可以創(chuàng)建不多于249個(gè)非聚簇索引,而聚簇索引最多只能有一個(gè)。
系統(tǒng)如何訪問(wèn)表中的數(shù)據(jù)
一般地,系統(tǒng)訪問(wèn)數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以使用兩種方法:第一種方法是表掃描,就是指系統(tǒng)將指針?lè)胖迷谠摫淼谋眍^數(shù)據(jù)所在的數(shù)據(jù)頁(yè)上,然后按照數(shù)據(jù)頁(yè)的排列順序,一頁(yè)一頁(yè)地從前向后掃描該表數(shù)據(jù)所占有的全部數(shù)據(jù)頁(yè),直至掃描完表中的全部記錄。在掃描時(shí),如果找到符合查詢條件的記錄,那么就將這條記錄挑選出來(lái)。最后,將全部符合查詢語(yǔ)句條件的記錄顯示出來(lái)。第二種方法是使用索引查找。索引是一種樹狀結(jié)構(gòu),其中存儲(chǔ)了關(guān)鍵字和指向包含關(guān)鍵字所在記錄的數(shù)據(jù)頁(yè)的指針。當(dāng)使用索引查找時(shí),系統(tǒng)沿著索引的樹狀結(jié)構(gòu),根據(jù)索引中關(guān)鍵字和指針,找到符合查詢條件的記錄。最后,將全部查找到的符合查詢語(yǔ)句條件的記錄顯示出來(lái)。
在SQL Server中訪問(wèn)數(shù)據(jù)庫(kù)的數(shù)據(jù)時(shí),由SQL Server確定該表是否有索引存在。如果沒(méi)有索引,那么SQL Server使用表掃描的方法訪問(wèn)數(shù)據(jù)庫(kù)中的數(shù)據(jù)。查詢處理器根據(jù)分布的統(tǒng)計(jì)信息生成該查詢語(yǔ)句的優(yōu)化執(zhí)行規(guī)劃,以提高訪問(wèn)數(shù)據(jù)的效率為目標(biāo),確定是使用表掃描還是使用索引。
索引的選項(xiàng)
在創(chuàng)建索引時(shí),可以指定一些選項(xiàng),通過(guò)使用這些選項(xiàng),可以優(yōu)化索引的性能。這些選項(xiàng)包括FILLFACTOR選項(xiàng)、PAD_INDEX選項(xiàng)和SORTED_ DATA_REORG選項(xiàng)。
使用FILLFACTOR選項(xiàng)可以優(yōu)化插入語(yǔ)句和修改語(yǔ)句的性能。當(dāng)某個(gè)索引頁(yè)變滿時(shí),SQL Server必須花費(fèi)時(shí)間分解該頁(yè),以便為新的記錄行騰出空間。使用FILLFACTOR選項(xiàng),可以在葉級(jí)索引頁(yè)上分配一定百分比的自由空間,以便減少頁(yè)的分解時(shí)間。當(dāng)在有數(shù)據(jù)的表中創(chuàng)建索引時(shí),可以使用FILLFACTOR選項(xiàng)指定每一個(gè)葉級(jí)索引節(jié)點(diǎn)的填充百分比,缺省值是0,該數(shù)值等價(jià)于100%。在創(chuàng)建索引的時(shí)候,內(nèi)部索引節(jié)點(diǎn)總是留有一定的空間,這個(gè)空間足夠容納一個(gè)或者兩個(gè)表中的記錄。在沒(méi)有數(shù)據(jù)的表中,當(dāng)創(chuàng)建索引時(shí),不要使用該選項(xiàng),因?yàn)檫@時(shí)該選項(xiàng)是沒(méi)有實(shí)際意義的。另外,該選項(xiàng)的數(shù)值在創(chuàng)建時(shí)指定以后,不能動(dòng)態(tài)地得到維護(hù),因此,只應(yīng)該在有數(shù)據(jù)的表中創(chuàng)建索引時(shí)才使用。
PAD_INDEX選項(xiàng)將FILLFACTOR選項(xiàng)的數(shù)值同樣也用于內(nèi)部的索引節(jié)點(diǎn),使內(nèi)部索引節(jié)點(diǎn)的填充度與葉級(jí)索引節(jié)點(diǎn)的填充度相同。如果沒(méi)有指定FILLFACTOR選項(xiàng),那么單獨(dú)指定PAD_INDEX選項(xiàng)是沒(méi)有實(shí)際意義的,這是因?yàn)镻AD_INDEX選項(xiàng)的取值是由FILLFACTOR選項(xiàng)的取值確定的。
當(dāng)創(chuàng)建聚簇索引時(shí),SORTED_ DATA_ REORG選項(xiàng)清除排序,因此可以減少建立聚簇索引所需要的時(shí)間。當(dāng)在一個(gè)已經(jīng)變成碎塊的表上創(chuàng)建或者重建聚簇索引時(shí),使用SORTED_DATA_REORG選項(xiàng)可以壓縮數(shù)據(jù)頁(yè)。當(dāng)需要重新在索引上應(yīng)用填充度時(shí),也使用該選項(xiàng)。當(dāng)使用SORTED_ DATA_REORG選項(xiàng)時(shí),應(yīng)該考慮這些因素:SQL Server確認(rèn)每一個(gè)關(guān)鍵值是否比前一個(gè)關(guān)鍵值高,如果都不高就不能創(chuàng)建索引;SQL Server要求1.2倍的表空間來(lái)物理地重新組織數(shù)據(jù);使用SORTED_DATA_ REORG選項(xiàng),通過(guò)清除排序進(jìn)程以加快索引創(chuàng)建進(jìn)程;從表中物理地拷貝數(shù)據(jù);當(dāng)某一個(gè)行被刪除時(shí),其所占的空間可以重新利用;創(chuàng)建全部非聚簇索引;如果希望把葉級(jí)頁(yè)填充到一定的百分比,可以同時(shí)使用FILLFACTOR選項(xiàng)和SORTED_DATA_ REORG選項(xiàng)。
索引的維護(hù)索引在創(chuàng)建之后,由于頻繁地對(duì)數(shù)據(jù)進(jìn)行增加、刪除和修改等操作使得索引頁(yè)出現(xiàn)碎塊,因此,必須對(duì)索引進(jìn)行維護(hù)。
使用DBCC SHOWCONTIG語(yǔ)句可以顯示表的數(shù)據(jù)和索引的碎塊信息。當(dāng)執(zhí)行DBCC SHOWCONTIG語(yǔ)句時(shí),SQL Server瀏覽葉級(jí)上的整個(gè)索引頁(yè),以確定表或者指定的索引是否存在嚴(yán)重碎塊。DBCC SHOWCONTIG語(yǔ)句還能確定數(shù)據(jù)頁(yè)和索引頁(yè)是否已經(jīng)滿了。當(dāng)對(duì)表進(jìn)行大量的修改和增加大量的數(shù)據(jù)之后,或者表的查詢非常慢時(shí),應(yīng)該在這些表上執(zhí)行DBCC SHOWCONTIG語(yǔ)句。當(dāng)執(zhí)行DBCC SHOWCONTIG語(yǔ)句時(shí),應(yīng)該考慮這些因素:當(dāng)執(zhí)行DBCC SHOWCONTIG語(yǔ)句時(shí),SQL Server要求指定表的ID號(hào)或者索引的ID號(hào),表的ID號(hào)或者索引的ID號(hào)可以從系統(tǒng)表sysindexes中得到;應(yīng)該確定多長(zhǎng)時(shí)間使用一次DBCC SHOWCONTIG語(yǔ)句,這個(gè)時(shí)間長(zhǎng)度要根據(jù)表的活動(dòng)情況來(lái)定,每天、每周或者每月都可以。
使用DBCC DBREINDEX語(yǔ)句可以重建表的一個(gè)或者多個(gè)索引。當(dāng)希望重建索引和當(dāng)表上有主鍵約束或者唯一性鍵約束時(shí),也應(yīng)該執(zhí)行DBCC DBREINDEX語(yǔ)句。除此之外,執(zhí)行DBCC DBREINDEX語(yǔ)句還可以重新組織葉級(jí)索引頁(yè)的存儲(chǔ)空間、刪除碎塊和重新計(jì)算索引統(tǒng)計(jì)。當(dāng)使用DBCC DBREINDEX語(yǔ)句時(shí),應(yīng)該考慮這些因素:根據(jù)指定的填充度,系統(tǒng)重新填充每一個(gè)葉級(jí)頁(yè);使用DBCC DBREINDEX語(yǔ)句重建主鍵約束或者唯一性鍵約束的索引;使用SORTED_DATA_REORG選項(xiàng)可以更快地創(chuàng)建聚簇索引,如果沒(méi)有排列關(guān)鍵值,那么不能使用DBCC DBREINDEX語(yǔ)句;DBCC DBREINDEX語(yǔ)句不支持系統(tǒng)表。另外,還可以使用數(shù)據(jù)庫(kù)維護(hù)規(guī)劃向?qū)ё詣?dòng)地進(jìn)行重建索引的進(jìn)程。
統(tǒng)計(jì)信息是存儲(chǔ)在SQL Server中的列數(shù)據(jù)的樣本。這些數(shù)據(jù)一般地用于索引列,但是也可以為非索引列創(chuàng)建統(tǒng)計(jì)。SQL Server維護(hù)某一個(gè)索引關(guān)鍵值的分布統(tǒng)計(jì)信息,并且使用這些統(tǒng)計(jì)信息來(lái)確定在查詢進(jìn)程中哪一個(gè)索引是有用的。查詢的優(yōu)化依賴于這些統(tǒng)計(jì)信息的分布準(zhǔn)確度。查詢優(yōu)化器使用這些數(shù)據(jù)樣本來(lái)決定是使用表掃描還是使用索引。當(dāng)表中數(shù)據(jù)發(fā)生變化時(shí),SQL Server周期性地自動(dòng)修改統(tǒng)計(jì)信息。索引統(tǒng)計(jì)被自動(dòng)地修改,索引中的關(guān)鍵值顯著變化。統(tǒng)計(jì)信息修改的頻率由索引中的數(shù)據(jù)量和數(shù)據(jù)改變量確定。例如,如果表中有10000行數(shù)據(jù),1000行數(shù)據(jù)修改了,那么統(tǒng)計(jì)信息可能需要修改。然而,如果只有50行記錄修改了,那么仍然保持當(dāng)前的統(tǒng)計(jì)信息。除了系統(tǒng)自動(dòng)修改之外,用戶還可以通過(guò)執(zhí)行UPDATE STATISTICS語(yǔ)句或者sp_updatestats系統(tǒng)存儲(chǔ)過(guò)程來(lái)手工修改統(tǒng)計(jì)信息。使用UPDATE STATISTICS語(yǔ)句既可以修改表中的全部索引,也可以修改指定的索引。
使用SHOWPLAN和STATISTICS IO語(yǔ)句可以分析索引和查詢性能。使用這些語(yǔ)句可以更好地調(diào)整查詢和索引。SHOWPLAN語(yǔ)句顯示在連接表中使用的查詢優(yōu)化器的每一步以及表明使用哪一個(gè)索引訪問(wèn)數(shù)據(jù)。使用SHOWPLAN語(yǔ)句可以查看指定查詢的查詢規(guī)劃。當(dāng)使用SHOWPLAN語(yǔ)句時(shí),應(yīng)該考慮這些因素:SET SHOWPLAN_ALL語(yǔ)句返回的輸出結(jié)果比SET SHOWPLAN_TEXT語(yǔ)句返回的輸出結(jié)果詳細(xì),然而,應(yīng)用程序必須能夠處理SET SHOWPLAN_ALL語(yǔ)句返回的輸出結(jié)果;SHOWPLAN語(yǔ)句生成的信息只能針對(duì)一個(gè)會(huì)話,如果重新連接SQL Server,那么必須重新執(zhí)行SHOWPLAN語(yǔ)句。STATISTICS IO語(yǔ)句表明輸入輸出的數(shù)量,這些輸入輸出用來(lái)返回結(jié)果集和顯示指定查詢的邏輯和物理I/O的信息。可以使用這些信息來(lái)確定是否應(yīng)該重寫查詢語(yǔ)句或者重新設(shè)計(jì)索引。使用STATISTICS IO語(yǔ)句可以查看用來(lái)處理指定查詢的I/O信息。
就像SHOWPLAN語(yǔ)句一樣,優(yōu)化器隱藏也用來(lái)調(diào)整查詢性能。優(yōu)化器隱藏可以對(duì)查詢性能提供較小的改進(jìn),并且如果索引策略發(fā)生了改變,那么這種優(yōu)化器隱藏就毫無(wú)用處了。當(dāng)使用優(yōu)化器隱藏時(shí),考慮以下這些規(guī)則:指定索引名稱、當(dāng)index_id為0時(shí)為使用表掃描、當(dāng)index_id為1時(shí)為使用索引查找;優(yōu)化器隱藏覆蓋查詢優(yōu)化器,如果數(shù)據(jù)或者環(huán)境發(fā)生了變化,必須修改優(yōu)化器隱藏。
索引調(diào)整向?qū)?/p>
索引調(diào)整向?qū)且环N工具,可以分析一系列數(shù)據(jù)庫(kù)的查詢語(yǔ)句,提供使用一系列數(shù)據(jù)庫(kù)索引的建議,優(yōu)化整個(gè)查詢語(yǔ)句的性能。對(duì)于查詢語(yǔ)句,需要指定下列內(nèi)容:
●查詢語(yǔ)句。這是將要優(yōu)化的工作量。
●包含了這些表的數(shù)據(jù)庫(kù)。在這些表中,可以創(chuàng)建索引,提高查詢性能。
●在分析中使用的表。
●在分析中考慮的約束條件,例如索引可以使用的最大磁盤空間。
這里指的工作量可以來(lái)自兩個(gè)方面:使用SQL Server捕捉的軌跡和包含了SQL語(yǔ)句的文件。索引調(diào)整向?qū)Э偸腔谝粋€(gè)已經(jīng)定義好的工作量。如果一個(gè)工作量不能反映正常的操作,那么它建議使用的索引不是實(shí)際的工作量上性能最好的索引。索引調(diào)整向?qū)д{(diào)用查詢分析器,使用所有可能的組合評(píng)定在這個(gè)工作量中每一個(gè)查詢語(yǔ)句的性能。然后建議在整個(gè)工作量上可以提高整個(gè)查詢語(yǔ)句性能的索引。如果沒(méi)有供索引調(diào)整向?qū)?lái)分析的工作量,那么可以使用圖解器立即創(chuàng)建它。一旦決定跟蹤一條正常數(shù)據(jù)庫(kù)活動(dòng)的描述樣本,向?qū)軌蚍治鲞@種工作量和推薦能夠提高數(shù)據(jù)庫(kù)工作性能的索引配置。
索引調(diào)整向?qū)?duì)工作量進(jìn)行分析之后,可以查看到一系列的報(bào)告,還可以使該向?qū)Я⒓磩?chuàng)建所建議的最佳索引,或者使這項(xiàng)工作成為一種可以調(diào)度的作業(yè),或者生成一個(gè)包含創(chuàng)建這些索引的SQL語(yǔ)句的文件。
索引調(diào)整向?qū)г试S為SQL Server數(shù)據(jù)庫(kù)選擇和創(chuàng)建一種理想的索引組合和統(tǒng)計(jì),而不要求對(duì)數(shù)據(jù)庫(kù)結(jié)構(gòu)、工作量或者SQL Server內(nèi)部達(dá)到專家的理解程度。總之,索引調(diào)整向?qū)軌蜃鞯揭韵聨讉€(gè)方面的工作:
●通過(guò)使用查詢優(yōu)化器來(lái)分析查詢?nèi)蝿?wù)的工作量,向有大量工作量的數(shù)據(jù)庫(kù)推薦一種最佳的索引混合方式。
●分析按照建議作出改變之后的效果,包括索引的用法、表間查詢的分布和大量工作中查詢的工作效果。
●為少量查詢?nèi)蝿?wù)推薦調(diào)整數(shù)據(jù)庫(kù)的方法。
●通過(guò)設(shè)定高級(jí)選項(xiàng)如磁盤空間約束、最大的查詢語(yǔ)句數(shù)量和每個(gè)索引的最多列的數(shù)量等,允許定制推薦方式。
圖解器
圖解器能夠?qū)崟r(shí)抓取在服務(wù)器中運(yùn)行的連續(xù)圖片,可以選取希望監(jiān)測(cè)的項(xiàng)目和事件,包括Transact-SQL語(yǔ)句、批命令、對(duì)象的用法、鎖定、安全事件和錯(cuò)誤。圖解器能夠過(guò)濾這些事件,僅僅顯示用戶關(guān)心的問(wèn)題。可以使用同一臺(tái)服務(wù)器或者其他服務(wù)器重復(fù)已經(jīng)記錄的跟蹤事件,重新執(zhí)行那些已經(jīng)作了記錄的命令。通過(guò)集中處理這些事件,就能夠很容易監(jiān)測(cè)和調(diào)試SQL Server中出現(xiàn)的問(wèn)題。通過(guò)對(duì)特定事件的研究,監(jiān)測(cè)和調(diào)試SQL Server問(wèn)題變得簡(jiǎn)單多了。
查詢處理器
查詢處理器是一種可以完成許多工作的多用途的工具。在查詢處理器中,可以交互式地輸入和執(zhí)行各種Transact-SQL語(yǔ)句,并且在一個(gè)窗口中可以同時(shí)查看Transact-SQL語(yǔ)句和其結(jié)果集;可以在查詢處理器中同時(shí)執(zhí)行多個(gè)Transact-SQL語(yǔ)句,也可以執(zhí)行腳本文件中的部分語(yǔ)句;查詢處理器還提供了一種圖形化分析查詢語(yǔ)句執(zhí)行規(guī)劃的方法,可以報(bào)告由查詢處理器選擇的數(shù)據(jù)檢索方法,并且可以根據(jù)查詢規(guī)劃調(diào)整查詢語(yǔ)句的執(zhí)行,提出可以提高性能的優(yōu)化索引建議。這種建議只是針對(duì)一條查詢語(yǔ)句的索引建議,只能提高這一條查詢語(yǔ)句的查詢性能。
系統(tǒng)為每一個(gè)索引創(chuàng)建一個(gè)分布頁(yè),統(tǒng)計(jì)信息就是指存儲(chǔ)在分布頁(yè)上的某一個(gè)表中的一個(gè)或者多個(gè)索引的關(guān)鍵值的分布信息。當(dāng)執(zhí)行查詢語(yǔ)句時(shí),為了提高查詢速度和性能,系統(tǒng)可以使用這些分布信息來(lái)確定使用表的哪一個(gè)索引。查詢處理器就是依賴于這些分布的統(tǒng)計(jì)信息來(lái)生成查詢語(yǔ)句的執(zhí)行規(guī)劃。執(zhí)行規(guī)劃的優(yōu)化程度依賴于這些分布統(tǒng)計(jì)信息的準(zhǔn)確步驟的高低程度。如果這些分布的統(tǒng)計(jì)信息與索引的物理信息非常一致,那么查詢處理器可以生成優(yōu)化程度很高的執(zhí)行規(guī)劃。相反,如果這些統(tǒng)計(jì)信息與索引的實(shí)際存儲(chǔ)的信息相差比較大,查詢處理器生成的執(zhí)行規(guī)劃的優(yōu)化程度則比較低。
查詢處理器從統(tǒng)計(jì)信息中提取索引關(guān)鍵字的分布信息,除了用戶可以手工執(zhí)行UPDATE STATISTICS之外,查詢處理器還可以自動(dòng)收集統(tǒng)計(jì)這些分布信息。這樣,就能夠充分保證查詢處理器使用最新的統(tǒng)計(jì)信息,保證執(zhí)行規(guī)劃具有很高的優(yōu)化程度,減少了維護(hù)的需要。當(dāng)然,使用查詢處理器生成的執(zhí)行規(guī)劃也有一些限制。例如,使用執(zhí)行規(guī)劃只能提高單個(gè)查詢語(yǔ)句的性能,但是可能對(duì)整個(gè)系統(tǒng)的性能產(chǎn)生正面的或者負(fù)面的影響,因此,要想提高整個(gè)系統(tǒng)的查詢性能,應(yīng)該使用索引調(diào)整向?qū)н@樣的工具。
結(jié)論
在以前的SQL Server版本中,一個(gè)查詢語(yǔ)句對(duì)一個(gè)表最多使用一個(gè)索引。而在SQL Server 7.0中,索引操作得到了增強(qiáng)。SQL Server現(xiàn)在使用索引插入和索引聯(lián)合算法來(lái)實(shí)現(xiàn)在一個(gè)查詢語(yǔ)句中使用多個(gè)索引。共享的行標(biāo)識(shí)符用于連接同一個(gè)表上的兩個(gè)索引。如果某個(gè)表中有一個(gè)聚簇索引,因此有一個(gè)聚簇鍵,那么該表上的全部非聚簇索引的葉節(jié)點(diǎn)使用該聚簇鍵作為行定位器,而不是使用物理記錄標(biāo)識(shí)符。如果表中沒(méi)有聚簇索引,那么非聚簇索引繼續(xù)使用物理記錄標(biāo)識(shí)符指向數(shù)據(jù)頁(yè)。在上面的兩種情況中,行定位器是非常穩(wěn)定的。當(dāng)聚簇索引的葉節(jié)點(diǎn)分開時(shí),由于行定位器是有效的,所以非聚簇索引不需要被修改。如果表中沒(méi)有聚簇索引,那么頁(yè)的分開就不會(huì)發(fā)生。而在以前的版本中,非聚簇索引使用物理記錄標(biāo)識(shí)符如頁(yè)號(hào)和行號(hào),作為行的定位器。例如,如果聚簇索引(數(shù)據(jù)頁(yè))發(fā)生分解時(shí),許多記錄行被移動(dòng)到了一個(gè)新的數(shù)據(jù)頁(yè),因此有了多個(gè)新的物理記錄標(biāo)識(shí)符。那么,所有的非聚簇索引都必須使用這些新的物理記錄標(biāo)識(shí)符進(jìn)行修改,這樣就需要耗費(fèi)大量的時(shí)間和資源。
索引調(diào)整向?qū)o(wú)論對(duì)熟練用戶還是新用戶,都是一個(gè)很好的工具。熟練用戶可以使用該向?qū)?chuàng)建一個(gè)基本的索引配置,然后在基本的索引配置上面進(jìn)行調(diào)整和定制。新用戶可以使用該向?qū)Э焖俚貏?chuàng)建優(yōu)化的索引。
總結(jié)
- 上一篇: 回馈读者:赠花书一本!
- 下一篇: 独家干货 | 林轩田机器学习课程精炼笔记