日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

mssqlserver fulltext全文检索分析

發布時間:2023/12/15 综合教程 30 生活家
生活随笔 收集整理的這篇文章主要介紹了 mssqlserver fulltext全文检索分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章介紹mssqlserver fulltext全文檢索分析的主要是,全文索引只有在sql2000以后才能使用,有需要的朋友可要注意哦。

like '%關鍵詞%',后者則是將一段文字分詞以后對每個詞進行搜索。

具體語法:
contains:

代碼如下 復制代碼

SELECT 字段1,字段2
FROM 表名
WHERE contains(字段,'"詞一" or "詞二"')

根據查找結果的相似度排序

代碼如下 復制代碼
SELECT 字段1,字段2
FROM 表名
inner join containstable(表名, 字段,'"詞一" or "詞二"',10) as k
on 表名.id = k.[key]
order by k.RANK DESC

freetext:

代碼如下 復制代碼

SELECT 字段1,字段2
FROM 表名
WHERE freetext(字段,'詞一詞二')

根據查找結果的相似度排序

代碼如下 復制代碼
SELECT 字段1,字段2
FROM 表名
inner join freetexttable(表名, 字段,'詞一詞二',10) as k
on 表名.id = k.[key]
order by k.RANK DESC

上文中freetexttable或containstable的10表示取10條數據

最近搜索了一下全文檢索,發現了一些問題,現在總結如下:

全文索引和查詢概念(摘自SQL 聯機幫助)

全文索引、查詢和同步化最主要的設計要求是,在注冊進行全文檢索的所有表上都有一個唯一的全文鍵列(或者單列主鍵)。全文索引對使用的重要字及其所在位置進行跟蹤。

例如,假定有一個對 DevTools 表的全文索引。全文索引可能指出在 Abstract 列的第 423 個和第 982 個單詞處找到了單詞 Microsoft,所在的行與 ProductID 6 關聯。該索引結構支持對所有包含被索引單詞的項進行有效檢索,以及高級檢索操作,如短語檢索和鄰近檢索。

為防止全文索引因包含很多對檢索沒有幫助的詞而變得臃腫,a、and、is 或 the 這類額外的詞都忽略不計。例如,指定"the products ordered during these summer months"與指定"products ordered during summer months"是一樣的。有這兩個字符串的行都會被返回。

目錄 MssqlFtdataSqlserverConfig 下提供了多種語言的干擾詞列表。在安裝帶有全文檢索支持的 Microsoft® SQL Server™ 時會創建這個目錄,并同時安裝干擾詞文件。干擾詞文件可以編輯。例如,高技術公司的系統管理員可以把單詞 computer 添加到他們的干擾詞表中去。(如果編輯干擾詞文件,則必須在更改生效之前重新填充全文目錄。)下表顯示了干擾詞文件及其相應的語言。

干擾詞文件 語言
-------------- ---------
Noise.chs 簡體中文
Noise.cht 繁體中文
Noise.dat 語言中性
Noise.deu 德語
Noise.eng 英語(英國)
Noise.enu 英語(美國)
Noise.esn 西班牙語
Noise.fra 法語
Noise.ita 意大利語
Noise.jpn 日語
Noise.kor 韓文
Noise.nld 荷蘭語
Noise.sve 瑞典語

在處理全文查詢時,檢索引擎將滿足檢條件的行的鍵值返回給 Microsoft SQL Server。比如有一個 SciFi 表,其中 Book_No 列是主鍵列。

代碼如下 復制代碼

Book_No Writer Title
-------- ----------- --------------------------
A025 Asimov Foundation's Edge
A027 Asimov Foundation and Empire
C011 Clarke Childhood's End
V109 Verne Mysterious Island

假定想使用一個全文檢索查詢來查找包含單詞 Foundation 的書名。在本例中,將從全文索引獲得值 A025 和 A027。然后 SQL Server 用這些鍵值和其它欄的信息響應該查詢。

下表顯示了存儲全文索引數據所使用的語言。這些語言基于 SQL Server 安裝期間選擇的 Unicode 排序規則區域設置標識符。

Unicode 排序規則區域設置標識符 全文數據存儲所用的語言
------------------------------- -----------------------
中文注音符號(臺灣) 繁體中文
漢語拼音 簡體中文
中文筆畫 簡體中文
中文筆畫(臺灣) 繁體中文
荷蘭語 荷蘭語
英語(英國) 英語(英國)
法語 法語
通用 Unicode 英語(美國)
德語 德語
德文電話簿 德語
意大利語 意大利語
日語 日語
日語 Unicode 日語
韓文 韓文
韓文 Unicode 韓文
西班牙語(現代) 西班牙語
瑞典/芬蘭語 瑞典語

此列表中沒有的其它所有 Unicode 排序規則區域設置標識符值都映射到使用空格分隔單詞的中性語言單詞的斷字符和詞干分隔符。

說明 Unicode 排序規則區域設置標識符設置用于所有可進行全文索引的數據類型(如 char、nchar 等)。如果為 char、varchar 或 text 類型列的排序次序設置的語言類型,不是 Unicode 排序規則區域設置標識符語言,那么在對 char、varchar 和 text 類型的列進行全文索引和查詢時,仍然使用 Unicode 排序規則區域設置標識符值。

創建全文索引(以索引image列為例,其他類型字段大致一樣)

標題 全文索引image列,全攻略!
作者 pengdali [原作]
關鍵字 全文索引 image

今天“百年不遇”的停電了,看了一天書。晚上搞了一下全文索引,決定把心得貼出來,我盡量寫的詳細,大家共同學習,歡迎指正!

1、啟動 Microsoft Search 服務
開始菜單-->SQL程序組-->服務管理器-->下拉筐-->Microsoft Search 服務-->啟動它

2、
..Microsoft SQL ServerMSSQLFTDATASQLServerConfig目錄里建一個非空noise.chs文件
非空noise.chs文件,也有人說是空的noise.chs文件,但我每次都往里寫幾個沒用的字母。

3、建立環境
打開查詢分析器-->執行下列腳本:
--------------------------------------------

代碼如下 復制代碼

create database test ---創建test
use test ---選擇test數據庫
create table dali (ID int not null primary key,MyImage image,FileType varchar(255),FileNmae varchar(255)) ---創建dali表
--dali表中 Id,MyImage,FileType 三列是必須的,因為要對image列索引的話,必須要有一個主鍵列,一個image列,一個存放文件類型的列
--我們知道在windows系統中文件類型是靠擴展名來區分的所以FileType列也就是用來放 文件的擴展名
--------------------------------------------

sp_fulltext_database 'enable' --為全文索引啟用數據庫
sp_fulltext_catalog 'My_FullDir', 'create' ---創建一個叫My_FullDif的全文目錄

declare @Key sysname ; @Key=c.name from syscolumns a,sysconstraints b,sysobjects c where a.id=object_id('dali') and a.name='ID' and a.id=b.id and b.constid=c.id and c.name like 'PK%'
exec sp_fulltext_table 'dali','create','My_FullDir',@Key ----這兩句是為全文索引,對表進行標記

sp_fulltext_column 'dali','MyImage','add',0x0804,'FileType' ---這句是指定MyImage列為全文索引列,FileType是類型列

------------------------------------------------
4、在c盤下放一個擴展名為doc的word文件,一個擴展名為xls的excel文件,一個擴展名為htm的網頁文件,個擴展名為bmp的圖片
共4個,大家可根據實際情況放入!

5、插入數據
建立下面這個存儲過程

代碼如下 復制代碼

--------------------------------------------------
CREATE PROCEDURE sp_textcopy
@srvname varchar (30),
@login varchar (30),
@password varchar (30),
@dbname varchar (30),
@tbname varchar (30),
@colname varchar (30),
@filename varchar (30),
@whereclause varchar (40),
@direction char(1)
AS
/* 這是使用textcopy工具將文件插入到數據庫中,如果有前臺工具可以用前臺開發工具將文件插入,這里為了演示 */
DECLARE @exec_str varchar (255)
SELECT @exec_str='textcopy /S '+@srvname+' /U '+@login+' /P '+@password+' /D '+@dbname+' /T'+@tbname+' /C '+@colname+' /W"'+@whereclause+'" /F"'+@filename+'" /'+@direction
EXEC master..xp_cmdshell @exec_str
----------------------------------------------------

insert dali values(1,0x,'doc','大力的doc') ---其中第二列是 0x 它是一個16進制數對應image列,是必須的,不要寫null,第三列是文件類型,既擴展名

sp_textcopy '你的服務器名','sa','你的密碼','test','dali','MyImage','c:大力的doc.doc','where ID=1','I'
-------依次參數是:實例名,用戶名,密碼,數據庫名,表名,image列名,路徑及文件名,條件(你必須保證它只選擇一行),I
---------------------------------------------------------------------------------------------------------------------
insert dali values(2,0x,'bmp','圖片')
sp_textcopy '你的服務器名','sa','你的密碼','test','dali','MyImage','c:圖片.bmp','where ID=2','I' --注意條件是 ID=2

insert dali values(3,0x,'xls','Excel文件')
sp_textcopy '你的服務器名','sa','你的密碼','test','dali','MyImage','c:Excel文件.xls','where ID=3','I' --注意條件是 ID=3

insert dali values(4,0x,'htm','網頁')
sp_textcopy '你的服務器名','sa','你的密碼','test','dali','MyImage','c:網頁.htm','where ID=4','I' --注意條件是 ID=4

----------上面的語句,要保證類型一樣,路徑正確,條件唯一正確應該就可以了

6、填充全文索引

代碼如下 復制代碼

sp_fulltext_table 'dali','start_full' ---第一個參數是表名,第二個參數是啟動表的全文索引的完全填充

7、可以開始你的實驗了

代碼如下 復制代碼

select * from dali where contains(MyImage,'J老師')

select * from dali where contains(MyImage,'海老師')

------END----------
--調試環境:SQLServer2000企業版、Windows2000高級服務器

全文索引中的幾個問題:

1.搜索時出現錯誤:
服務器: 消息 7619,級別 16,狀態 1,行 2
查詢子句只包含被忽略的詞

這種情況修改 MssqlFtdataSqlserverConfig 下對應語言的干擾詞列表文件

2.修改了干擾詞文件,查詢中文時仍然出現上述問題
a.首先檢查你的SQL有沒有安裝最新的補丁,檢查的方法是在查詢分析器中運行:
select @@version
如果出來的版本號是8.00.760以下,則表明你未安裝sp3的補丁,要裝上.

SQL補丁下載:
x?displaylang=zh-cn&FamilyID=9032f608-160a-4537-a2b6-4cb265b80766">http://www.microsoft.com/downloads/details.aspx?displaylang=zh-cn&FamilyID=9032f608-160a-4537-a2b6-4cb265b80766

注意下載后,執行的時候是解壓,要在解壓后的目錄中執行setup.bat才是真正的安裝

b.配置全文索引時,單詞斷字符選擇"中文(中國)"

c.Noise.chs文件中至少有一個單詞,例如:?

d.如果在全文檢索時,你能正常修改干擾詞文件,說明你的全文檢索沒有使用上這個文件
如果你配置的全文檢索應該要用到這個文件,那就在
企業管理器--展開你的數據庫--右鍵全文目錄--重建全部全文目錄

3.表中的數據改變后,檢索不到
方法1. 右鍵你的表--全文索引表--啟用增量填充
方法2. 右鍵你的表--全文索引表--更改跟蹤,這樣以后的修改會自動填充(有一定延遲)

先看一個實例sql2005的

代碼如下 復制代碼

--查看當前數據庫狀態 1為已經啟用了全文索引
SELECT DATABASEPROPERTY ('數據庫名','IsFulltextEnabled')
--打開FullText功能
execute sp_fulltext_databse 'enable'
--關閉此功能
execute sp_fulltext_databse 'disable'
--創建全文索引目錄
--刪除全文目錄 DROP FULLTEXT 目錄名
CREATE FULLTEXT CATALOG 目錄名
-- 每個表只可以有一個全文索引,存放在指定的索引目錄里,可以通過向導創建,也可以通過SQL創建
-- indexname是指已存在的基于指定表的唯一索引名.而不是唯一索引列名.如果索引不存在,需要先創建唯一索引.
--刪除全文索引 DROP FULLTEXT INDEX ON 表名
CREATE FULLTEXT INDEX ON 名稱
(索引1,索引2...)
KEY INDEX indexname ON 表名
--全文索引查詢
Select * from 表名
where contains( 列名, ' "202*" or "2*" ')
Select * from 表名
where FREETEXT( 列名, ' "202*" and "2*" ')
/*注:
FREETEXT語句的功能是在一個表的所有列或指定列中搜索一個自由文本格式的字符串,并
返回與該字符串匹配的數據行。所以,FREETEXT語句所執行的功能又稱做自由式全文查詢。

CONTAINS語句的功能
是在表的所有列或指定列中搜索:一個字或短語;一個字或短語的前綴;與一個字相近的另一
個字;一個字的派生字;一個重復出現的字。
*/

總結

以上是生活随笔為你收集整理的mssqlserver fulltext全文检索分析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。