计算机检索技术与技巧的检索式为,第四章计算机检索技术和数据库检索方式.ppt...
第四章計算機(jī)檢索技術(shù)和數(shù)據(jù)庫檢索方式
第四章 計算機(jī)信息檢索的基本技術(shù)與方法 一、計算機(jī)信息檢索的基本技術(shù): 布爾邏輯、截詞檢索、加權(quán)檢索,位置算符等。 在進(jìn)行計算機(jī)檢索時,有時有一些比較復(fù)雜的課題,如:“GPS在建筑中的應(yīng)用”,既涉及GPS,又涉及建筑,還有“應(yīng)用”,這時候就要編制出滿足要求的計算機(jī)檢索式,它是機(jī)檢的基礎(chǔ)。 1布爾邏輯檢索(Boolean Logic Retrieval) 邏輯檢索的基礎(chǔ)是邏輯運算,邏輯運算中最常用的是布爾邏輯運算符(Boolean Logic Operators),即與、或、非三種運算符號,用它們可以表示概念之間的邏輯關(guān)系。 2 位置算符(Proximity Operators) 位置算符是表示檢索詞之間位置關(guān)系的一種運算符。由于英文對一句話有多種表達(dá)方法,寫法可能不同。如:“GPS在鐵路橋研究中的應(yīng)用”這個課題,用英文表達(dá)可能是“Using of GPS in Railway Bridge”, 也可能是“Using of GPS in Bridge of Railway”,因而可能編制出這樣的檢索式,GPS AND (Railway (2N)Bridge)我們可以通過位置檢索提高檢索的準(zhǔn)確率 (1) (W)算符與(nW)算符 W 是word與 with的縮寫。 特點:W詞序不變,中間不可插詞,但兩詞間可有一個標(biāo)點,連字符或空格。 nW詞序不變,中間可插入N 個詞。 如:potential (w) energy可能檢出potential energy and function 又如:gone (2w)wind 可能檢出gone with the wind (2) (N)與(nN)算符 N是near的縮寫 特點:N詞序不限,中間不可插詞,但兩詞間可有一個標(biāo)點,連字符或空格。 nN詞序不限,中間可插入N 個詞。 如:econom?? (2N)recovery可能檢出economic recovery,recovery of the economy, (3)同字段檢索A(F)B,F是field的縮寫。 特點:A、B兩詞必須出現(xiàn)在同一字段中,詞序與詞量不限。 如:environment (F)impact/DE,表示兩個詞必須同時出現(xiàn)在敘詞字段內(nèi)。 (4) 同句檢索A(S)B,S是sentence的縮寫。 特點:A、B出現(xiàn)在同一自然句中(子字段),其詞序與詞量不受限制。 如:electric (S)plant可檢出electric power plants如:EI中的NEAR;PQDD中的W/n (兩詞間距小于n個單詞,且前后位置任意),Pre/n (兩詞間距小于n個單詞,且前后位置一定) 3截詞算符(Truncating operators) 在英語詞匯中,一個詞可能有多種形態(tài),如詞的單、復(fù)數(shù)形式的不同,英美拼寫方法不同、詞性不同等。如果檢索時將這類詞全部輸入進(jìn)去,會增加檢索時間和費用,采用截詞法可解決這一問題。 所謂截詞檢索,是指在檢索標(biāo)識中保留相同的部分,用相應(yīng)的截詞符代替可變化部分。檢索中計算機(jī)會將所有含有相同部分標(biāo)識的記錄全部檢索出來。常用“?”、“*”符號表示。 (1)有限截詞。即在檢索詞后后截幾個有限的字母,如名詞的單復(fù)數(shù),動詞的詞尾變化等。如輸入computer??表示有0-1個字母變化,可檢出computer和computers. 輸入stud???表示截斷處有0-3個字母變化,可檢出study,studies,studied,studing. (2)無限截斷:在檢索詞后加一個“?“,表示該詞后可加任意個字符。使用無限截詞,所截詞根不能太短,否則會輸出許多無關(guān)文獻(xiàn),造成誤檢。 如:computer?可檢出computers,computering,computered,computerization. (3)中間截斷:在檢索詞中間加一個或幾個?號,主要解決一些英美拼寫不同,單復(fù)數(shù)形式的不同的詞的輸入,可簡化輸入。 如:輸入wom?n可檢出 woman,women 各種算符在數(shù)據(jù)庫中的實際應(yīng)用位置算符 1)EI NEAR Bridge NEAR Piling* 表示這兩個詞要彼此接近,前后順序不限。 W/n Pig*W/2pine*表示兩個詞的距離不能超過n個單詞 Adj Channel adj tunnel表示含有這兩個詞,兩個詞相鄰,位置一定 2)ISI Proceedings 用同句算符(SAME):如
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎總結(jié)
以上是生活随笔為你收集整理的计算机检索技术与技巧的检索式为,第四章计算机检索技术和数据库检索方式.ppt...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: layui获得列表json数据_gola
- 下一篇: 计算机科学是对描述和变换,对计算机科学发