ad hoc检索 routing检索
ad hoc
類似于圖書館里的書籍檢索,即書籍庫(數(shù)據(jù)庫)相對穩(wěn)定不變,不同用戶的查詢要求是千變?nèi)f化的。這種檢索就稱為ad
hoc。基于Web的搜索引擎也屬于這一類。
routing
用戶的查詢要求相對穩(wěn)定。在routing中,查詢常常稱為profile,也就是通常所說的興趣,用戶的興趣在一段時間內(nèi)是穩(wěn)定不變的,但是數(shù)據(jù)庫(更確切的說,是數(shù)據(jù)流)是不斷變化的。這種任務(wù)很象我們所說的新聞定制什么的,比如用戶喜歡體育,這個興趣在一段時間內(nèi)是不變的,而體育新聞在不斷變化。
二者的關(guān)系和區(qū)別
- ad hoc和routing代表了IR的兩個不同研究方向。前者的主要研究任務(wù)包括對大數(shù)據(jù)庫的索引查詢、查詢的擴(kuò)展等等;而后者的主要任務(wù)不是索引,而是對用戶興趣的建模,即如何對用戶興趣建立合適的數(shù)學(xué)模型
隨著TREC的不斷進(jìn)行,TREC的任務(wù)有所變更,總的來說還是上面兩類,不過名稱有所變化,后者不再稱為routing,而是稱為filtering,routing本身成為filtering的一個子任務(wù),filtering還有其它兩個子任務(wù)adaptive
filtering 和 batch filtering。前者對每個用戶興趣(用topic描述)僅有很少的正例,甚至沒有
正例,后者給出的正例很多。adaptive filtering允許對用戶的興趣不斷反饋(adaptive的含義),batch
filtering因每次TREC的要求不同,有時可以反饋,有時不允許反饋。在不允許反饋的情況下,batch
filtering實際就是個靜態(tài)分類的過程。routing和batch filtering基本上一樣,不同的是,routing返回的
結(jié)果要排序,而batch filtering的結(jié)果是個集合,是不需要排序的,因為有排序,所以兩者的評測方法也不同。batch
filtering可以通過類recall/precision的方法進(jìn)行評估,而routing的評測方法與ad hoc任務(wù)有些相似,因為通常的
ad hoc任務(wù)的返回結(jié)果也是要求排序的。
現(xiàn)在ad hoc retrieval的研究重點(diǎn):
(1) 查詢(query)的擴(kuò)展(即如何使得query更貼近topic)和
(2) 匹配(相似度計算),
總結(jié)
以上是生活随笔為你收集整理的ad hoc检索 routing检索的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java基础----IO-----第四天
- 下一篇: 蓝桥杯算法训练KAc给糖果贪心-pyth