日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Google怎么做(1.相关提示)

發(fā)布時間:2024/2/28 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Google怎么做(1.相关提示) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

/*版權(quán)聲明:可以任意轉(zhuǎn)載,轉(zhuǎn)載時請務必標明文章原始出處和作者信息 .*/

GOOGLE 的相關提示功能

?

中科院軟件所 張俊林

??? 2006年3月

?

在我以前發(fā)的帖子里面講過百度的相關提示功能是如何實現(xiàn)的,下面說說GOOGLE(http://googlechinablog.com/2006/04/blog-post_10.html)的相關提示如何實現(xiàn)的,你使用兩個搜索引擎并觀察一下兩個系統(tǒng)的相關提示就會發(fā)現(xiàn),GOOGLE的技術含量比百度高出很多.比如輸入查詢劉翔”,GOOGLE的相關提示足球”/”羅雪絹”/”姚明”/”田徑等等,而百度的相關提示是:”劉翔圖片”/”劉翔簡介等等.最大的區(qū)別是:百度的相關提示一定包含查詢本身,GOOGLE的相關提示視野要開闊很多.那么GOOGLE是如何做的?

GOOGLE有計算用戶相似需求的算法,并且依據(jù)這個算法來對用戶進行相關提示.基本步驟如下:

(1)?? 得到用戶查詢LOG文件作為輸入,其中包含大量不同用戶提交給搜索引擎的查詢;

(2)?? 首先將用戶查詢進行分類,假設LOG文件由以下三個域構(gòu)成

????????? QUERY?? USERID? TIMESTAMP

???????? QUERY:用戶提交的查詢

???????? USERID:用戶ID信息

????????? TMESTAMP:用戶提交查詢的時間信息??

?

(3)?? 對于用戶查詢進行排序,排序原則是首先按照用戶ID進行排序,對于同一用戶,將查詢按照時間進行排序;

(4)?? 在排好序列的LOG里面尋找滿足下列特征的集合:a.如果兩個查詢屬于同一用戶發(fā)出,b.而且兩個查詢在排序的LOG文件里面緊密相鄰,c.同時兩個查詢有部分詞匯相同;

(5)?? 此時,可以將兩個查詢中不同的詞匯看作可能的候選同義詞,這些同義詞用不同詞匯表達相似的信息需求;

(6)?? 統(tǒng)計這兩個候選同義詞在語料庫文件里面共現(xiàn)次數(shù),如果出現(xiàn)次數(shù)足夠大,則認為是屬于表達相似用戶需求的同義詞,否則認為不是同義詞;具體計算應該采用的是互信息的方法,也就是說首先計算兩個候選同義詞同時在語料庫里面出現(xiàn)次數(shù),然后計算每個候選詞匯單獨出現(xiàn)在語料庫里面面的次數(shù),然后計算互信息來確定;

(7)?? 將統(tǒng)計得出的同義詞作為用戶查詢相關信息提示的依據(jù);

?

總結(jié)

以上是生活随笔為你收集整理的Google怎么做(1.相关提示)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。