日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

百度VS谷歌?搜索质量评判也要讲基本法

發布時間:2025/3/20 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 百度VS谷歌?搜索质量评判也要讲基本法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

PMCAFF(pmcaff.com)是在中國非常流行的產品經理社區。匯集160000+會員,8000+業界大咖,致力于為產品人提供專業的產品沙龍、課程培訓、求職招聘等服務。

本文由PMCAFF會員凱撒撰寫,未經許可,禁止轉載。

●?●?●

PMCAFF產品經理社區的咖友提問:怎么做才能做出一款類似Google這樣全球性的搜索產品?

你眼里的360搜索和百度搜索體驗效果是怎樣的?

1.單純做獨立搜索引擎產品來說,如果360搜索沒有其他360子產品的引流,能否比現在更好?

2.百度搜索是否就真的沒有優點可提?

3.綜合以上,在符合國內網絡環境下,如果給你足夠的技術、資金、政策支持,怎么做才能做出一款類似google這樣全球性的搜索產品?【不是在國內一家獨大】

?凱撒? 知名第三方支付公司 營銷

第三個問題有意思,想要做出和Google一樣的搜索產品,先想清楚Google比百度好在哪兒?

1、Google有可開關的“安全搜索”

什么意思?這是讓用戶根據自己喜好和可接受度來打開或關閉的。而百度,什么都不說,先主動幫你和諧了一些內容,遇到某些敏感詞的時候,再和諧一些內容,然后這樣告訴你:根據相關法律法規和政策,部分搜索結果未予顯示。但從來不會告訴你是哪個法律和政策。而Google 移除有版權問題的搜索結果的時候,會告訴你所以的法律,移除了多少結果,申訴渠道。?

2、兩者所抓取的網頁數量差距比較大

Google是可以搜到幾乎整個互聯網的網站,而百度大多是局限于國內(至于為啥,你們都懂的)。其他的搜索,諸如繁體內容、外文內容、視頻、圖片、學術等,兩個差距相差也比較大。

比如,可以試試Google的以圖搜圖比百度要精準得多,返回的結果也更多。這個比的就是抓取的網頁數量的能力問題了。


由于抓取的內容具有多樣性,所以Google這點上真的是用心,加上也有能力,去針對不同文化不同內容做出更細致的篩選。例如,Google可篩選不同地區不同文字的網頁,百度這點弱了。

還有,Google也可以對圖片設置安全搜索、使用權限搜索,選項更多(如:視頻按不同畫質搜索等)。?

3、Google夠專注

除了 YouTube,哥不去做別的內容。而百度有百度百科、百度知道、百度文庫、百度貼吧等生產或搬運的服務。這些網站在百度搜索中權重很高,百度既在做裁判,又在做運動員,是原創內容的惡夢,同時這也是百度搜索質量差的原因。

4、強行推廣哪家強

百度給我的感覺是,它總想讓人停留在百度所提供的內容上面,不想跳轉到第三方網站,即使內容是搬運第三方的。


舉個例子,我們在百度搜索APP,顯示的是百度應用的內容,首頁經常沒有Google play和蘋果商店,而谷歌的搜索頁面有Google play和蘋果商店(并有打分),也有豌豆莢等第三方商店頁面。

這告訴我們什么?似乎百度是有這一套“停留在百度所提供的內容上面,不跳轉到第三方網站”的潛規則,以方便用戶之名,其實都是在硬推自己的東西。例如,搜文字內容,經常是百度百科而不是維基百科,互動百科等其他來源。

不要一說到百度的時候就開始嘴炮!其實搜索引擎的搜索質量是有量化標準

我還在搞SEO的時候,有簡單學過一個叫Cranfield評論體系的東西,這里簡單的聊一下


Cranfield評價體系有3個環節組成

  • 抽取代表性的查詢詞,組成一個集合

  • 針對查詢樣例的集合,從檢索系統的語料庫中尋找對應的結果,進行標注(這塊依舊是人工來完成的,也難怪養活了不少做SEO的人- -)

  • 把查詢詞和帶有標注信息的語料庫輸入檢索系統,對系統反饋的檢索結果,使用預定義好的評價計算公式,用數值化的方法來評價:檢索系統結果和標注的理想結果的接近程度有多少?

Cranfield評價系統在各大搜索引擎公司內有廣泛的應用。

首先需要解決的問題是如何建一個查詢詞集合。我了解過,查詢詞可分為3類:尋址類查詢(Navigational)、信息類查詢(Informational)、事務類查詢(Transactional)

而這三塊查詢內容好像是有比例的,這個具體是多少,好像各大搜索都不一樣對應的比例分別為

  • ?Navigational : ≈12%

  • ?Informational: ≈60%

  • ?Transactional : ≈28%?

通常,這是從線上用戶的Query Log文件中自動抽取的。除了上述查詢類型外,還可以考慮Query的頻次,對熱門query(高頻查詢)、長尾query(中低頻)分別占特定的比例。搜索在抽取Query時,往往Query的長短也是一個待考慮的因素。

因為短query(單term的查詢)和長Query(多Term的查詢)排序算法往往會有一些不同。構成查詢集合后,使用這些查詢詞,在不同系統(例如對比百度和Google)或不同技術間(新舊兩套Ranking算法的環境)進行搜索,并對結果進行評分,以決定優劣。當然還有MAP, DCG法, P@N方法, 等等等。

說了這么多,其實做搜索的在網頁檢索結果進行評估,主要是圍繞精確率和召回率來做的,涉及的是這么幾點:

  • 相關性:query與結果說的是否一致?

  • 需求強度:關鍵詞匹配

  • 豐富度:是否詳細

  • 時效性

  • 便捷性:時間成本

  • 權威度?

這6個方面在不同特征的query下,關注的重點有不一樣,不同維度適用的query范圍有所不同。

本文來自PMCAFF產品經理社區(www.pmcaff.com),不代表PMCAFF觀點和立場,未經許可,禁止轉載。

●?●?●

最酷的產品經理都在讀

20個頂尖產品經理都在用的APP

微信充值頁面為啥長這樣?(多圖)

知乎真的一天不如一天了嗎?

總結

以上是生活随笔為你收集整理的百度VS谷歌?搜索质量评判也要讲基本法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。