百度VS谷歌?搜索质量评判也要讲基本法
PMCAFF(pmcaff.com)是在中國非常流行的產品經理社區。匯集160000+會員,8000+業界大咖,致力于為產品人提供專業的產品沙龍、課程培訓、求職招聘等服務。
本文由PMCAFF會員凱撒撰寫,未經許可,禁止轉載。
●?●?●
▍PMCAFF產品經理社區的咖友提問:怎么做才能做出一款類似Google這樣全球性的搜索產品?
你眼里的360搜索和百度搜索體驗效果是怎樣的?
1.單純做獨立搜索引擎產品來說,如果360搜索沒有其他360子產品的引流,能否比現在更好?
2.百度搜索是否就真的沒有優點可提?
3.綜合以上,在符合國內網絡環境下,如果給你足夠的技術、資金、政策支持,怎么做才能做出一款類似google這樣全球性的搜索產品?【不是在國內一家獨大】
▍?凱撒? 知名第三方支付公司 營銷
第三個問題有意思,想要做出和Google一樣的搜索產品,先想清楚Google比百度好在哪兒?
1、Google有可開關的“安全搜索”
什么意思?這是讓用戶根據自己喜好和可接受度來打開或關閉的。而百度,什么都不說,先主動幫你和諧了一些內容,遇到某些敏感詞的時候,再和諧一些內容,然后這樣告訴你:根據相關法律法規和政策,部分搜索結果未予顯示。但從來不會告訴你是哪個法律和政策。而Google 移除有版權問題的搜索結果的時候,會告訴你所以的法律,移除了多少結果,申訴渠道。?
2、兩者所抓取的網頁數量差距比較大
Google是可以搜到幾乎整個互聯網的網站,而百度大多是局限于國內(至于為啥,你們都懂的)。其他的搜索,諸如繁體內容、外文內容、視頻、圖片、學術等,兩個差距相差也比較大。
比如,可以試試Google的以圖搜圖比百度要精準得多,返回的結果也更多。這個比的就是抓取的網頁數量的能力問題了。
由于抓取的內容具有多樣性,所以Google這點上真的是用心,加上也有能力,去針對不同文化不同內容做出更細致的篩選。例如,Google可篩選不同地區不同文字的網頁,百度這點弱了。
還有,Google也可以對圖片設置安全搜索、使用權限搜索,選項更多(如:視頻按不同畫質搜索等)。?
3、Google夠專注
除了 YouTube,哥不去做別的內容。而百度有百度百科、百度知道、百度文庫、百度貼吧等生產或搬運的服務。這些網站在百度搜索中權重很高,百度既在做裁判,又在做運動員,是原創內容的惡夢,同時這也是百度搜索質量差的原因。
4、強行推廣哪家強
百度給我的感覺是,它總想讓人停留在百度所提供的內容上面,不想跳轉到第三方網站,即使內容是搬運第三方的。
舉個例子,我們在百度搜索APP,顯示的是百度應用的內容,首頁經常沒有Google play和蘋果商店,而谷歌的搜索頁面有Google play和蘋果商店(并有打分),也有豌豆莢等第三方商店頁面。
這告訴我們什么?似乎百度是有這一套“停留在百度所提供的內容上面,不跳轉到第三方網站”的潛規則,以方便用戶之名,其實都是在硬推自己的東西。例如,搜文字內容,經常是百度百科而不是維基百科,互動百科等其他來源。
不要一說到百度的時候就開始嘴炮!其實搜索引擎的搜索質量是有量化標準的!
我還在搞SEO的時候,有簡單學過一個叫Cranfield評論體系的東西,這里簡單的聊一下
Cranfield評價體系有3個環節組成:
抽取代表性的查詢詞,組成一個集合
針對查詢樣例的集合,從檢索系統的語料庫中尋找對應的結果,進行標注(這塊依舊是人工來完成的,也難怪養活了不少做SEO的人- -)
把查詢詞和帶有標注信息的語料庫輸入檢索系統,對系統反饋的檢索結果,使用預定義好的評價計算公式,用數值化的方法來評價:檢索系統結果和標注的理想結果的接近程度有多少?
Cranfield評價系統在各大搜索引擎公司內有廣泛的應用。
首先需要解決的問題是如何建一個查詢詞集合。我了解過,查詢詞可分為3類:尋址類查詢(Navigational)、信息類查詢(Informational)、事務類查詢(Transactional)。
而這三塊查詢內容好像是有比例的,這個具體是多少,好像各大搜索都不一樣對應的比例分別為
?Navigational : ≈12%
?Informational: ≈60%
?Transactional : ≈28%?
通常,這是從線上用戶的Query Log文件中自動抽取的。除了上述查詢類型外,還可以考慮Query的頻次,對熱門query(高頻查詢)、長尾query(中低頻)分別占特定的比例。搜索在抽取Query時,往往Query的長短也是一個待考慮的因素。
因為短query(單term的查詢)和長Query(多Term的查詢)排序算法往往會有一些不同。構成查詢集合后,使用這些查詢詞,在不同系統(例如對比百度和Google)或不同技術間(新舊兩套Ranking算法的環境)進行搜索,并對結果進行評分,以決定優劣。當然還有MAP, DCG法, P@N方法, 等等等。
說了這么多,其實做搜索的在網頁檢索結果進行評估,主要是圍繞精確率和召回率來做的,涉及的是這么幾點:
相關性:query與結果說的是否一致?
需求強度:關鍵詞匹配
豐富度:是否詳細
時效性
便捷性:時間成本
權威度?
這6個方面在不同特征的query下,關注的重點有不一樣,不同維度適用的query范圍有所不同。
本文來自PMCAFF產品經理社區(www.pmcaff.com),不代表PMCAFF觀點和立場,未經許可,禁止轉載。
●?●?●
最酷的產品經理都在讀
20個頂尖產品經理都在用的APP
微信充值頁面為啥長這樣?(多圖)
知乎真的一天不如一天了嗎?
總結
以上是生活随笔為你收集整理的百度VS谷歌?搜索质量评判也要讲基本法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 8个直播底层支撑的创业机会,你都抓住了吗
- 下一篇: 特别企划 | 或许是史上最萌的产品经理改