百度VS谷歌?搜索质量评判也要讲基本法
PMCAFF(pmcaff.com)是在中國(guó)非常流行的產(chǎn)品經(jīng)理社區(qū)。匯集160000+會(huì)員,8000+業(yè)界大咖,致力于為產(chǎn)品人提供專業(yè)的產(chǎn)品沙龍、課程培訓(xùn)、求職招聘等服務(wù)。
本文由PMCAFF會(huì)員凱撒撰寫,未經(jīng)許可,禁止轉(zhuǎn)載。
●?●?●
▍PMCAFF產(chǎn)品經(jīng)理社區(qū)的咖友提問:怎么做才能做出一款類似Google這樣全球性的搜索產(chǎn)品?
你眼里的360搜索和百度搜索體驗(yàn)效果是怎樣的?
1.單純做獨(dú)立搜索引擎產(chǎn)品來說,如果360搜索沒有其他360子產(chǎn)品的引流,能否比現(xiàn)在更好?
2.百度搜索是否就真的沒有優(yōu)點(diǎn)可提?
3.綜合以上,在符合國(guó)內(nèi)網(wǎng)絡(luò)環(huán)境下,如果給你足夠的技術(shù)、資金、政策支持,怎么做才能做出一款類似google這樣全球性的搜索產(chǎn)品?【不是在國(guó)內(nèi)一家獨(dú)大】
▍?凱撒? 知名第三方支付公司 營(yíng)銷
第三個(gè)問題有意思,想要做出和Google一樣的搜索產(chǎn)品,先想清楚Google比百度好在哪兒?
1、Google有可開關(guān)的“安全搜索”
什么意思?這是讓用戶根據(jù)自己喜好和可接受度來打開或關(guān)閉的。而百度,什么都不說,先主動(dòng)幫你和諧了一些內(nèi)容,遇到某些敏感詞的時(shí)候,再和諧一些內(nèi)容,然后這樣告訴你:根據(jù)相關(guān)法律法規(guī)和政策,部分搜索結(jié)果未予顯示。但從來不會(huì)告訴你是哪個(gè)法律和政策。而Google 移除有版權(quán)問題的搜索結(jié)果的時(shí)候,會(huì)告訴你所以的法律,移除了多少結(jié)果,申訴渠道。?
2、兩者所抓取的網(wǎng)頁數(shù)量差距比較大
Google是可以搜到幾乎整個(gè)互聯(lián)網(wǎng)的網(wǎng)站,而百度大多是局限于國(guó)內(nèi)(至于為啥,你們都懂的)。其他的搜索,諸如繁體內(nèi)容、外文內(nèi)容、視頻、圖片、學(xué)術(shù)等,兩個(gè)差距相差也比較大。
比如,可以試試Google的以圖搜圖比百度要精準(zhǔn)得多,返回的結(jié)果也更多。這個(gè)比的就是抓取的網(wǎng)頁數(shù)量的能力問題了。
由于抓取的內(nèi)容具有多樣性,所以Google這點(diǎn)上真的是用心,加上也有能力,去針對(duì)不同文化不同內(nèi)容做出更細(xì)致的篩選。例如,Google可篩選不同地區(qū)不同文字的網(wǎng)頁,百度這點(diǎn)弱了。
還有,Google也可以對(duì)圖片設(shè)置安全搜索、使用權(quán)限搜索,選項(xiàng)更多(如:視頻按不同畫質(zhì)搜索等)。?
3、Google夠?qū)W?/strong>
除了 YouTube,哥不去做別的內(nèi)容。而百度有百度百科、百度知道、百度文庫、百度貼吧等生產(chǎn)或搬運(yùn)的服務(wù)。這些網(wǎng)站在百度搜索中權(quán)重很高,百度既在做裁判,又在做運(yùn)動(dòng)員,是原創(chuàng)內(nèi)容的惡夢(mèng),同時(shí)這也是百度搜索質(zhì)量差的原因。
4、強(qiáng)行推廣哪家強(qiáng)
百度給我的感覺是,它總想讓人停留在百度所提供的內(nèi)容上面,不想跳轉(zhuǎn)到第三方網(wǎng)站,即使內(nèi)容是搬運(yùn)第三方的。
舉個(gè)例子,我們?cè)诎俣人阉鰽PP,顯示的是百度應(yīng)用的內(nèi)容,首頁經(jīng)常沒有Google play和蘋果商店,而谷歌的搜索頁面有Google play和蘋果商店(并有打分),也有豌豆莢等第三方商店頁面。
這告訴我們什么?似乎百度是有這一套“停留在百度所提供的內(nèi)容上面,不跳轉(zhuǎn)到第三方網(wǎng)站”的潛規(guī)則,以方便用戶之名,其實(shí)都是在硬推自己的東西。例如,搜文字內(nèi)容,經(jīng)常是百度百科而不是維基百科,互動(dòng)百科等其他來源。
不要一說到百度的時(shí)候就開始嘴炮!其實(shí)搜索引擎的搜索質(zhì)量是有量化標(biāo)準(zhǔn)的!
我還在搞SEO的時(shí)候,有簡(jiǎn)單學(xué)過一個(gè)叫Cranfield評(píng)論體系的東西,這里簡(jiǎn)單的聊一下
Cranfield評(píng)價(jià)體系有3個(gè)環(huán)節(jié)組成:
抽取代表性的查詢?cè)~,組成一個(gè)集合
針對(duì)查詢樣例的集合,從檢索系統(tǒng)的語料庫中尋找對(duì)應(yīng)的結(jié)果,進(jìn)行標(biāo)注(這塊依舊是人工來完成的,也難怪養(yǎng)活了不少做SEO的人- -)
把查詢?cè)~和帶有標(biāo)注信息的語料庫輸入檢索系統(tǒng),對(duì)系統(tǒng)反饋的檢索結(jié)果,使用預(yù)定義好的評(píng)價(jià)計(jì)算公式,用數(shù)值化的方法來評(píng)價(jià):檢索系統(tǒng)結(jié)果和標(biāo)注的理想結(jié)果的接近程度有多少?
Cranfield評(píng)價(jià)系統(tǒng)在各大搜索引擎公司內(nèi)有廣泛的應(yīng)用。
首先需要解決的問題是如何建一個(gè)查詢?cè)~集合。我了解過,查詢?cè)~可分為3類:尋址類查詢(Navigational)、信息類查詢(Informational)、事務(wù)類查詢(Transactional)。
而這三塊查詢內(nèi)容好像是有比例的,這個(gè)具體是多少,好像各大搜索都不一樣對(duì)應(yīng)的比例分別為
?Navigational : ≈12%
?Informational: ≈60%
?Transactional : ≈28%?
通常,這是從線上用戶的Query Log文件中自動(dòng)抽取的。除了上述查詢類型外,還可以考慮Query的頻次,對(duì)熱門query(高頻查詢)、長(zhǎng)尾query(中低頻)分別占特定的比例。搜索在抽取Query時(shí),往往Query的長(zhǎng)短也是一個(gè)待考慮的因素。
因?yàn)槎蘱uery(單term的查詢)和長(zhǎng)Query(多Term的查詢)排序算法往往會(huì)有一些不同。構(gòu)成查詢集合后,使用這些查詢?cè)~,在不同系統(tǒng)(例如對(duì)比百度和Google)或不同技術(shù)間(新舊兩套R(shí)anking算法的環(huán)境)進(jìn)行搜索,并對(duì)結(jié)果進(jìn)行評(píng)分,以決定優(yōu)劣。當(dāng)然還有MAP, DCG法, P@N方法, 等等等。
說了這么多,其實(shí)做搜索的在網(wǎng)頁檢索結(jié)果進(jìn)行評(píng)估,主要是圍繞精確率和召回率來做的,涉及的是這么幾點(diǎn):
相關(guān)性:query與結(jié)果說的是否一致?
需求強(qiáng)度:關(guān)鍵詞匹配
豐富度:是否詳細(xì)
時(shí)效性
便捷性:時(shí)間成本
權(quán)威度?
這6個(gè)方面在不同特征的query下,關(guān)注的重點(diǎn)有不一樣,不同維度適用的query范圍有所不同。
本文來自PMCAFF產(chǎn)品經(jīng)理社區(qū)(www.pmcaff.com),不代表PMCAFF觀點(diǎn)和立場(chǎng),未經(jīng)許可,禁止轉(zhuǎn)載。
●?●?●
最酷的產(chǎn)品經(jīng)理都在讀
20個(gè)頂尖產(chǎn)品經(jīng)理都在用的APP
微信充值頁面為啥長(zhǎng)這樣?(多圖)
知乎真的一天不如一天了嗎?
總結(jié)
以上是生活随笔為你收集整理的百度VS谷歌?搜索质量评判也要讲基本法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 8个直播底层支撑的创业机会,你都抓住了吗
- 下一篇: 特别企划 | 或许是史上最萌的产品经理改