PMCAFF微分享 | 京东首席搜索专家,告诉你电商搜索你不得不知道的秘密
本期主題 | 京東搜索下拉框產品個性化探索
分享時間 | 7月9日(周五)21:00
分享地點 | PMcaff B端產品經理群
進群方式 | 請加管理員微信:kit alt
【本期嘉賓】
商倩蘭 京東實戰派搜索專家,京東商學院特級講師,四年阿里巴巴平臺搜索排序產品設計經驗,現任京東搜索資深產品經理,擁有SEO實戰運作經驗,熟知京東、淘寶、天貓平臺搜索引擎規則。在電商搜索領域有過豐富的運營和產品設計經驗,擅長將電商平臺搜索從一做到十,目前被京東搜索團隊定位為京東的“鬼腳七”。
今天只講搜索引擎的一個小模塊,所以上半部分,先說搜索引擎的基礎模塊。這個圖是我給京東內部員工和我團隊產品經理培訓時畫的,目前網頁搜索、電商平臺類搜索,或各種名目繁多的垂直搜索,都可以簡單描述成這樣的結構。
抽象說,圍繞用戶搜索產品做四部分內容:
1、輔助用戶輸入,提升用戶表達需求的效率;
2、理解用戶意圖,對用戶輸入進行理解,涉及到自然語言、數據挖掘等知識,目前一般的的用戶輸入方式還是關鍵詞,語音、圖片等交互方式還沒有興起,都嘗試,尤其app、電視這種關鍵詞交互方式受制的客戶端,在積累對用戶交互的理解。但總歸需要對用戶輸入的東西進行理解,比如搜“紅豆”,在淘寶前面都是紅豆男裝,在京東都是糧油調味,這是不同平臺對大多數用戶需求的理解;
3、檢索返回內容,依據理解用戶意圖的模塊帶來的信息,進行精確的檢索和排序;
4、呈現,頁面結構、視覺和交互的設計來承載返回的內容。
今天的內容只是第1點中的一個產品
在阿里巴巴\淘寶叫smart suggestion,京東叫下拉框推薦,雅虎叫自動補全,起到輸入法的作用,提高搜索效率。因為推薦和搜索產品都是策略類產品,所以基本都跟數據挖掘有關,目前下拉框推薦詞的數據源有三部分組成。
淘寶、京東最開始都只采取most popular的數據策略,這樣雖然一個詞搜索量大,里面需求比較零散(基于消費者表達意思還是短詞多的現狀),可以最大程度滿足大多數人的需求。所以包含當前已經輸入在搜索框內容的詞列表,按pv從大到小排序,再加上一些反作弊策略即可應用。
我在搭建目前京東海外站搜索產品的時候,尤其英文站的下拉框推薦詞數據源,直接抓取亞馬遜的,再檢驗下載京東有商品即可,也是Most popular的策略。
最開始都是most popular,形成平臺上的馬太效應之后,流量不精準問題,必然想到走向個性化,比如在京東搜索框輸入“RY”,下拉框推薦詞都是榮耀,但在淘寶確有“R語言”的推薦詞。
策略類產品的不同,有時候不是因為兩邊技術的差異,而是平臺不同,消費者行為數據造成的,走向個性化,就是以上三個數據策略中的后兩項。
我們今晚小流量上線的設計就是挖掘session下數據,來探索實時個性化的策略。
如果用戶搜索了“nike錢包”,在下一次搜索中會搜 “adidas錢包” 的概率是704/4648 = 15.1%; 如果用戶在下一個Query中輸入 Adidas 應該提示 “Adidas 錢包”,同時去觀察同session下用戶的數據,需求是有趨同的意圖,類似這種:
所以,我們挖掘出很多詞對組成一份數據源,根據用戶上一步的關鍵詞表達實時推薦相關詞。舉一個例子:
這就是挖掘出來的詞對數據源,有了它之后,當用戶在一個session中前面有一個詞是“十三香”,當用戶在搜索框中輸入“五”這個字的時候,可以推薦“五香粉”給它,而沒有做實時個性化推薦前,所有京東用戶在搜索框輸入“五”的時候都看到一樣的下拉框推薦詞,都是這個:
產品假設、數據挖掘都是在用戶歷史行為中得出的猜想,今晚小流量上線了,等看后續數據。
【Q&A環節】
Q:session值是目前所有在線用戶同時搜索的這個關鍵詞么?可以理解SESSION CONTEXT就是找“尿布和啤酒”么?
A:必然不是,京東每天的session量是個很大的數,session是什么意思大家知道,數據挖掘,策略類產品不是特別好懂,就是訪問會話。進到www.jd.com,搜了n多詞,點擊了一堆商品,買或不買了幾個商品,然后關掉www.jd.com,session就結束了
Q:session值是目前所有在線用戶點擊的關鍵詞么?
A:不對,session會記錄所有用戶在你網站的行為,但因為搜索的產品,我們只用其中關鍵詞搜索來做嘗試。你們在京東任何地方,點了商品,再回到首頁后,有個推薦產品叫“猜你喜歡”都會變化。
Q:那可以理解為,根據一次會話的兩個詞共同出現次數(有序的),虛擬兩個詞之間的相關程度,然后根據已輸入的Q2的分詞,根據相關程度排序,按順序進行詞語推薦么?
A:根據所有搜過“十三香”的session中其他搜索詞數據,挖掘詞的相關關系。
Q:目前是否是用平臺上匯總的全部session來做的推薦?有結合當前用戶的畫像/分類/行為進一步精細化的計劃么?
A:如是是一兩個,那就沒有統計意義,但其實策略類產品很好玩,比如去年做過價格模型,加上業務的努力,京東服裝部的每日3000W RMB,提到到去年底的8000W。
Q:有搜索推薦入門書籍推薦嗎?
A:搜索推薦這類產品涉及很多知識,可以先從偏技術類書入門,對以后有好處。
【推薦書籍】
《這就是搜索引擎:核心技術詳解》
《解密搜索引擎技術實戰:Lucene&Java精華版》
【推薦閱讀】
PMcaff 2015上半年干貨精選
本文版權歸PMcaff產品經理社區,轉載請注明出處,商業使用請聯系PMcaff。
投稿請發送至郵箱:tougao@pmcaff.com
商務合作請聯系:xiaoxi@pmcaff.com
PMcaff合作媒體:Chinaz
總結
以上是生活随笔為你收集整理的PMCAFF微分享 | 京东首席搜索专家,告诉你电商搜索你不得不知道的秘密的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 功夫熊孟军贤:如何拿到10万种子用户,创
- 下一篇: PMcaff脉脉大咖分享会 | 走出BA