深入浅出理解神经网络召回模型的优势
?
手機(jī)中的 App 每天為用戶提供海量的信息和資訊,而個(gè)性化的推薦方式猶如一條準(zhǔn)繩,把用戶的興趣點(diǎn)和期待感與平臺(tái)串聯(lián),迅速優(yōu)化用戶體驗(yàn)。
神策推薦作為一款基于用戶行為分析的全流程智能推薦產(chǎn)品,在提升用戶體驗(yàn)、促活促留存、提升核心業(yè)務(wù)指標(biāo)、提高 IT 的投入產(chǎn)出比等方面擁有極大的價(jià)值意義。本文將從神策推薦之深度學(xué)習(xí)模型的角度出發(fā),分享推薦模型中的奧秘與優(yōu)勢(shì)。
目前,幾種較為流行的推薦方式,下面為大家介紹一二。
一、人人推薦
就是從人口統(tǒng)計(jì)學(xué)的角度出發(fā),根據(jù)人與人之間的行為相似程度,來為用戶做出推薦。在這里舉個(gè)例子:
小張,女,25 歲,由于在春晚里看到了在眾人中獨(dú)自穿黑色西褲唱歌的吳磊,被特立獨(dú)行的氣質(zhì)吸引,遂在某電商平臺(tái)上瀏覽并搜索了許多與吳磊相關(guān)的周邊,最終下單購(gòu)買了吳磊的新版簽名寫真一本。
小李,女,19 歲,同樣在春晚中看到了新生演員吳磊,又覺得和自己年齡相仿,同樣在該電商平臺(tái)下單一本吳磊的最新版簽名寫真。在逛的同時(shí)又想起了說相聲的岳云鵬,于是又下單一套小岳岳的最新相聲選。
當(dāng) 25 歲的小趙在平臺(tái)搜索吳磊相關(guān)的周邊時(shí),由于小趙的基本信息與小張相似,于是平臺(tái)就向她推薦了和小張一樣的最新版簽名寫真。
這就是基于人與人之間的推薦方式,首先找到和小張有相似喜好與興趣的用戶群體,接著把這個(gè)“興趣”推給像小張一樣的小趙。
但一個(gè)很現(xiàn)實(shí)的問題在于,在推薦的時(shí)候還要剔除掉小趙已有的興趣產(chǎn)品,如果說小趙本身已經(jīng)擁有了一本吳磊的新版簽名寫真,那么她對(duì)平臺(tái)給她推薦的這款產(chǎn)品可能就會(huì)嗤之以鼻。另外,用戶并不擁有單一的產(chǎn)品興趣點(diǎn),當(dāng)興趣點(diǎn)與偏好足夠多且復(fù)雜時(shí),靠相似人群的推薦方式可能就不那么科學(xué)和合適。
二、物物推薦
物物推薦,即與上述的“人”的特性無關(guān),只通過“物”與“物”之間的方式傳遞推薦信息。同樣,舉個(gè)方便理解的例子:
小 A,喜愛看《瑯琊榜》,該劇的標(biāo)簽為:劇情,古裝,正午陽(yáng)光。
同時(shí),他又熱衷于看美劇《黑色童話》,該劇的標(biāo)簽為:驚悚,現(xiàn)代,美劇。
于是,當(dāng)《知否知否應(yīng)是綠肥紅瘦》出現(xiàn)的時(shí)候,平臺(tái)就把該劇推薦給了小 A,因?yàn)椤吨裰駪?yīng)是綠肥紅瘦》的標(biāo)簽為:劇情,古裝,正午陽(yáng)光。與他喜歡的《瑯琊榜》相似,應(yīng)該會(huì)比較符合小?A 的口味。
這樣的推薦方式需要十分了解“物品”的標(biāo)簽,對(duì)于標(biāo)簽的產(chǎn)生源與準(zhǔn)確性同樣存在一些不可避免的問題。引用神策數(shù)據(jù)架構(gòu)師房東雨在神策 2018 數(shù)據(jù)驅(qū)動(dòng)大會(huì)現(xiàn)場(chǎng)的發(fā)言內(nèi)容,此類推薦方式存在的缺點(diǎn)如下:
1. 標(biāo)簽的粒度如果很粗,推薦結(jié)果將受影響。
2. 不同標(biāo)簽的產(chǎn)生者會(huì)對(duì)標(biāo)簽賦予不同的含義,運(yùn)營(yíng)、用戶、機(jī)器等標(biāo)簽的產(chǎn)生方式都會(huì)對(duì)推薦結(jié)果造成影響。
3. 因?yàn)橐?guī)則量化不準(zhǔn)確,會(huì)產(chǎn)生拍腦袋做決定的現(xiàn)象。
4. 探索性和擴(kuò)展性受到標(biāo)簽的限制。假如小 A 觀看的視頻平臺(tái)中沒有“正午陽(yáng)光”這個(gè)標(biāo)簽,那么這樣的劇就會(huì)被劃到其他的類別中。
不管是人人推薦,還是物物推薦,我們都可以將其歸類在協(xié)同過濾的推薦方式中,協(xié)同過濾的推薦方法以興趣為根據(jù),不需要人工進(jìn)行標(biāo)簽的檢查和更新,盡管面臨冷啟動(dòng)困難等問題,但其仍是目前較為有效的推薦方法之一。
詳細(xì)信息可參考原文《神策數(shù)據(jù)房東雨:精準(zhǔn)推薦的場(chǎng)景和實(shí)踐》。
三、科學(xué)合理的神策推薦之深度學(xué)習(xí)模型
在對(duì)目前的推薦體系進(jìn)行深度研究之后,深度學(xué)習(xí)召回模型擁有更科學(xué)的技術(shù)支撐和更合理的推薦方式,其優(yōu)勢(shì)性較為突出。
圖片來源:谷歌發(fā)布的《Deep Neural Networks for YouTube Recommendations 》論文
首先,神策推薦的結(jié)果分為兩個(gè)階段,召回和排序,其實(shí)很好理解。
第一,召回,以內(nèi)容類產(chǎn)品為例。在平臺(tái)浩如煙海的文章中,為了使用戶對(duì)平臺(tái)產(chǎn)生強(qiáng)大的粘性,第一步就要先為平臺(tái)用戶召回一些他可能感興趣的內(nèi)容。神策推薦一天可為用戶推薦的文章量級(jí)為 10 萬篇,10 萬篇文章可能橫跨十幾個(gè)類別,如體育、歷史、娛樂、政治、社會(huì)等,當(dāng)我們發(fā)現(xiàn)一名用戶對(duì)“體育”和“歷史”類的文章非常感興趣后,在召回階段就會(huì)將該用戶不感興趣的類別過濾掉。
第二,排序。當(dāng)我們帶領(lǐng)用戶進(jìn)行完召回階段之后,接著會(huì)通過機(jī)器學(xué)習(xí)的方法對(duì)每一篇文章進(jìn)行點(diǎn)擊的預(yù)估,之后利用更多的特征和更多的數(shù)據(jù)去完成排序這件事情。
我們可以根據(jù)興趣召回或者根據(jù)熱門事件召回一些內(nèi)容,而不同的召回方法并不是有序存在的,需要通過排序的方式對(duì)其進(jìn)行整理。當(dāng)然,它仍要基于數(shù)據(jù)的準(zhǔn)確采集以及整合。
其次,深度學(xué)習(xí)召回模型相比協(xié)同過濾等其他推薦方式,存在較為明顯的優(yōu)勢(shì)。
優(yōu)勢(shì) 1——更全面的行為表達(dá)
神策推薦所采用的深度學(xué)習(xí)方式能夠更加全面地表達(dá)用戶的行為。在傳統(tǒng)的協(xié)同過濾中,大多依賴于用戶的點(diǎn)擊行為,對(duì)于用戶沒有點(diǎn)擊的部分,幾乎不能對(duì)其進(jìn)行一些整合和分析,舉一個(gè)簡(jiǎn)單的電商場(chǎng)景實(shí)例。
比如,用戶小王在情節(jié)人前夕在某電商平臺(tái)中搜索玫瑰花,之后頁(yè)面彈出許多玫瑰花的信息,但正當(dāng)小王準(zhǔn)備點(diǎn)開第二行第三列的某個(gè)品牌的玫瑰花商品詳情時(shí),突然接到領(lǐng)導(dǎo)的開會(huì)通知,便迅速拿起筆記本去參加會(huì)議。
在這個(gè)案例中,小王只是進(jìn)行了搜索,并沒有點(diǎn)擊任何玫瑰花產(chǎn)品相關(guān)的內(nèi)容,如果運(yùn)用傳統(tǒng)的協(xié)同過濾方式,沒辦法在后續(xù)的推薦中對(duì)用戶沒有產(chǎn)生點(diǎn)擊行為的產(chǎn)品進(jìn)行推薦。而深度學(xué)習(xí)召回模型可以考慮到用戶的搜索情況,當(dāng)小王搜索了玫瑰花之后,就能接收到類似“小王準(zhǔn)備購(gòu)買玫瑰花”的信息。深度學(xué)習(xí)模型能夠更全面地表達(dá)用戶的相關(guān)行為,它用足夠大的拓展度的韌性去為推薦市場(chǎng)發(fā)揮自己的優(yōu)勢(shì)。
優(yōu)勢(shì) 2——可添加畫像特征
可添加畫像特征指的是,深度學(xué)習(xí)模型可以融合一些與用戶相關(guān)的年齡、性別、地域等屬性特征,把這些額外的標(biāo)簽聚合到模型中去。舉一個(gè)簡(jiǎn)單的電商場(chǎng)景實(shí)例。
電商平臺(tái)每天除了給老客戶推薦各類產(chǎn)品之外,不能忘記還有一批人群——新注冊(cè)用戶。假設(shè)我們知道用戶的性別,即使他們從未在平臺(tái)上發(fā)生過相關(guān)購(gòu)買行為,那么也能根據(jù)他們的畫像標(biāo)簽進(jìn)行相關(guān)產(chǎn)品的推薦,比如為女性推薦化妝品,為男性推薦籃球鞋等,這是傳統(tǒng)的物物推薦無法做到的。
優(yōu)勢(shì) 3——包含行為順序
盡管我們做了召回,但并不代表只要最終結(jié)果符合用戶的相關(guān)偏好,我們就可以對(duì)其進(jìn)行推送。舉一個(gè)視頻平臺(tái)的場(chǎng)景實(shí)例。
當(dāng)用戶小 A 在平臺(tái)看完《知否知否應(yīng)是綠肥紅瘦》的第 15 集后,她更愿意看到平臺(tái)為她推送第 16 集的內(nèi)容,而不是第 3 集或第 22 集。
神策推薦行為順序相關(guān)的學(xué)習(xí)能力,在邏輯上與用戶保持一致性,它的整體表達(dá)能力將比傳統(tǒng)的推薦模式更為優(yōu)秀與合理。
優(yōu)勢(shì) 4——組合復(fù)雜特征
神經(jīng)網(wǎng)絡(luò)可以進(jìn)行更復(fù)雜的特征組合,挖掘更深層次的關(guān)聯(lián)關(guān)系,當(dāng)試圖尋找用戶的特性以及其相關(guān)行為背后的蛛絲馬跡時(shí),神策推薦的數(shù)學(xué)化的語言和思路將是優(yōu)選,這是協(xié)同過濾無法完成的任務(wù)與無法達(dá)到的高度。
第三,根據(jù)客戶的需求方向,神策推薦根據(jù)數(shù)據(jù)算法可提供 3 種優(yōu)質(zhì)的排序模型。
在上述?3?種排序模型當(dāng)中,后兩種為深度學(xué)習(xí)模型,但這并非意味著越復(fù)雜的模型對(duì)客戶的使用價(jià)值就越大。神策推薦根據(jù)客戶的方案與需求,以及機(jī)器配置和技術(shù)能力,圍繞對(duì)方數(shù)據(jù)采集、建模、分析、反饋的閉環(huán)流程,緊貼客戶業(yè)務(wù)實(shí)踐,完成排序模型的搭建與使用。
在數(shù)據(jù)方面,神策推薦基于神策分析大、全、細(xì)、時(shí)四個(gè)維度采集數(shù)據(jù),保證用戶數(shù)據(jù)的全端采集,以及標(biāo)簽體系和用戶畫像的建立,依托神策分析強(qiáng)大的數(shù)據(jù)采集與分析功能,從根源上保證數(shù)據(jù)的準(zhǔn)確性與時(shí)效性。
在算法方面,神策推薦擁有豐富的算法建模經(jīng)驗(yàn),同時(shí)可實(shí)時(shí)進(jìn)行數(shù)據(jù)反饋,并根據(jù)算法結(jié)果對(duì)模型進(jìn)行有效迭代。并且,強(qiáng)大的多指標(biāo)分析能力將會(huì)從底層開始助力企業(yè)核心業(yè)務(wù)指標(biāo)的提升。
在安全層面,神策推薦系統(tǒng)提供私有化部署方案,科學(xué)智能的部署方式保證各項(xiàng)用戶行為數(shù)據(jù)的安全可信,同時(shí),神策推薦遵守互聯(lián)網(wǎng)大數(shù)據(jù)中安全的安全規(guī)則,為用戶數(shù)據(jù)安全提供保障。
在行業(yè)發(fā)展層面,神策推薦系統(tǒng)秉承神策數(shù)據(jù)一貫的開放性,將開源的“白盒”概念放在人人可近觀討論的桌面之上,相比傳統(tǒng)的數(shù)據(jù)黑盒,開放包容的空杯心態(tài)將持續(xù)推動(dòng)推薦系統(tǒng)的優(yōu)化迭代以及行業(yè)的迅速發(fā)展。
四、深度學(xué)習(xí)召回模型下的“冷啟動(dòng)不冷”
在推薦的相關(guān)事項(xiàng)當(dāng)中,冷啟動(dòng)一直是一個(gè)逃不開的話題,冷啟動(dòng)之所以難啟,中心問題大多集中在新用戶并沒有任何行為使用痕跡。通常的解決方式比如依靠人口統(tǒng)計(jì)學(xué)信息,對(duì)相關(guān)屬性的用戶進(jìn)行不同類別的推薦,或是在新用戶的初始頁(yè)面放入各類興趣按鈕,供用戶選擇。
除此之外,神策推薦的冷啟動(dòng)圍繞“新用戶”和“新內(nèi)容”兩方面,進(jìn)行解決。
在內(nèi)容層面,以新聞資訊為例,可利用自然語言處理技術(shù)去做個(gè)性化規(guī)劃,針對(duì)資訊類的文本內(nèi)容完成個(gè)性化推薦。
在用戶層面,在客戶擁有外部數(shù)據(jù)的情況下,比如用戶申請(qǐng)注冊(cè)時(shí)填寫的相關(guān)信息等,神策推薦可將這類信息做深度的整合與關(guān)聯(lián),挖掘內(nèi)部相關(guān)性,與最終推薦結(jié)果進(jìn)行關(guān)聯(lián)。例如,當(dāng)外部數(shù)據(jù)顯示該用戶手機(jī)中裝有多款旅行 App 時(shí),那在進(jìn)行推薦結(jié)果的計(jì)算與分析時(shí),可能就會(huì)向游記、攻略等內(nèi)容靠攏。
而當(dāng)沒有外部數(shù)據(jù)的情況時(shí),根據(jù)客戶本身的需求,神策推薦可提供個(gè)性化的推薦方案,客戶的需求包括但不限于用戶類別、用戶層級(jí)、用戶屬性占比等。綜合考慮平臺(tái)用戶的多樣性與大眾性,助力企業(yè)平臺(tái)的全景戰(zhàn)略規(guī)劃。
盡管深度學(xué)習(xí)召回模型的算法模式優(yōu)勢(shì)顯著,但若想讓深度學(xué)習(xí)充分發(fā)揮其該有的萬丈光芒,還需在基礎(chǔ)數(shù)據(jù)上做足功夫。
首先,充分保證數(shù)據(jù)的準(zhǔn)確性。神策分析為神策推薦提供扎實(shí)的數(shù)據(jù)采集與分析能力,立足全局的全埋點(diǎn)為數(shù)據(jù)的深挖與分析提供良好的保障。“重分析,輕采集”是許多從業(yè)者的通病,以偏概全地執(zhí)著于某種埋點(diǎn)方式,以及雜亂無序的采集方式,都注定會(huì)將后期的演進(jìn)與發(fā)展變成虛無縹緲的空中樓閣,即使擁有強(qiáng)有力的技術(shù)團(tuán)隊(duì),也無法將深度學(xué)習(xí)模型的精髓落地于業(yè)務(wù)實(shí)踐。
其次,業(yè)務(wù)需求與深度學(xué)習(xí)模型的契合對(duì)接。深度學(xué)習(xí)模型與業(yè)務(wù)需求的完美結(jié)合,直接關(guān)系到推薦業(yè)務(wù)對(duì)用戶實(shí)際意義的價(jià)值大小,業(yè)務(wù)需求和數(shù)據(jù)模型搭建的無縫轉(zhuǎn)譯,是數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)結(jié)果的關(guān)鍵環(huán)節(jié),更是基于客戶的業(yè)務(wù)客觀條件、設(shè)備處理能力、資源投入的現(xiàn)實(shí)考慮。
最后,良好的技術(shù)能力是系統(tǒng)性整合的支撐。常見的推薦模型與分析思路在形式上和初始理念上都擁有極大的共通性,評(píng)價(jià)在這些共性模式狀態(tài)下展開的線條是否流暢,很大程度關(guān)乎技術(shù)人員的實(shí)力及問題處理水平,模型是否能表達(dá)用戶的實(shí)際價(jià)值,以及是否能真正驅(qū)動(dòng)業(yè)務(wù)。
更多互聯(lián)網(wǎng)干貨和案例,可關(guān)注【神策數(shù)據(jù)】公眾號(hào)了解~
總結(jié)
以上是生活随笔為你收集整理的深入浅出理解神经网络召回模型的优势的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 页面浏览事件之 $AppViewScre
- 下一篇: 神策数据 VP 张涛:个性化推荐从入门到