日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪(fǎng)問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 运维知识 > windows >内容正文

windows

腾讯看点投放系统介绍:推荐系统的进化伙伴

發(fā)布時(shí)間:2024/2/28 windows 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 腾讯看点投放系统介绍:推荐系统的进化伙伴 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

大家好,我叫陳鵬,來(lái)自騰訊。

前三位老師講得都很有深度,干貨滿(mǎn)滿(mǎn)。相比于前三位老師的深度,我今天分享的主題將會(huì)輕松一些,主要跟大家介紹騰訊看點(diǎn)在投放系統(tǒng)的探索,沒(méi)有學(xué)術(shù)和深刻的原理,也沒(méi)有目錄,這里只有故事,跟著我的 PPT 一起開(kāi)啟一段故事吧。

在介紹投放系統(tǒng)之前,我想做個(gè)簡(jiǎn)單的調(diào)查,有多少人用過(guò)信息流產(chǎn)品?比如騰訊看點(diǎn)、今日頭條等等。還挺多,那再問(wèn)一下,在瀏覽信息流的時(shí)候,有多少人看到過(guò)令自己反感的內(nèi)容?發(fā)現(xiàn)剛剛舉手的同學(xué)基本也都舉了手。這說(shuō)明信息流中出現(xiàn)低質(zhì)內(nèi)容還是件挺常見(jiàn)的事,那該如何解決呢?這其實(shí)是一件很難的事情,我們信息流的同學(xué)一直都在探索,其中投放系統(tǒng)就是探索的產(chǎn)物之一。

要說(shuō)投放系統(tǒng),推薦系統(tǒng)是繞不開(kāi)的,因?yàn)橥斗畔到y(tǒng)就是為了解決推薦系統(tǒng)的問(wèn)題而誕生的。那什么是推薦系統(tǒng)呢?剛剛潘老師已經(jīng)做了非常詳細(xì)和深入的講解,我這里就簡(jiǎn)化一下。

大家想象一下,現(xiàn)在有一位用戶(hù)打開(kāi)了信息流產(chǎn)品,那接下來(lái)會(huì)發(fā)生什么?前端會(huì)去請(qǐng)求后臺(tái),后臺(tái)又會(huì)去請(qǐng)求推薦系統(tǒng),推薦系統(tǒng)再去內(nèi)容池翻箱倒柜,找?guī)灼@名用戶(hù)最有可能喜歡的內(nèi)容。那推薦系統(tǒng)是怎么知道用戶(hù)喜歡什么類(lèi)型的內(nèi)容的呢?用戶(hù)畫(huà)像,每名用戶(hù)身上都會(huì)有一些標(biāo)簽,表示喜歡或者討厭什么,比如這名用戶(hù)的畫(huà)像顯示他比較喜歡王者榮耀、財(cái)經(jīng)、體育等等。每篇內(nèi)容也都有自己的標(biāo)簽,表示這是什么樣的內(nèi)容。推薦系統(tǒng)要做的呢,就是將用戶(hù)和內(nèi)容相互匹配,比如這名用戶(hù)的畫(huà)像里有“王者榮耀”,那么推薦系統(tǒng)就會(huì)給他推薦王者榮耀的內(nèi)容。

小結(jié)一下,推薦系統(tǒng)做的事呢,就是將用戶(hù)信息和內(nèi)容信息互相匹配,然后將匹配的結(jié)果推薦給用戶(hù),就是推薦結(jié)果。這樣會(huì)有什么問(wèn)題嗎?如果這是一名新用戶(hù),沒(méi)有畫(huà)像,那應(yīng)該怎么辦呢?推薦系統(tǒng)有一個(gè)內(nèi)容池,專(zhuān)門(mén)給這些新用戶(hù)準(zhǔn)備的,因?yàn)檫@里面的內(nèi)容是機(jī)器篩選的,所以不乏一些標(biāo)題黨、擦邊球的內(nèi)容,用戶(hù)看到這類(lèi)內(nèi)容時(shí),雖然眉頭一皺,但還是經(jīng)常忍不住去點(diǎn)擊,不點(diǎn)不打緊,就這么一點(diǎn),誤會(huì)大了,推薦系統(tǒng)就會(huì)認(rèn)為這名用戶(hù)喜歡這類(lèi)內(nèi)容,后面就會(huì)使勁給用戶(hù)推類(lèi)似的內(nèi)容,用戶(hù)雖然很反感,但又忍不住不看,所以就會(huì)形成惡性循環(huán),等到用戶(hù)失去耐心的時(shí)候,就不會(huì)再用這款產(chǎn)品了。

那如何打破這種惡性循環(huán)呢?一種方式是人為干預(yù),機(jī)器可能會(huì)傻乎乎給你推送看似受歡迎實(shí)際比較低質(zhì)的內(nèi)容,但我們的運(yùn)營(yíng)同學(xué)只會(huì)精選優(yōu)質(zhì)內(nèi)容,然后連同推薦系統(tǒng)給的結(jié)果一起推送給用戶(hù),那這樣用戶(hù)是不是就可以看到優(yōu)質(zhì)內(nèi)容了呢?

現(xiàn)在再來(lái)看請(qǐng)求數(shù)據(jù)的過(guò)程,用戶(hù)訪(fǎng)問(wèn)信息流產(chǎn)品時(shí),前端會(huì)向后臺(tái)請(qǐng)求,跟之前不同的是,這時(shí)后臺(tái)會(huì)向混排層請(qǐng)求,混排層一方面跟推薦系統(tǒng)請(qǐng)求推薦結(jié)果,比如推薦系統(tǒng)推薦了兩篇跟王者榮耀有關(guān)的內(nèi)容;另一方面混排層會(huì)查詢(xún)一下運(yùn)營(yíng)同學(xué)有沒(méi)有人工推薦的內(nèi)容,比如這里運(yùn)營(yíng)同學(xué)人工推薦了這篇跟《三十而已》有關(guān)的內(nèi)容。混排層收到推薦系統(tǒng)和運(yùn)營(yíng)配置的內(nèi)容后,根據(jù)一定規(guī)則混合排列兩邊的數(shù)據(jù),然后再將數(shù)據(jù)一起返回給前端用戶(hù)。這樣用戶(hù)就可以看到推薦同學(xué)精選的優(yōu)質(zhì)內(nèi)容了。

我們繼續(xù)追問(wèn),這樣做會(huì)有什么問(wèn)題嗎?內(nèi)容是好內(nèi)容,但不一定所有人都喜歡,比如剛剛說(shuō)的,運(yùn)營(yíng)同學(xué)推薦了《三十而已》的內(nèi)容,但其實(shí)會(huì)有相當(dāng)一部分用戶(hù)并不喜歡。每個(gè)曝光機(jī)會(huì)都很重要,特別是前幾條,用戶(hù)如果不喜歡《三十而已》,那就不會(huì)去點(diǎn)擊,勢(shì)必會(huì)導(dǎo)致大盤(pán)數(shù)據(jù)的下跌。那該怎么辦呢?如果我們能夠提高運(yùn)營(yíng)推送的準(zhǔn)確性,把不同的優(yōu)質(zhì)內(nèi)容推送給那些大概率會(huì)感興趣的用戶(hù)那里,那是不是就既能解決大盤(pán)數(shù)據(jù)下跌,又能解決運(yùn)營(yíng)給用戶(hù)推送優(yōu)質(zhì)內(nèi)容的問(wèn)題了呢?

那如何提高運(yùn)營(yíng)推送的準(zhǔn)確性呢?秘訣就是我們今天的主角:投放系統(tǒng)。投放系統(tǒng)所做的工作,用一句話(huà)概括就是,把運(yùn)營(yíng)同學(xué)認(rèn)為優(yōu)質(zhì)的內(nèi)容盡可能準(zhǔn)確地投放給那些可能感興趣的用戶(hù)。這里面有兩個(gè)要點(diǎn),第一,投放什么內(nèi)容?第二,內(nèi)容投放給什么用戶(hù)?分別來(lái)看。

第一要點(diǎn),投放什么內(nèi)容。投放系統(tǒng)投放的內(nèi)容也是經(jīng)過(guò)入庫(kù)服務(wù)后進(jìn)入到內(nèi)容池的那些內(nèi)容,我們的運(yùn)營(yíng)同學(xué)會(huì)在內(nèi)容池中挑選出優(yōu)質(zhì)的內(nèi)容,并且把它們進(jìn)行歸類(lèi)。運(yùn)營(yíng)同學(xué)會(huì)根據(jù)他們的需要將這些優(yōu)質(zhì)內(nèi)容聚合在一起,這些根據(jù)一定規(guī)則聚合的內(nèi)容被稱(chēng)為“興趣點(diǎn)”,這里的規(guī)則可以指同一個(gè)賬號(hào)、同一個(gè)品類(lèi)、同一個(gè)主題、同一個(gè)話(huà)題等等等等,只要我們的運(yùn)營(yíng)同學(xué)認(rèn)為有相同點(diǎn),就可以把這些內(nèi)容聚合在一起。我們舉些例子,著名歌手胡夏就是一個(gè)賬號(hào),品類(lèi)的話(huà)比如美食品類(lèi),主題的話(huà)比如漫威,話(huà)題的話(huà)比如最近非常火的《三十而已》,這里的“胡夏”、“美食”、“漫威”、“三十而已”都是興趣點(diǎn)。我們可以看到,興趣點(diǎn)的劃分實(shí)際上沒(méi)有什么規(guī)則,粒度可大可小,維度靈活多樣。小結(jié)一下,投放系統(tǒng)投放的內(nèi)容是以興趣點(diǎn)作為維度的,興趣點(diǎn)是一個(gè)抽象的概念,代表相同種類(lèi)的內(nèi)容。

說(shuō)完第一個(gè)要點(diǎn),那繼續(xù)說(shuō)第二個(gè)要點(diǎn):內(nèi)容投放給什么用戶(hù)?我們剛剛說(shuō)到,內(nèi)容是按照一定的相同點(diǎn)聚合在一起的,投放系統(tǒng)的工作就是把這類(lèi)內(nèi)容投放給可能感興趣的用戶(hù)。說(shuō)到這里,我們可以更好地看出把內(nèi)容聚合在一起的好處了,為一篇內(nèi)容找到目標(biāo)用戶(hù)是很困難的,但為一類(lèi)內(nèi)容找到目標(biāo)用戶(hù)就簡(jiǎn)單許多。

說(shuō)回內(nèi)容應(yīng)該投放給什么用戶(hù),一開(kāi)始投放系統(tǒng)其實(shí)也不知道,但是它會(huì)不斷地探索,找到目標(biāo)消費(fèi)者。針對(duì)每一個(gè)興趣點(diǎn),投放系統(tǒng)會(huì)試探性地給一些用戶(hù)投放這個(gè)興趣點(diǎn)里面的內(nèi)容,拿《三十而已》這個(gè)興趣點(diǎn)舉例,假設(shè)投放系統(tǒng)每天會(huì)給一批用戶(hù)投放5篇左右《三十而已》的內(nèi)容,有的用戶(hù)對(duì)這個(gè)話(huà)題不感興趣,可能一條都不會(huì)點(diǎn),有的用戶(hù)就比如我知道這么個(gè)話(huà)題,持中立態(tài)度,可能會(huì)點(diǎn)一兩篇看一下,而有的用戶(hù)如果是《三十而已》的忠誠(chéng)粉絲,那很可能四五篇都會(huì)點(diǎn)。投放系統(tǒng)有一套算法,會(huì)根據(jù)用戶(hù)的點(diǎn)擊情況打分,將用戶(hù)分成非受眾、相關(guān)用戶(hù)和核心用戶(hù)三類(lèi)。這是第一天的情況,投放系統(tǒng)會(huì)針對(duì)每一個(gè)興趣點(diǎn)圈出一部分用戶(hù)進(jìn)行探索,然后根據(jù)探索結(jié)果將用戶(hù)分成這個(gè)興趣點(diǎn)的非受眾、相關(guān)用戶(hù)和核心用戶(hù)三種類(lèi)別。那第二天、第三天,一直持續(xù)探索,是不是就可以在茫茫人海中圈出這個(gè)興趣點(diǎn)越來(lái)越多的相關(guān)用戶(hù)和核心用戶(hù)了呢?確實(shí)是的,而這兩類(lèi)用戶(hù)正是這個(gè)興趣點(diǎn)的重要資產(chǎn)。

當(dāng)一個(gè)興趣點(diǎn)剛剛創(chuàng)建的時(shí)候,它是沒(méi)有任何相關(guān)用戶(hù)或者核心用戶(hù)的,那我們就需要去探索,哪些用戶(hù)可能對(duì)這個(gè)興趣點(diǎn)感興趣。那怎么探索呢?一種方法就是隨機(jī)探索,隨便選一些用戶(hù),然后給他們投放內(nèi)容,毫無(wú)疑問(wèn),這樣的效率肯定很低。有沒(méi)有效率更高的方式呢?這里挑三種方法給大家介紹一下,分別是:人工探索、機(jī)器探索和策略匹配。

先來(lái)看人工探索。無(wú)論玩過(guò)沒(méi)玩過(guò),相信很多人應(yīng)該知道地下城與勇士這款游戲,最近呢,地下城與勇士的手游將要上線(xiàn),不過(guò)我們不談?dòng)螒?#xff0c;只談?dòng)捎螒蜓苌龅膬?nèi)容。新款手游的上線(xiàn)肯定會(huì)產(chǎn)生很多相關(guān)的優(yōu)質(zhì)內(nèi)容,我們的運(yùn)營(yíng)同學(xué)敏銳地抓住了這一點(diǎn),提前在投放系統(tǒng)里面創(chuàng)建了一個(gè)叫“地下城與勇士手游”的興趣點(diǎn)。問(wèn)題來(lái)了,內(nèi)容有了,目標(biāo)用戶(hù)呢?不要慌,我們運(yùn)營(yíng)同學(xué)的專(zhuān)業(yè)經(jīng)驗(yàn)就能派上用場(chǎng)了,他們會(huì)定幾個(gè)篩選條件,比如性別、年齡、收入等等,然后篩選出最有可能喜歡“地下城與勇士手游”的用戶(hù),比如性別選擇男性、年齡選擇15-35歲之間,地域選擇一線(xiàn)城市、操作系統(tǒng)選擇不限、收入水平選擇月薪8000以上、用戶(hù)標(biāo)簽選擇游戲動(dòng)漫類(lèi)的。設(shè)定的這些條件,大大提高了探索的準(zhǔn)確性,這就是人工探索的基本原理。

那我們的運(yùn)營(yíng)同學(xué)是如何知道用戶(hù)的性別、年齡這些信息的呢?用戶(hù)畫(huà)像。目前我們用到的畫(huà)像有兩類(lèi),一類(lèi)是騰訊看點(diǎn)自己的用戶(hù)畫(huà)像,比如財(cái)經(jīng)、動(dòng)漫、時(shí)尚等等,另一類(lèi)是其他業(yè)務(wù)的用戶(hù)畫(huà)像。比如IEG游戲畫(huà)像、騰訊視頻畫(huà)像、QQ音樂(lè)畫(huà)像等等。小結(jié)一下,人工探索是依賴(lài)于運(yùn)營(yíng)專(zhuān)業(yè)經(jīng)驗(yàn)的一種探索興趣點(diǎn)新用戶(hù)的投放方式。

說(shuō)完人工探索,我們繼續(xù)看機(jī)器探索。我們剛剛提到,當(dāng)一個(gè)興趣點(diǎn)剛剛創(chuàng)建的時(shí)候沒(méi)有核心用戶(hù)或者相關(guān)用戶(hù),經(jīng)過(guò)運(yùn)營(yíng)同學(xué)的篩選圈定一部分用戶(hù)進(jìn)行探索后,這個(gè)興趣點(diǎn)會(huì)沉淀一些核心用戶(hù)和相關(guān)用戶(hù),我們用藍(lán)色的小人表示。所謂物以類(lèi)聚人以群分,這部分用藍(lán)色表示的用戶(hù)一定有一些共同的特征,我們把這些共同的特征提取出來(lái),然后在大盤(pán)里找具有這些特征的用戶(hù),再把他們篩選出來(lái)作為我們的探索用戶(hù)。這些探索用戶(hù)是機(jī)器算法篩選出來(lái)的,所以被稱(chēng)為機(jī)器探索。小結(jié)一下,機(jī)器探索是依賴(lài)機(jī)器算法的一種探索興趣點(diǎn)新用戶(hù)的投放方式。

以上是機(jī)器探索,我們繼續(xù)看策略匹配。假設(shè)有一名用戶(hù)在QQ里面搜索了“地下城與勇士”,我們是不是很自然地認(rèn)為這名用戶(hù)對(duì)“地下城與勇士”感興趣呢?那這名用戶(hù)當(dāng)仁不讓地成了“地下城與勇士手游”這個(gè)興趣點(diǎn)的探索用戶(hù)。這名用戶(hù)搜索的時(shí)候,觸發(fā)了我們一條具體的策略:“搜索地下城與勇士”,這里搜索是行為,地下城與勇士是關(guān)鍵詞,搜索某個(gè)關(guān)鍵詞就是我們的一種策略。策略就是觸發(fā)特定信號(hào)的行為,目前我們?cè)O(shè)置了六種策略,當(dāng)然我們一直在探索其他的策略。每個(gè)興趣點(diǎn)話(huà)可能會(huì)設(shè)置一些策略,如果觸發(fā)了這些策略,就會(huì)成為這個(gè)興趣點(diǎn)的探索用戶(hù)。

以上就是我們采用的其中三種探索策略:人工探索、機(jī)器探索和策略匹配。

對(duì)于每個(gè)興趣點(diǎn)來(lái)說(shuō),投放系統(tǒng)每天會(huì)探索出一批可能對(duì)這個(gè)興趣點(diǎn)感興趣的用戶(hù),然后給他們投放幾篇這個(gè)興趣點(diǎn)里面的內(nèi)容。有的用戶(hù)一篇沒(méi)點(diǎn),就是這個(gè)興趣點(diǎn)的非受眾;有的用戶(hù)偶爾點(diǎn)一兩篇,就成為了這個(gè)興趣點(diǎn)的相關(guān)用戶(hù);而有的用戶(hù)可能閱讀了大部分內(nèi)容,就成為了這個(gè)興趣點(diǎn)的核心用戶(hù)。核心用戶(hù)和相關(guān)用戶(hù)是這個(gè)興趣點(diǎn)沉淀下來(lái)的重要資產(chǎn)。那這是不是一錘子買(mǎi)賣(mài)呢?核心用戶(hù)永遠(yuǎn)就是核心用戶(hù),相關(guān)用戶(hù)永遠(yuǎn)就是相關(guān)用戶(hù)呢?想象一下,如果第一天給一名用戶(hù)投放了5篇某個(gè)興趣點(diǎn)的內(nèi)容,這名用戶(hù)讀了4篇,那他就會(huì)被系統(tǒng)判定為這個(gè)興趣點(diǎn)的核心用戶(hù)。投放系統(tǒng)每天除了會(huì)給探索用戶(hù)投放內(nèi)容,還會(huì)持續(xù)地給以前沉淀下來(lái)的核心用戶(hù)和相關(guān)用戶(hù)投放內(nèi)容。如果第二天、第三天持續(xù)給這名核心用戶(hù)投放這個(gè)興趣點(diǎn)里的內(nèi)容,但這名用戶(hù)可能一篇都沒(méi)有點(diǎn)擊,我們的系統(tǒng)就會(huì)調(diào)整他的評(píng)分,可能會(huì)把他降為這個(gè)興趣點(diǎn)的相關(guān)用戶(hù)甚至非受眾。所以用戶(hù)的身份其實(shí)并不是一成不變的,這是一個(gè)動(dòng)態(tài)的變化過(guò)程。

回顧一下剛剛所講的內(nèi)容。興趣點(diǎn)是按照一定規(guī)則聚合的內(nèi)容,投放系統(tǒng)的目標(biāo)是為興趣點(diǎn)找到目標(biāo)用戶(hù),興趣點(diǎn)剛剛創(chuàng)建的時(shí)候,投放系統(tǒng)也不知道這個(gè)興趣點(diǎn)的目標(biāo)用戶(hù)有哪些,所以需要去探索。這里介紹了三種投放系統(tǒng)探索新用戶(hù)的方式:人工探索、機(jī)器探索和策略匹配。所謂的探索就是尋找可能對(duì)這個(gè)興趣點(diǎn)感興趣的用戶(hù),然后給他們投放內(nèi)容來(lái)驗(yàn)證他們喜歡這個(gè)興趣點(diǎn)的程度,根據(jù)程度,我們把用戶(hù)分成核心用戶(hù)、相關(guān)用戶(hù)和非受眾,我們的目標(biāo)是找到更多的核心用戶(hù)和相關(guān)用戶(hù)。

這一切看起來(lái)挺完美的,那有沒(méi)有什么問(wèn)題呢?假設(shè)第一個(gè)興趣點(diǎn)先去探索,探索出了一批用戶(hù),第二個(gè)興趣點(diǎn)再去探索,又探索出一批用戶(hù),第三個(gè)興趣點(diǎn)還去探索,又探索出一批用戶(hù)。活躍用戶(hù)看的內(nèi)容多,身上積累的畫(huà)像多,越是可能會(huì)被系統(tǒng)判定為探索用戶(hù),這樣的話(huà),很多興趣點(diǎn)都會(huì)去把活躍用戶(hù)探索一遍,然后宣稱(chēng)這些用戶(hù)是這個(gè)興趣點(diǎn)的核心用戶(hù)或者相關(guān)用戶(hù)。這樣會(huì)導(dǎo)致各個(gè)興趣點(diǎn)始終圍繞著活躍用戶(hù)探索,對(duì)長(zhǎng)尾的用戶(hù)探索遠(yuǎn)遠(yuǎn)不夠,,不利于增加長(zhǎng)尾用戶(hù)的活躍度和粘性。

那有什么辦法可以解決呢?這里介紹一種我們采用的策略:設(shè)置探索用戶(hù)的互斥性。現(xiàn)在探索的方式就變成了,第一個(gè)興趣點(diǎn)探索了一部分用戶(hù),第二個(gè)興趣點(diǎn)探索時(shí)需要避開(kāi)第一個(gè)興趣點(diǎn)探索出的核心用戶(hù)和相關(guān)用戶(hù),第三個(gè)興趣點(diǎn)探索時(shí)需要避開(kāi)之前興趣點(diǎn)探索出的用戶(hù)。這樣就強(qiáng)制后面的興趣點(diǎn)在探索用戶(hù)時(shí),能夠盡量把探索范圍往長(zhǎng)尾低活用戶(hù)偏移。

剛剛我們一直在聊投放系統(tǒng),那推薦系統(tǒng)和投放系統(tǒng)是什么關(guān)系呢?

首先,這兩個(gè)系統(tǒng)有個(gè)本質(zhì)的差別。一個(gè)用戶(hù)打開(kāi)騰訊看點(diǎn)或者其他的信息流產(chǎn)品,是希望推薦能夠給自己推薦幾篇感興趣的內(nèi)容,這是一個(gè)用戶(hù)主動(dòng)尋找內(nèi)容的過(guò)程。而投放系統(tǒng)呢,恰好相反,運(yùn)營(yíng)同學(xué)覺(jué)得系統(tǒng)里面有很多優(yōu)質(zhì)的長(zhǎng)尾內(nèi)容沒(méi)有被推薦出去,想要給這些優(yōu)質(zhì)內(nèi)容找到合適的用戶(hù)群體,所以這是一個(gè)內(nèi)容找人的過(guò)程。

另一方面,投放系統(tǒng)又深刻地影響著推薦系統(tǒng),我們從兩個(gè)方面來(lái)看。第一方面是用戶(hù)維度,當(dāng)用戶(hù)消費(fèi)了投放系統(tǒng)投放的內(nèi)容的時(shí)候,他的用戶(hù)畫(huà)像就會(huì)受到影響,比如投放系統(tǒng)給用戶(hù)投放了幾篇《三十而已》的內(nèi)容,用戶(hù)消費(fèi)了之后,身上的畫(huà)像會(huì)更新,就會(huì)帶有“三十而已”的標(biāo)簽,這種畫(huà)像會(huì)被推薦系統(tǒng)所采用,所以后面推薦系統(tǒng)也會(huì)給這名用戶(hù)推薦更多的“三十而已”的內(nèi)容。投放系統(tǒng)影響推薦系統(tǒng)的第二個(gè)方面是內(nèi)容維度,對(duì)于一些長(zhǎng)尾冷門(mén)的內(nèi)容,我們的運(yùn)營(yíng)如果覺(jué)得優(yōu)質(zhì)的話(huà),會(huì)通過(guò)投放系統(tǒng)投放出去,如果投放的目標(biāo)人群比較準(zhǔn)確,那么很快就會(huì)有很多用戶(hù)閱讀這些內(nèi)容,推薦系統(tǒng)就會(huì)認(rèn)為這些內(nèi)容是熱門(mén)內(nèi)容,進(jìn)而進(jìn)行更大的推廣。

好的,我們回到一開(kāi)始說(shuō)的問(wèn)題,因?yàn)橛脩?hù)點(diǎn)擊了幾篇低質(zhì)庸俗的內(nèi)容,推薦系統(tǒng)會(huì)誤以為用戶(hù)對(duì)這類(lèi)內(nèi)容感興趣,然后就會(huì)持續(xù)地給用戶(hù)推薦類(lèi)似的內(nèi)容,其實(shí)用戶(hù)可能并不是真的感興趣,相反很可能還很反感,只是忍不住點(diǎn)擊了而已,然后就會(huì)陷入惡性循環(huán)。其中的一種解決方案就是投放系統(tǒng),運(yùn)營(yíng)會(huì)精選一些優(yōu)質(zhì)的長(zhǎng)尾內(nèi)容,通過(guò)投放系統(tǒng)投放給用戶(hù),這樣就可以打破惡性循環(huán),提高用戶(hù)的體驗(yàn)和粘性。

講到這里,關(guān)于投放系統(tǒng)的原理部分基本就介紹完了。聽(tīng)起來(lái)好處多多,那如何量化投放系統(tǒng)帶來(lái)的收益呢?互聯(lián)網(wǎng)人常用的工具就是 A/B 測(cè)試。最后的幾分鐘,我想跟大家分享一下投放系統(tǒng)采用的 A/B 測(cè)試所暗含的玄機(jī)。

當(dāng)產(chǎn)品有了新功能之后,我們會(huì)選擇兩撥用戶(hù),一撥用戶(hù)使用最新版本,另一撥用戶(hù)繼續(xù)使用舊版本。實(shí)驗(yàn)一段時(shí)間后,進(jìn)行實(shí)驗(yàn)分析,如果新版本效果好就會(huì)發(fā)布新版本,舊版本效果好就保持舊版本。實(shí)際的 A/B 測(cè)試過(guò)程非常復(fù)雜,剛剛伍老師跟我們做了深入的分享,我也不班門(mén)弄斧。我這里主要想跟大家分享一下的是選取樣本的方式。

QQ 中有個(gè)天然的用戶(hù) ID 就是我們的 QQ 號(hào),那如何選取兩撥用戶(hù)呢,一種方式就是對(duì) QQ 號(hào)取模,比如模 100。那么根據(jù)取模的結(jié)果可以將用戶(hù)隨機(jī)分成了 100 份,結(jié)果為 65 的那撥用戶(hù)保持舊版本,結(jié)果為 66 的那撥用戶(hù)使用新版本,這兩撥用戶(hù)的 QQ 號(hào)分別以 65 結(jié)尾和以 66 結(jié)尾。這樣的做法真的好嗎?我們從兩方面來(lái)看。

第一方面,隨機(jī)嗎?看這兩撥用戶(hù),一撥以 65 結(jié)尾另一撥以 66 結(jié)尾,需要注意的是 QQ 中是存在靚號(hào)的,而靚號(hào)是需要購(gòu)買(mǎi)的,所以跟普通 QQ 號(hào)相比,靚號(hào)用戶(hù)的基本屬性、使用活躍度總體都要好。這兩撥用戶(hù)看起來(lái)是隨機(jī)分配的,兩者之間應(yīng)該基本沒(méi)有差異,但實(shí)際上以 66 結(jié)尾的用戶(hù)很多都是靚號(hào),這種內(nèi)在的差異會(huì)影響實(shí)驗(yàn)結(jié)果,所以直接取模的方式是種偽隨機(jī)的方式。

第二方面,夠用嗎?將 QQ號(hào)模 100,最多只能進(jìn)行 99 次 A/B 實(shí)驗(yàn),還有一組是用來(lái)對(duì)照的。即使模 1000 甚至 10000,那也始終是有限的,所以這種取樣的方式并不夠用。

既然給 QQ 號(hào)取模的方式是偽隨機(jī)的、不夠用的,那應(yīng)該如何正確地劃分用戶(hù)組?這里介紹一下我們所采用的一種方式,它可以同時(shí)滿(mǎn)足三方面的需要:分桶均勻、足夠分桶和互不干擾,我們分別簡(jiǎn)單的聊一聊。

第一方面是分桶均勻。我們不會(huì)對(duì) QQ 號(hào)直接取模,而是先計(jì)算 QQ 號(hào)的 Hash 值,然后再對(duì) Hash 值取模。這樣做的好處是,哈希函數(shù)可以充分地打散用戶(hù),避免靚號(hào)聚集的情況,同時(shí)在 QQ 這么大的體量下,我們幾乎可以認(rèn)為對(duì) Hash 結(jié)果取模的結(jié)果是均勻的,不會(huì)出現(xiàn)有的分組用戶(hù)很多有的分組很少的情況。

第二方面是足夠分桶。剛剛我們提到需要對(duì) QQ 號(hào)進(jìn)行哈希處理,但這樣也避免不了實(shí)驗(yàn)桶被用完的情況,那如何處理呢?我們可以加一個(gè) salt 值,當(dāng) 99 次實(shí)驗(yàn)桶用完的時(shí)候,我們可以換一個(gè) salt 值,可以把用戶(hù)重新打亂再分組。這有點(diǎn)像打牌,第一次所有牌會(huì)被均分成 4 份,然后重新洗牌再均分成四份。因?yàn)?salt 值是無(wú)窮無(wú)盡的,所以理論上我們可以得到無(wú)窮無(wú)盡的實(shí)驗(yàn)桶。

第三方面是互不干擾。相比于前兩方面,這個(gè)比較難以理解,我們簡(jiǎn)化一下。假設(shè)某款產(chǎn)品有 81 名用戶(hù),分 9 組進(jìn)行 A/B 實(shí)驗(yàn),那每組就有 9 名用戶(hù),其中我們對(duì) 0 號(hào)桶的用戶(hù)進(jìn)行編號(hào),0 到 8。有沒(méi)有可能出現(xiàn)這樣一種情況,重新打散用戶(hù)再分組后,上一次同一個(gè)分組里面的用戶(hù)大部分這次又進(jìn)入了同一個(gè)組,好比洗牌沒(méi)有洗好的話(huà),我這次拿到了一個(gè)炸,下一次很可能又拿到了同一個(gè)炸。出現(xiàn)這種情況會(huì)有什么問(wèn)題嗎?假設(shè)分層 1 的1號(hào)桶有非常好的正向效果,同時(shí)也發(fā)現(xiàn)分層 2 的 0‘ 號(hào)桶也有非常好的正向效果,那你就說(shuō)不清 0' 號(hào)桶的正向效果是在 0 號(hào)桶里面的實(shí)驗(yàn)帶來(lái)的還是 0‘ 號(hào)桶里面的實(shí)驗(yàn)帶來(lái)的。那有什么辦法可以解決這個(gè)問(wèn)題呢?正交。所謂的正交就是將上一個(gè)分層中每個(gè)桶的用戶(hù)打算重新分組后,均勻地分配到下一分層中的每個(gè)桶中。這樣說(shuō)有點(diǎn)抽象,我們看 PPT,分層 1 中 0 號(hào)桶里面的 9 個(gè)用戶(hù),在重新打散后,被均勻地分配到了分層 2 的每一個(gè)桶里面。同樣的,分層 1 中 1 號(hào)桶的所有的用戶(hù)也會(huì)被均勻分配到分層 2 的每一個(gè)桶里面。

以上就是采樣的三個(gè)注意點(diǎn)以及我們采用的解決方案。最終的 A/B 測(cè)試的實(shí)驗(yàn)結(jié)果也表明,收到投放內(nèi)容的那部分用戶(hù)的數(shù)據(jù)確實(shí)有明顯提升。

最后我想以我們騰訊看點(diǎn)線(xiàn)的老大在一次大會(huì)上給我們分享的一句話(huà)作為結(jié)尾:多數(shù)人因看見(jiàn)而相信,少數(shù)人因相信而看見(jiàn)。自從 Facebook 2006 年創(chuàng)造了信息流這種新型的內(nèi)容形式,信息流迄今已經(jīng)發(fā)展了 14 年,作為信息流背后的核心引擎 -- 推薦系統(tǒng)也已經(jīng)進(jìn)入了發(fā)展的深水區(qū),如何為用戶(hù)提供更好的內(nèi)容、創(chuàng)造更大的價(jià)值,我們一直都在探索,今天跟大家分享的投放系統(tǒng)就是一個(gè)探索的產(chǎn)物。因?yàn)橄嘈?#xff0c;所以我們可以看到勝利的彼岸。

最后的最后,因?yàn)闀r(shí)間關(guān)系,跟大家交流的時(shí)間非常有限,歡迎大家通過(guò)我們團(tuán)隊(duì)公眾號(hào)“騰訊VTeam技術(shù)團(tuán)隊(duì)”和我的個(gè)人公眾號(hào)“FEPulse”跟我們交流。

謝謝大家!

總結(jié)

以上是生活随笔為你收集整理的腾讯看点投放系统介绍:推荐系统的进化伙伴的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。