搭建推荐系统所需要的材料
搭建推薦系統(tǒng)所需要的材料
- 人力物力
- 推薦系統(tǒng)的原材料
- 物品
- 流量
- 最后
人力物力
在上一小節(jié)中《推薦系統(tǒng)的必要性》里已經(jīng)討論過一個(gè)推薦業(yè)務(wù)團(tuán)隊(duì)需要哪些人員儲(chǔ)備,需要什么核心技術(shù)等。這里在重點(diǎn)說下物力,即機(jī)器資源設(shè)備。
往往從頭開始搭建這樣一個(gè)團(tuán)隊(duì),的確是比較花時(shí)間,金錢,人工的。
第一,人員的招聘是一個(gè)很難的工作,從JD的發(fā)出,簡(jiǎn)歷的篩選,電話溝通,預(yù)約面試,一面,二面,終面,約定入職時(shí)間等等。這都是需要很多人花費(fèi)很多時(shí)間去完成,但是即使這樣做了,也不一定招到合適的人員;其次,合適的面試者不一定會(huì)接受offer。尤其是算法工程師、高級(jí)java開發(fā)、大數(shù)據(jù)的確是比較難招的崗位,有時(shí)候,一天要面試4、5個(gè)候選人,還要對(duì)其面試表現(xiàn)做書面的評(píng)價(jià),這在初期會(huì)占用幾乎所有的工作時(shí)間。
第二,招到了合適的核心技術(shù)人員之后,就可以做初期的業(yè)務(wù)評(píng)估,需求整理,進(jìn)而進(jìn)行設(shè)備的評(píng)估與購(gòu)買。要想自建推薦系統(tǒng)(那么你的流量一定不小),大數(shù)據(jù)平臺(tái)一定少不了。最重要的硬件設(shè)備是服務(wù)器、辦公電腦、甚至GPU都是需要花費(fèi)大量金錢的。
有些公司自建整套系統(tǒng),也就是從無到有,往往轉(zhuǎn)變不了思想觀念。認(rèn)為花錢買那么多的機(jī)器設(shè)備,不一定能為公司賺回成本,以致于在硬件設(shè)備采購(gòu)上把握很嚴(yán)格。那么一個(gè)直接的影響就是,你每天都要為工程師團(tuán)隊(duì)付出薪水,而不舍得一次性付出硬件成本,一個(gè)小時(shí)可以跑完的任務(wù),要等5、6小時(shí)。人工成本無形地在損耗,一定要想明白這件事,不要在硬件上節(jié)省,人工成本最貴!
人工成本 >> 其他花費(fèi)
推薦系統(tǒng)的原材料
在有了推薦團(tuán)隊(duì)、硬件設(shè)備后,就是推薦團(tuán)隊(duì)負(fù)責(zé)人要發(fā)揮重要作用的時(shí)候了。要明確自己將要做的推薦業(yè)務(wù)是什么,目標(biāo)是什么?提升收入?提高點(diǎn)擊率?增加用戶停留時(shí)長(zhǎng)?進(jìn)而考慮推薦系統(tǒng)中的兩個(gè)關(guān)鍵點(diǎn):推薦的物品、流量!
物品
對(duì)于新聞資訊業(yè)務(wù)來說,推薦的物品就是新聞內(nèi)容。比如今日頭條信息流推薦,它要推薦的就是新聞資訊。
對(duì)于廣告來業(yè)務(wù)網(wǎng)說,推薦的物品就是廣告。比如今日頭條廣告推薦
其他推薦就不一一舉例了。
明確了要推薦的物品以及形式是怎樣的,關(guān)注一下物品的數(shù)量,也就是之前提到的是否有足夠多的物品讓系統(tǒng)去推薦?還是只要運(yùn)營(yíng)人員手工即可完成推薦?
流量
一定要清楚目前業(yè)務(wù)的流量情況是怎樣的?
流量大小
流量分布
人群特征
明確了流量大小、分布以及物品數(shù)量,也就知道了推薦系統(tǒng)大致能建立多少鏈接。人群特征是需要做數(shù)據(jù)分析和用戶畫像的(這塊后續(xù)詳細(xì)講到)。
明確流量大小和分布有助于安排算法任務(wù)的運(yùn)行時(shí)間和算法的選擇,計(jì)算框架的選擇。有些需要集群計(jì)算,有些單節(jié)點(diǎn)服務(wù)器就可以完成。還有助于清楚地知道大致需要多少應(yīng)用服務(wù)器等。
其實(shí),互聯(lián)網(wǎng)行業(yè)的一句話說明了流量的重要價(jià)值:流量為王。有了流量,你就有機(jī)會(huì)盈利,有機(jī)會(huì)將業(yè)務(wù)做大。但是,現(xiàn)今互聯(lián)網(wǎng)行業(yè)的流量已經(jīng)被各大應(yīng)用分的所剩無幾了,現(xiàn)在毫不夸張的說是流量稀缺時(shí)代!
最后
最后放一張廣告推薦的過程圖:
總結(jié)
以上是生活随笔為你收集整理的搭建推荐系统所需要的材料的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 互联网晚报 | 4月11日 星期一 |
- 下一篇: 【DM8168学习笔记5】EZSDK目录