日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 运维知识 > 数据库 >内容正文

数据库

mysql .pdb是什么文件_计算广告算法到底要做什么?

發(fā)布時(shí)間:2023/12/1 数据库 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 mysql .pdb是什么文件_计算广告算法到底要做什么? 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

這個(gè)話題在這個(gè)專欄開篇就該去講。恰逢今天公司業(yè)務(wù)和財(cái)務(wù)培訓(xùn)(20190216)之后,也有一些思索,索性就都匯總寫下來。本文雜述,不盡完備,但是值得不斷完善。

我喜歡一句話“革命不是請(qǐng)客吃飯,不是做文章,不是繪畫繡花,不能那樣雅致,不能那樣從容不迫,文質(zhì)彬彬,那樣溫良恭儉讓?!?。對(duì)于一個(gè)公司來說,不得不承認(rèn),也應(yīng)該是如此!必須要有貢獻(xiàn),要有對(duì)應(yīng)的產(chǎn)出!這樣就自然的提出了一系列問題,要有怎樣的產(chǎn)出,要做些什么樣的事情,要達(dá)到什么樣的目標(biāo),要去往哪里?我想,作為一名廣告算法工程師,不管是怎么入行的,那么現(xiàn)在在這個(gè)行當(dāng)去做,也就該時(shí)刻的去問這些問題。記得《喬布斯傳》里邊兒有寫到,喬布斯隨時(shí)都會(huì)問員工幾個(gè)問題,你在公司負(fù)責(zé)什么?你今天最重要的事情是什么?我想這也是一個(gè)職業(yè)人該隨時(shí)問自己的問題。

首先一點(diǎn)就是廣告算法的核心競(jìng)爭(zhēng)力是什么?知乎上有這個(gè)問題,總結(jié)一下大家的答案,基本上都強(qiáng)調(diào)了業(yè)務(wù)知識(shí)!對(duì)于業(yè)務(wù)的理解很關(guān)鍵,但只單純的理解業(yè)務(wù)也不能形成一個(gè)算法工程師的核心競(jìng)爭(zhēng)力!畢竟廣告算法工程師還是要從算法工程出發(fā),所以不斷的去打磨我們自己的算法和工程能力是一個(gè)算法工程師必不可少的功課,深刻理解業(yè)務(wù)可以說是在任何一個(gè)領(lǐng)域深深地耕耘下去必備的知識(shí)體系。對(duì)于算法工程師的優(yōu)劣標(biāo)準(zhǔn)老大給過一個(gè)決策力是很關(guān)鍵的指標(biāo),具體來說就是我們需要做很多的判斷,很多的抽象,以至于構(gòu)建很多的模型和策略,這樣怎么去構(gòu)建我們的評(píng)估體系,怎么去決策就顯的尤為重要!下邊分列一下廣告需要著重關(guān)注和解決的問題。

第一類事情統(tǒng)計(jì)分析

計(jì)算廣告具有天然的大數(shù)據(jù)特性特別是涉及到變現(xiàn)的業(yè)務(wù)對(duì)于數(shù)據(jù)都十分敏感,不管是衡量自己的工作還是匯報(bào)工作以及分享離開數(shù)據(jù)的支撐都是空洞無物的,如何培養(yǎng)這樣的敏感性?首先我們要對(duì)于統(tǒng)計(jì)分析的一些基本方法和能力有培養(yǎng),另外要對(duì)于關(guān)鍵指標(biāo)有明確的了解和意識(shí),具體到計(jì)算廣告涉及計(jì)費(fèi)的有CPM、oCPM、CPC、oCPC、CPI、CPA等,涉及到效果的CTR、CVR、eCPM 、TA%、N+REACH等,另外對(duì)于一些媒體屬性、行業(yè)特征等也應(yīng)該有個(gè)大概的把握,對(duì)于模型的評(píng)價(jià)指標(biāo)比如離線考慮AUC、F1、Accuracy、log_loss等以及A/B測(cè)試情況都需要有非常清楚的掌握。

在對(duì)于數(shù)據(jù)分析的過程中,我們常用的一些工具需要有Hive、Mysql等這樣的存儲(chǔ)介質(zhì)以及SQL或類SQL的編寫能力;基于Spark、Hadoop等大數(shù)據(jù)引擎編寫數(shù)據(jù)處理與分析的能力由于計(jì)算廣告所涉及的數(shù)據(jù)量級(jí)都十分巨大,傳統(tǒng)簡(jiǎn)單的分析方式可能很難奏效,無論是數(shù)據(jù)分析,還是特征抽取以及模型訓(xùn)練,對(duì)于大數(shù)據(jù)的處理能力都是必不可少的;靈活的python、shell等腳本語言的編寫能力,有很多任務(wù)可能只是即時(shí)的分析,能快速的編寫對(duì)應(yīng)的腳本來處理也是很重要的,python具有很多數(shù)據(jù)分析的強(qiáng)大庫(kù),比如pandas、scipy、matplot等都是平時(shí)工作非常重要的工具,另外靈活的shell腳本的編寫也可以快速的實(shí)現(xiàn)一些統(tǒng)計(jì)分析工作。

第二類事情預(yù)估問題

可以說預(yù)估問題是計(jì)算廣告算法發(fā)揮作用的核心地帶,尤其是點(diǎn)擊率預(yù)估問題,基本上各大公司都有自己的預(yù)估算法體系,預(yù)估算法也從傳統(tǒng)的經(jīng)典機(jī)器學(xué)習(xí)比如邏輯回歸、樸素貝葉斯、SVM等方法逐漸發(fā)展到FM、MLR、LR+GBDT、GBM等,現(xiàn)在很多公司也在逐漸采用一些深度學(xué)習(xí)方法,比如DNN、DEEPFM、DIN等??梢哉f這個(gè)方向是研究的最多的,也是成果最為豐富的。

但是廣告的投放是一個(gè)全鏈的商業(yè)行為,一般廣告主最終考核的是ROI,因此對(duì)于轉(zhuǎn)化率、客單價(jià)等的預(yù)估問題也是十分重要的,而且這類問題往往也是十分困難的。具體到轉(zhuǎn)化率,可能存在數(shù)據(jù)特別稀疏,數(shù)據(jù)延遲或缺失以及反復(fù),無經(jīng)驗(yàn)下限等問題。因此對(duì)于這類問題的模型的研究也是算法工作的一個(gè)重點(diǎn)和棘手的問題。

還有就是用戶畫像涉及到的諸多預(yù)估問題,其中涉及到品牌廣告一般考核的一個(gè)指標(biāo)TA濃度問題,用戶興趣標(biāo)簽涉及到的預(yù)估問題,這類問題可以采用線性模型、樹形模型以及深度神經(jīng)網(wǎng)絡(luò)模型并用最后融合的方式去解決。

第三類事情出價(jià)問題

廣告的出價(jià)問題是伴隨著RTB的發(fā)展而發(fā)展的,最為著名的就是谷歌采用的廣義第二高價(jià)方式,可以說對(duì)于RTB廣告影響深遠(yuǎn),不過最近有說谷歌由于各種原因可能會(huì)采用一價(jià)方式,不管怎樣,廣告對(duì)于出價(jià)的考慮都是一個(gè)非常重要和系統(tǒng)的問題。另外像百度,他們的出價(jià)也是在一個(gè)不斷迭代的過程,從一價(jià)、二價(jià)、梅森拍賣、優(yōu)化出價(jià)等不斷的在進(jìn)行迭代。值得說明的是很多出價(jià)模型非常依賴于預(yù)估的解。

第四類事情推薦與排序問題

對(duì)于廣告所涉及的推薦和排序問題,可能不像純粹的推薦系統(tǒng)那么復(fù)雜繁瑣,或者說廣告的推薦業(yè)務(wù)問題和純粹的推薦是有很大的差距的,廣告的推薦更多的涉及廣告素材的推薦,廣告的排序是需要考慮價(jià)格或者ROI因素的,也就是很多排序是基于eCPM去排序,但是廣告所涉及的推薦技術(shù)也是和一般的推薦所解決和面臨的問題是一樣的。

不過在廣告推薦里邊一般會(huì)涉及到廣告的創(chuàng)意優(yōu)選類的功能,也是要基于預(yù)估值去實(shí)現(xiàn)一些業(yè)務(wù)功能的。

第五類事情防作弊問題

對(duì)于計(jì)算廣告,防止作弊是十分緊要的問題,一般的作弊處理分為在線防作弊和離線反作弊。作弊系統(tǒng)更為常見的是一些規(guī)則,一些具體的規(guī)則定義往往可以成為一種標(biāo)準(zhǔn),具體可以參看一些監(jiān)測(cè)公司的規(guī)則定義。當(dāng)然,對(duì)于作弊數(shù)據(jù)的建模也是可以做算法去區(qū)分的。

第六類問題流量預(yù)估、分配與評(píng)級(jí)

對(duì)于流量的精細(xì)化管理一定是十分重要的,特別是對(duì)于聯(lián)盟網(wǎng)絡(luò),以及pdb的多點(diǎn)位的問題,流量預(yù)估可以經(jīng)過統(tǒng)計(jì)分析得到,一般的分配算法,可以利用線性方法,也可以利用非線性的優(yōu)化方法,主要基于業(yè)務(wù)場(chǎng)景的建模。對(duì)于流量的評(píng)級(jí),一般基于歷史投放數(shù)據(jù),和一些業(yè)務(wù)規(guī)則來進(jìn)行,評(píng)級(jí)一般可以控制量的情況以及后續(xù)合作的情況,所以對(duì)于網(wǎng)盟類流量十分必要。

另外還有一些涉及到具體業(yè)務(wù)的,比如PDB的退量和保量,投放速度、頻次控制等算法。

另外,說一點(diǎn)其他的,那就是責(zé)任心,對(duì)效果負(fù)責(zé)的責(zé)任心,如果沒有責(zé)任心,我想算法人員是很難有實(shí)際的產(chǎn)出的。還有就是好奇心或者說想法、創(chuàng)新性,沒有自己的思考和想法也難以成為一名合格的算法工程師。

參考:

1、廣告算法工程師的核心競(jìng)爭(zhēng)力是什么?https://www.zhihu.com/question/41081387

2、廣告策略產(chǎn)品經(jīng)理:淺析廣告系統(tǒng)的智能策略有哪些方面?https://zhuanlan.zhihu.com/p/56450602

3、如何更好的理解今日頭條的廣告智能算法?

https://www.jianshu.com/p/b374af2cbd1a

總結(jié)

以上是生活随笔為你收集整理的mysql .pdb是什么文件_计算广告算法到底要做什么?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。