mysql .pdb是什么文件_计算广告算法到底要做什么?
這個話題在這個專欄開篇就該去講。恰逢今天公司業務和財務培訓(20190216)之后,也有一些思索,索性就都匯總寫下來。本文雜述,不盡完備,但是值得不斷完善。
我喜歡一句話“革命不是請客吃飯,不是做文章,不是繪畫繡花,不能那樣雅致,不能那樣從容不迫,文質彬彬,那樣溫良恭儉讓。”。對于一個公司來說,不得不承認,也應該是如此!必須要有貢獻,要有對應的產出!這樣就自然的提出了一系列問題,要有怎樣的產出,要做些什么樣的事情,要達到什么樣的目標,要去往哪里?我想,作為一名廣告算法工程師,不管是怎么入行的,那么現在在這個行當去做,也就該時刻的去問這些問題。記得《喬布斯傳》里邊兒有寫到,喬布斯隨時都會問員工幾個問題,你在公司負責什么?你今天最重要的事情是什么?我想這也是一個職業人該隨時問自己的問題。
首先一點就是廣告算法的核心競爭力是什么?知乎上有這個問題,總結一下大家的答案,基本上都強調了業務知識!對于業務的理解很關鍵,但只單純的理解業務也不能形成一個算法工程師的核心競爭力!畢竟廣告算法工程師還是要從算法工程出發,所以不斷的去打磨我們自己的算法和工程能力是一個算法工程師必不可少的功課,深刻理解業務可以說是在任何一個領域深深地耕耘下去必備的知識體系。對于算法工程師的優劣標準老大給過一個決策力是很關鍵的指標,具體來說就是我們需要做很多的判斷,很多的抽象,以至于構建很多的模型和策略,這樣怎么去構建我們的評估體系,怎么去決策就顯的尤為重要!下邊分列一下廣告需要著重關注和解決的問題。
第一類事情統計分析
計算廣告具有天然的大數據特性特別是涉及到變現的業務對于數據都十分敏感,不管是衡量自己的工作還是匯報工作以及分享離開數據的支撐都是空洞無物的,如何培養這樣的敏感性?首先我們要對于統計分析的一些基本方法和能力有培養,另外要對于關鍵指標有明確的了解和意識,具體到計算廣告涉及計費的有CPM、oCPM、CPC、oCPC、CPI、CPA等,涉及到效果的CTR、CVR、eCPM 、TA%、N+REACH等,另外對于一些媒體屬性、行業特征等也應該有個大概的把握,對于模型的評價指標比如離線考慮AUC、F1、Accuracy、log_loss等以及A/B測試情況都需要有非常清楚的掌握。
在對于數據分析的過程中,我們常用的一些工具需要有Hive、Mysql等這樣的存儲介質以及SQL或類SQL的編寫能力;基于Spark、Hadoop等大數據引擎編寫數據處理與分析的能力由于計算廣告所涉及的數據量級都十分巨大,傳統簡單的分析方式可能很難奏效,無論是數據分析,還是特征抽取以及模型訓練,對于大數據的處理能力都是必不可少的;靈活的python、shell等腳本語言的編寫能力,有很多任務可能只是即時的分析,能快速的編寫對應的腳本來處理也是很重要的,python具有很多數據分析的強大庫,比如pandas、scipy、matplot等都是平時工作非常重要的工具,另外靈活的shell腳本的編寫也可以快速的實現一些統計分析工作。
第二類事情預估問題
可以說預估問題是計算廣告算法發揮作用的核心地帶,尤其是點擊率預估問題,基本上各大公司都有自己的預估算法體系,預估算法也從傳統的經典機器學習比如邏輯回歸、樸素貝葉斯、SVM等方法逐漸發展到FM、MLR、LR+GBDT、GBM等,現在很多公司也在逐漸采用一些深度學習方法,比如DNN、DEEPFM、DIN等。可以說這個方向是研究的最多的,也是成果最為豐富的。
但是廣告的投放是一個全鏈的商業行為,一般廣告主最終考核的是ROI,因此對于轉化率、客單價等的預估問題也是十分重要的,而且這類問題往往也是十分困難的。具體到轉化率,可能存在數據特別稀疏,數據延遲或缺失以及反復,無經驗下限等問題。因此對于這類問題的模型的研究也是算法工作的一個重點和棘手的問題。
還有就是用戶畫像涉及到的諸多預估問題,其中涉及到品牌廣告一般考核的一個指標TA濃度問題,用戶興趣標簽涉及到的預估問題,這類問題可以采用線性模型、樹形模型以及深度神經網絡模型并用最后融合的方式去解決。
第三類事情出價問題
廣告的出價問題是伴隨著RTB的發展而發展的,最為著名的就是谷歌采用的廣義第二高價方式,可以說對于RTB廣告影響深遠,不過最近有說谷歌由于各種原因可能會采用一價方式,不管怎樣,廣告對于出價的考慮都是一個非常重要和系統的問題。另外像百度,他們的出價也是在一個不斷迭代的過程,從一價、二價、梅森拍賣、優化出價等不斷的在進行迭代。值得說明的是很多出價模型非常依賴于預估的解。
第四類事情推薦與排序問題
對于廣告所涉及的推薦和排序問題,可能不像純粹的推薦系統那么復雜繁瑣,或者說廣告的推薦業務問題和純粹的推薦是有很大的差距的,廣告的推薦更多的涉及廣告素材的推薦,廣告的排序是需要考慮價格或者ROI因素的,也就是很多排序是基于eCPM去排序,但是廣告所涉及的推薦技術也是和一般的推薦所解決和面臨的問題是一樣的。
不過在廣告推薦里邊一般會涉及到廣告的創意優選類的功能,也是要基于預估值去實現一些業務功能的。
第五類事情防作弊問題
對于計算廣告,防止作弊是十分緊要的問題,一般的作弊處理分為在線防作弊和離線反作弊。作弊系統更為常見的是一些規則,一些具體的規則定義往往可以成為一種標準,具體可以參看一些監測公司的規則定義。當然,對于作弊數據的建模也是可以做算法去區分的。
第六類問題流量預估、分配與評級
對于流量的精細化管理一定是十分重要的,特別是對于聯盟網絡,以及pdb的多點位的問題,流量預估可以經過統計分析得到,一般的分配算法,可以利用線性方法,也可以利用非線性的優化方法,主要基于業務場景的建模。對于流量的評級,一般基于歷史投放數據,和一些業務規則來進行,評級一般可以控制量的情況以及后續合作的情況,所以對于網盟類流量十分必要。
另外還有一些涉及到具體業務的,比如PDB的退量和保量,投放速度、頻次控制等算法。
另外,說一點其他的,那就是責任心,對效果負責的責任心,如果沒有責任心,我想算法人員是很難有實際的產出的。還有就是好奇心或者說想法、創新性,沒有自己的思考和想法也難以成為一名合格的算法工程師。
參考:
1、廣告算法工程師的核心競爭力是什么?https://www.zhihu.com/question/41081387
2、廣告策略產品經理:淺析廣告系統的智能策略有哪些方面?https://zhuanlan.zhihu.com/p/56450602
3、如何更好的理解今日頭條的廣告智能算法?
https://www.jianshu.com/p/b374af2cbd1a
總結
以上是生活随笔為你收集整理的mysql .pdb是什么文件_计算广告算法到底要做什么?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: oppok9长度
- 下一篇: 简述select语句的完整语法_SQL里