【粉丝福利】赠《机器学习算法竞赛实战》10 本书
隨著互聯網時代的到來,以及計算機硬件性能的提升,人工智能在近幾年可以說是得到了爆發式的增長。互聯網時代帶來了大量的信息,這些信息是名副其實的大數據。另外,性能極佳的硬件也使得計算機的計算能力大大增強,這二者結合到一起,人工智能的蓬勃興盛就變成了自然而然的事情。機器學習作為一種傳統的、可解釋性較強的算法,在人工智能三駕馬車之算法中也占有一席之地。
一本《機器學習算法競賽實戰》應運而生,意在幫助機器學習初學者通過實戰的方法從雖然優美但是略顯枯燥的各種公式和理論當中脫離出來,感受機器學習在實際應用中的奧秘,而競賽則是一種最特殊的實戰。
算法競賽時代
2010 年,全球著名算法競賽平臺 Kaggle 舉辦了第一場競賽 Forecast Eurovision Voting,獎金為 1000 美元。
2015 年,國內第一場算法競賽在天池舉辦,比賽題目是阿里移動推薦算法,獎金為 30 萬元人民幣,吸引了 7000 多人參加。雖然國內的算法競賽起步時間晚于國外,但從 2015 年開始,在全球舉辦的一共 1000 多場賽事中,中國就舉辦了 400 多場,并且場次的年均增長率高達 108.8%,累計有超過 120 萬人參加,獎金累計達到 2.8 億元人民幣。在算法競賽的舉辦場次擁有如此高增長率的情況下,其技術價值、業務價值和創新價值自然不容小覷。
對于有志于進軍機器學習相關領域從事研究或者相關工作的初學者來說,競賽是性價比極高的一個實戰選擇,可以說是零門檻,任何人都能參加。
易于學習的競賽寶典
對于想參加機器學習競賽的初學者來說,一本內容友好的圖書極其重要,可以少走很多彎路。這本《機器學習算法競賽實戰》合理地規劃了章節架構,作者們除了仔細的討論外,還采納了國內多名頂尖競賽選手的建議,深入剖析算法的本質內容,還結合多個領域模塊進行了實戰講解。全書分為五個部分,作者還給每部分都取了一個名字。
PART.
01
磨刀事半,砍柴功倍
第一部分以算法競賽的通用化流程為主,介紹競賽中各個部分的核心內容和具體工作,且每章都配有具體的實戰部分,以便加深理解。
PART.
02
物以類聚,人以群分
第二部分主要介紹用戶畫像相關的問題,構建完善的標簽體系是用戶畫像的核心,也是解決用戶畫像類賽題的關鍵,比如個性化推薦和金融風控等問題都需要以用戶畫像作為支撐。為了幫助讀者加快對此類競賽問題的學習、理解,會講解具體的競賽案例,即 Kaggle 平臺的 Elo Merchant Category Recommendation。
(題目背景:想象一下,當你在一個不熟悉的地方餓著肚子想要找好吃的東西時,你是不是會得到基于你的個人喜好而被專屬推薦的餐館,且該推薦還附帶著你的信用卡提供商為你提供的附近餐館的折扣信息。
目前,巴西最大的支付品牌之一 Elo 已經與商家建立了合作關系,以便向顧客提供促銷或折扣活動。但這些促銷活動對顧客和商家都有益嗎?顧客喜歡他們的活動體驗嗎?商家能夠看到重復交易嗎?要回答這些問題,個性化是關鍵。
Elo 建立了機器學習模型,以了解顧客生命周期中從食品到購物等最重要方面的偏好。但到目前為止,那些學習模型都不是專門為個人或個人資料量身定做的,這也就是這場競賽舉辦的原因。
在這場競賽中,需要參賽者開發算法,通過發現顧客忠誠度的信號,識別并為個人提供最相關的機會。你的意見將改善顧客的生活,幫助 Elo 減少不必要的活動,為顧客創造精準正確的體驗。)
PART.
03
以史為鑒,未來可期
第三部分以時間序列預測問題為主,先講述這類問題的常見解題思路和技巧,然后分析兩個具體的實戰案例,分別是天池平臺的全球城市計算 AI 挑戰賽和Kaggle 平臺的Corporación Favorita Grocery Sales Forecasting。
(題目背景:在實體雜貨店里,銷量預測和顧客采購量之間的關系總是很微妙。如果銷量預測得多,而顧客采購得少,那么雜貨店的商品就會積壓過多,尤其對易腐商品的影響較大;如果銷量預測較少,而顧客采購量較大,那么商品很快就會賣光,短時間內顧客的體驗會變差。?
隨著零售商不斷增加新地點、新產品,以及季節性口味的變化多樣和產品營銷的不可預測, 問題變得更加復雜。位于厄瓜多爾的大型雜貨零售商 Corporación Favorita 也非常清楚這點,其經營著數百家超市,售賣的商品超過 20 萬種。
于是 Corporación Favorita 向 Kaggle 社區提出了挑戰,要求其建立一個可以準確預測商品銷量的模型。Corporación Favorita 目前依靠主觀預測來備份數據,很少通過自動化工具執行計劃, 他們非常期待通過機器學習實現在正確的時間提供足夠正確的商品,來更好地讓顧客滿意。)
PART.
04
精準投放,優化體驗
計算廣告相關的業務大多是很好的競賽題目,第四部分主要介紹了計算廣告的核心技術和業務,包括廣告召回、廣告排序和廣告競價。實戰案例部分則包括兩道賽題,分別是 2018 騰訊廣告算法大賽——相似人群拓展,以及 Kaggle 平臺的 TalkingData AdTracking Fraud Detection Challenge。
PART.
05
聽你所說,懂你所寫
第五部分基于自然語言處理相關的內容進行講解,包括常見任務和常見技術,實戰案例部分是 Kaggle 平臺上的經典競賽 Quora Question Pairs。
這本書可以說是算法競賽領域一本系統性介紹競賽的書,不僅包含競賽的基本理論知識,還結合多個方向和案例詳細闡述了競賽中的上分思路和技巧。
本書還附贈讀書思維導圖,輕松定位學習要點。
本書特色
1
騰訊廣告算法大賽兩屆冠軍、Kaggle?Grandmaster傾力打造
2
賽題案例來自 Kaggle、阿里天池、騰訊廣告算法大賽
3
按照問題建模、數據探索、特征工程、模型訓練、模型融合的步驟講解競賽流程
適合誰讀
對算法競賽感興趣的人。興趣是最大的驅動力,為了讓算法競賽變得更加有趣和更加多樣性,本書增加了很多擴展與探索性的內容,從多個方向、多個領域進行介紹和實戰。
想要研究機器學習或深度學習算法實戰的人。實戰的最佳方式之一是參加一場算法競賽,加深對理論知識的理解,這也是本書的核心思想。
計算機相關專業的人。機器學習或深度學習算法作為目前計算機行業一個火熱的就業方向,值得去深入研究。本書提供了很好的實戰講解,幫助讀者知其然,并知其所以然。
《機器學習算法競賽實戰》
王賀 劉鵬 錢乾 著
本書是算法競賽領域一本系統介紹競賽的圖書,書中不僅包含競賽的基本理論知識,還結合多個方向和案例詳細闡述了競賽中的上分思路和技巧。
全書分為五部分:第一部分以算法競賽的通用流程為主,介紹競賽中各個部分的核心內容和具體工作;第二部分介紹了用戶畫像相關的問題;第三部分以時間序列預測問題為主,先講述這類問題的常見解題思路和技巧,然后分析天池平臺的全球城市計算 AI 挑戰賽和 Kaggle 平臺的Corporación Favorita Grocery Sales Forecasting;第四部分主要介紹計算廣告的核心技術和業務,包括廣告召回、廣告排序和廣告競價,其中兩個實戰案例是 2018 騰訊廣告算法大賽——相似人群拓展和Kaggle 平臺的TalkingData AdTracking Fraud Detection Challenge;第五部分基于自然語言處理相關的內容進行講解,其中實戰案例是 Kaggle 平臺上的經典競賽 Quora Question Pairs。
作者簡介
王賀(魚遇雨欲語與余),現任職于小米商業算法部,從事應用商店廣告推薦的研究和開發。從 2018 年至 2020 年多次參加國內外算法競賽,共獲得 5 次冠軍和 5 次亞軍,是 2019 年和 2020 年騰訊廣告算法大賽的冠軍。畢業于武漢大學計算機學院,碩士學位,研究方向為圖數據挖掘。
劉鵬,華為技術有限公司算法工程師,從事電信運營商和智能運維領域的算法研究和開發工作。2016 年本科畢業于武漢大學數學基地班,保研至中國科學技術大學自動化系,碩士期間研究方向為復雜網絡與機器學習,2018 年起多次獲得機器學習相關競賽獎項。
錢乾,數程科技大數據技術負責人,工作方向為物流領域的智能算法應用。本科就讀于美國佐治亞理工大學,研究方向包括機器學習、深度學習、自然語言處理等。
目錄搶先看
(向右劃動查看)
贈書福利
你對 Kaggle 感興趣嗎?
歡迎與我們分享
王的機器將選出十名優質留言
攜手【圖靈教育】送出
《機器學習算法競賽實戰》一本
截止 2021 年 9 月 25 日晚上 20:00
?? 京東購買
總結
以上是生活随笔為你收集整理的【粉丝福利】赠《机器学习算法竞赛实战》10 本书的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 抖音二面:为什么模块循环依赖不会死循环?
- 下一篇: second life 新手必读 原文h