推荐算法竞赛TOP方案合集
推薦算法競(jìng)賽相關(guān) 會(huì)議賽
(一)2020 ACM Twitter RecSys Challenge
問(wèn)題背景:
Twitter上呈現(xiàn)的是正在發(fā)生的事情,也是人們現(xiàn)在談?wù)摰脑掝}。在Twitter上,隨著對(duì)話的展開,生活變得生動(dòng)起來(lái),向你展示故事的方方面面。從突發(fā)新聞和娛樂(lè)到體育、政治和日常興趣,當(dāng)世界上發(fā)生的事情,它們首先發(fā)生在推特上。
在這個(gè)平臺(tái)上,用戶發(fā)布和參與(以喜歡、回復(fù)、轉(zhuǎn)發(fā)和評(píng)論轉(zhuǎn)發(fā)的形式)被稱為“Tweets”的內(nèi)容。這一挑戰(zhàn)旨在評(píng)估新的大規(guī)模預(yù)測(cè)不同參與率的算法,并推動(dòng)推薦系統(tǒng)的最新發(fā)展。隨著Top-K推薦領(lǐng)域的成功和進(jìn)步,我們的目標(biāo)是通過(guò)發(fā)布最大的真實(shí)世界數(shù)據(jù)集來(lái)預(yù)測(cè)用戶參與度,從而鼓勵(lì)開發(fā)新的方法。該數(shù)據(jù)集包括大約2億次公眾參與,以及用戶和參與特征,這些活動(dòng)持續(xù)2周,包含公眾互動(dòng)(如回復(fù)、轉(zhuǎn)發(fā)和評(píng)論轉(zhuǎn)發(fā)),以及從公眾關(guān)注圖中隨機(jī)抽樣的1億個(gè)pseudo negatives。在對(duì)后一批tweet進(jìn)行抽樣時(shí),我們特別注意保護(hù)用戶隱私。
解決方案:
Rank4: https://github.com/sumitsidana/recsys_challenge_2020(二)KDD Cup 2020 Challenges for Modern E-Commerce Platform: Debiasing
問(wèn)題背景:
本賽題解決的偏差消除問(wèn)題,大多數(shù)電子商務(wù)和零售公司利用海量數(shù)據(jù)在其網(wǎng)站上實(shí)現(xiàn)搜索和推薦系統(tǒng),從而來(lái)促進(jìn)銷售,隨著這樣的趨勢(shì)發(fā)展以及流量的大量增加,對(duì)推薦系統(tǒng)產(chǎn)生了各式各樣的挑戰(zhàn)。其中一個(gè)值得探索的挑戰(zhàn)是推薦系統(tǒng)的人工智能公平性(Fairness)問(wèn)題,即如果機(jī)器學(xué)習(xí)系統(tǒng)配備了短期目標(biāo)(例如短期的點(diǎn)擊、交易),單純朝短期目標(biāo)進(jìn)行優(yōu)化將會(huì)導(dǎo)致嚴(yán)重的“馬太效應(yīng)”,即熱門的商品受到更多的關(guān)注,冷門商品則愈發(fā)的會(huì)被遺忘,產(chǎn)生了系統(tǒng)中的流行度偏差,并且大多數(shù)模型和系統(tǒng)的迭代依賴于頁(yè)面瀏覽(Pageview)數(shù)據(jù),而曝光數(shù)據(jù)是實(shí)際候選中經(jīng)過(guò)模型選擇的一個(gè)子集,不斷地依賴模型選擇的數(shù)據(jù)與反饋再進(jìn)行訓(xùn)練,將形成選擇性偏差。
上述流行度偏差與選擇性偏差不斷積累,就會(huì)導(dǎo)致系統(tǒng)中的“馬太效應(yīng)”越來(lái)越嚴(yán)重。因此,人工智能公平性問(wèn)題對(duì)于推薦系統(tǒng)的不斷優(yōu)化至關(guān)重要,并且這將對(duì)推薦系統(tǒng)的發(fā)展以及生態(tài)環(huán)境產(chǎn)生深遠(yuǎn)的影響。
解決方案:
Rank1: https://github.com/aister2020/KDDCUP_2020_Debiasing_1st_Place Rank6: https://github.com/ChuanyuXue/KDDCUP-2020 Rank10: https://github.com/xuetf/KDD_CUP_2020_Debiasing_Rush(三)KDD Cup 2020 Challenges for Modern E-Commerce Platform: Multimodalities Recall
問(wèn)題背景:
多模態(tài)召回賽題由阿里巴巴達(dá)摩院智能計(jì)算實(shí)驗(yàn)室發(fā)起并組織,關(guān)注電商行業(yè)中的多模信息學(xué)習(xí)問(wèn)題。2019年,全世界線上電商營(yíng)收額已經(jīng)達(dá)到3530億美元。據(jù)相關(guān)預(yù)測(cè),到2022年,總營(yíng)收將增長(zhǎng)至6540億美元。大規(guī)模的營(yíng)收和高速增長(zhǎng)同時(shí)預(yù)示著,消費(fèi)者對(duì)于電商服務(wù)有著巨大的需求。跟隨這一增長(zhǎng),電商行業(yè)中各種模態(tài)的信息越來(lái)越豐富,如直播、博客等等。怎樣在傳統(tǒng)的搜索引擎和推薦系統(tǒng)中引入這些多模信息,更好地服務(wù)消費(fèi)者,值得相關(guān)從業(yè)者深入探討。
本賽道提供了淘寶商城的真實(shí)數(shù)據(jù),包括兩部分,一是搜索短句(Query)相關(guān),為原始數(shù)據(jù);二是商品圖片相關(guān),考慮到知識(shí)產(chǎn)權(quán)等,提供的是使用Faster RCNN在圖片上提取出的特征向量。兩部分?jǐn)?shù)據(jù)被組織為基于Query的圖片召回問(wèn)題,即有關(guān)文本模態(tài)和圖片模態(tài)的召回問(wèn)題
解決方案:
Rank1: https://github.com/steven95421/KDD_WinnieTheBest Rank8: https://github.com/miziha-zp/KDD2020_mutilmodalities Rank10: https://github.com/dingyh0626/KDD-Cup-Multimodalities-Recal(四)CIKM 2019 E-Commerce AI Challenge
問(wèn)題背景:
用戶興趣高效檢索聚焦在解決大規(guī)模推薦中用戶興趣檢索的問(wèn)題上,任務(wù)要求在很短時(shí)間內(nèi)從千萬(wàn)級(jí)的商品庫(kù) C 中為用戶挑選出最可能感興趣的 k 個(gè)商品。復(fù)賽還要求為每個(gè)用戶進(jìn)行推薦時(shí)的時(shí)間復(fù)雜度小于 O(n)。其中,k<<n,n=|C|。此外,復(fù)賽提交的方案需在一個(gè) 8 核 60G P100 的 GPU 容器中對(duì) 6 萬(wàn)線上用戶進(jìn)行推薦,限時(shí) 1 小時(shí)。不僅對(duì)復(fù)雜度有要求,對(duì)內(nèi)存、CPU 等資源也有限制。數(shù)據(jù)集包括用戶行為文件、用戶信息文件與商品信息文件。用戶信息包含用戶 ID、性別、年齡與購(gòu)買力,商品信息包含商品 ID、類目 ID、店鋪 ID 與品牌 ID(若有商品價(jià)格,有望提高推薦效果),用戶行為涉及 16 天(由某個(gè)周五開始)的用戶對(duì)商品的行為日志。
解決方案:
Rank1: ChuanyuXue/CIKM-2019-AnalytiCup Rank10: https://github.com/kupuSs/CIKM-CUP-2019-track2-rank10(五)2019 ACM RecSys Challenge
問(wèn)題背景:
挑戰(zhàn)的目標(biāo)是在會(huì)話中使用用戶信號(hào)來(lái)檢測(cè)用戶的意圖,并更新提供給用戶的住宿建議。給定用戶在我們網(wǎng)站上的交互數(shù)據(jù)集和他們交互的項(xiàng)目的元數(shù)據(jù),參與者的任務(wù)是預(yù)測(cè)在會(huì)話的后期有哪些項(xiàng)目被點(diǎn)擊。
解決方案:
Rank2: layer6ai-labs/RecSys2019 Rank4: https://github.com/rosetta-ai/rosetta_recsys2019 Rank7: mustelideos/recsys-challenge-2019(六)WSDM 2018 - KKBox's Music Recommendation
問(wèn)題背景:
預(yù)測(cè)用戶在一個(gè)時(shí)間窗口內(nèi)第一個(gè)可觀察到的收聽事件被觸發(fā)后,重復(fù)聽一首歌的機(jī)會(huì)。
解決方案:
Rank1: lystdo/Codes-for-WSDM-CUP-Music-Rec-1st-place-solution Rank3: VasiliyRubtsov/wsdm_music_recommendations(七)2018 IJCAI 阿里媽媽搜索廣告轉(zhuǎn)化預(yù)測(cè)
問(wèn)題背景:
比賽題目是"搜索廣告轉(zhuǎn)化預(yù)測(cè)",需要通過(guò)人工智能技術(shù)構(gòu)建預(yù)測(cè)模型預(yù)估用戶的購(gòu)買意向,即給定歷史廣告點(diǎn)擊相關(guān)的用戶(user)、廣告商品(ad)、檢索詞(query)、上下文內(nèi)容(context)、商店(shop)等五類信息的條件下預(yù)測(cè)接下來(lái)日期廣告產(chǎn)生購(gòu)買行為的概率(pCVR)。
結(jié)合淘寶平臺(tái)的業(yè)務(wù)場(chǎng)景和不同的流量特點(diǎn),官方定義了以下兩類挑戰(zhàn):
(1)日常的轉(zhuǎn)化率預(yù)估
(2)特殊日期的轉(zhuǎn)化率預(yù)
解決方案:
Rank1: plantsgo/ijcai-2018 Rank2: https://github.com/YouChouNoBB/ijcai-18-top2-single-mole-solution Rank3: luoda888/2018-IJCAI-top3 Rank4: fanfanda/ijcai_2018推薦算法競(jìng)賽相關(guān) 企業(yè)賽
(八)2020 騰訊廣告算法大賽
問(wèn)題背景:
本屆算法大賽的題目來(lái)源于一個(gè)重要且有趣的問(wèn)題。眾所周知,像用戶年齡和性別這樣的人口統(tǒng)計(jì)學(xué)特征是各類推薦系統(tǒng)的重要輸入特征,其中自然也包括了廣告平臺(tái)。這背后的假設(shè)是,用戶對(duì)廣告的偏好會(huì)隨著其年齡和性別的不同而有所區(qū)別。許多行業(yè)的實(shí)踐者已經(jīng)多次驗(yàn)證了這一假設(shè)。然而,大多數(shù)驗(yàn)證所采用的方式都是以人口統(tǒng)計(jì)學(xué)屬性作為輸入來(lái)產(chǎn)生推薦結(jié)果,然后離線或者在線地對(duì)比用與不用這些輸入的情況下的推薦性能。本屆大賽的題目嘗試從另一個(gè)方向來(lái)驗(yàn)證這個(gè)假設(shè),即以用戶在廣告系統(tǒng)中的交互行為作為輸入來(lái)預(yù)測(cè)用戶的人口統(tǒng)計(jì)學(xué)屬性。我們認(rèn)為這一賽題的“逆向思考”本身具有其研究?jī)r(jià)值和趣味性,此外也有實(shí)用價(jià)值和挑戰(zhàn)性。例如,對(duì)于缺乏用戶信息的實(shí)踐者來(lái)說(shuō),基于其自有系統(tǒng)的數(shù)據(jù)來(lái)推斷用戶屬性,可以幫助其在更廣的人群上實(shí)現(xiàn)智能定向或者受眾保護(hù)。與此同時(shí),參賽者需要綜合運(yùn)用機(jī)器學(xué)習(xí)領(lǐng)域的各種技術(shù)來(lái)實(shí)現(xiàn)更準(zhǔn)確的預(yù)估。
主辦方將為參賽者提供一組用戶在長(zhǎng)度為 91 天(3 個(gè)月)的時(shí)間窗口內(nèi)的廣告點(diǎn)擊歷史記錄作為訓(xùn)練數(shù)據(jù)集。每條記錄中包含了日期(從 1 到 91)、用戶信息(年齡,性別),被點(diǎn)擊的廣告的信息(素材 id、廣告 id、產(chǎn)品 id、產(chǎn)品類目 id、廣告主id、廣告主行業(yè) id 等),以及該用戶當(dāng)天點(diǎn)擊該廣告的次數(shù)。測(cè)試數(shù)據(jù)集將會(huì)是另一組用戶的廣告點(diǎn)擊歷史記錄。
提供給參賽者的測(cè)試數(shù)據(jù)集中不會(huì)包含這些用戶的年齡和性別信息。本賽題要求參賽者預(yù)測(cè)測(cè)試數(shù)據(jù)集中出現(xiàn)的用戶的年齡和性別,并以約定的格式提交預(yù)測(cè)結(jié)果。
解決方案:
Rank1: https://github.com/guoday/Tencent2020_Rank1st: Rank5: zhangqibot/Tencent2020_Top5(九)安泰杯 跨境電商智能算法大賽
問(wèn)題背景:
通過(guò)用戶歷史訂單數(shù)據(jù),預(yù)測(cè)用戶下一次購(gòu)買的商品。
解決方案:
Rank1: https://github.com/RainFung/Tianchi-AntaiCup-International-E-commerce-Artificial-Intelligence-Challenge(十)第二屆阿里巴巴大數(shù)據(jù)智能云上編程大賽
問(wèn)題背景
阿里云計(jì)算平臺(tái)深耕大數(shù)據(jù)以及人工智能領(lǐng)域,經(jīng)過(guò)多年錘煉,推出了MaxCompute、Dataworks、PAI、EMR等多款大數(shù)據(jù)相關(guān)領(lǐng)域云產(chǎn)品。智聯(lián)招聘作為國(guó)內(nèi)大型的綜合性招聘平臺(tái),二十多年行業(yè)深耕,為海量的求職者創(chuàng)造就業(yè)機(jī)會(huì),幫助企業(yè)找到心儀的人才。本次比賽將由智聯(lián)提供相關(guān)比賽數(shù)據(jù)和評(píng)估標(biāo)準(zhǔn),選手需要使用阿里云計(jì)算平臺(tái)的相關(guān)產(chǎn)品完成賽題。
本次大賽要求參賽者根據(jù)智聯(lián)招聘抽樣的經(jīng)過(guò)脫敏的求職者標(biāo)簽數(shù)據(jù)、職位信息、及部分求職者行為信息、用人單位反饋信息,訓(xùn)練排序模型,對(duì)求職者的職位候選集進(jìn)行排序,盡可能使得雙端都滿意的職位(求職者滿意以及用人單位滿意)優(yōu)先推薦。本次比賽里,假定對(duì)于曝光給求職者的職位候選集里,假如求職者感興趣會(huì)產(chǎn)生瀏覽職位行為,瀏覽職位后,如果求職者滿意會(huì)產(chǎn)生主動(dòng)投遞行為。用人單位收到求職者主動(dòng)投遞的簡(jiǎn)歷后會(huì)給出是否滿意的反饋信號(hào)。
解決方案:
Rank1: https://github.com/hydantess/TianChi_zhilianzhaopin Rank4: juzstu/TianChi_ZhiLianZhaoPin(十一)BDCI 2018 面向電信行業(yè)存量用戶的智能套餐個(gè)性化匹配模型
問(wèn)題背景:
電信產(chǎn)業(yè)作為國(guó)家基礎(chǔ)產(chǎn)業(yè)之一,覆蓋廣、用戶多,在支撐國(guó)家建設(shè)和發(fā)展方面尤為重要。隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和普及,用戶消耗的流量也成井噴態(tài)勢(shì),近年來(lái),電信運(yùn)營(yíng)商推出大量的電信套餐用以滿足用戶的差異化需求,面對(duì)種類繁多的套餐,如何選擇最合適的一款對(duì)于運(yùn)營(yíng)商和用戶來(lái)說(shuō)都至關(guān)重要,尤其是在電信市場(chǎng)增速放緩,存量用戶爭(zhēng)奪愈發(fā)激烈的大背景下。針對(duì)電信套餐的個(gè)性化推薦問(wèn)題,通過(guò)數(shù)據(jù)挖掘技術(shù)構(gòu)建了基于用戶消費(fèi)行為的電信套餐個(gè)性化推薦模型,根據(jù)用戶業(yè)務(wù)行為畫像結(jié)果,分析出用戶消費(fèi)習(xí)慣及偏好,匹配用戶最合適的套餐,提升用戶感知,帶動(dòng)用戶需求,從而達(dá)到用戶價(jià)值提升的目標(biāo)。
套餐的個(gè)性化推薦,能夠在信息過(guò)載的環(huán)境中幫助用戶發(fā)現(xiàn)合適套餐,也能將合適套餐信息推送給用戶。解決的問(wèn)題有兩個(gè):信息過(guò)載問(wèn)題和用戶無(wú)目的搜索問(wèn)題。各種套餐滿足了用戶有明確目的時(shí)的主動(dòng)查找需求,而個(gè)性化推薦能夠在用戶沒(méi)有明確目的的時(shí)候幫助他們發(fā)現(xiàn)感興趣的新內(nèi)容。
此題利用已有的用戶屬性(如個(gè)人基本信息、用戶畫像信息等)、終端屬性(如終端品牌等)、業(yè)務(wù)屬性、消費(fèi)習(xí)慣及偏好匹配用戶最合適的套餐,對(duì)用戶進(jìn)行推送,完成后續(xù)個(gè)性化服務(wù)。
解決方案:
Rank1: PPshrimpGo/BDCI2018-ChinauUicom-1st-solution Rank2: PandasCute/2018-CCF-BDCI-China-Unicom-Research-Institute-top2 rank6: ZengHaihong/2018_CCF_BDCI_ChinaUnicom_Package_Match_Rank6(十二)BDCI 2017 商場(chǎng)中精確定位用戶所在店鋪
問(wèn)題背景:
隨著互聯(lián)網(wǎng)移動(dòng)支付的迅速普及,我們享受到越來(lái)越多的生活便利。如當(dāng)您走入商場(chǎng)的某家餐廳時(shí),手機(jī)會(huì)自動(dòng)彈出該餐廳的優(yōu)惠券;當(dāng)您走入商場(chǎng)服裝店時(shí),手機(jī)可以自動(dòng)推薦這家店里您喜歡的衣服;在您路過(guò)商場(chǎng)一家珠寶店時(shí),手機(jī)可以自動(dòng)提示您想了很久的一款鉆戒已經(jīng)有貨了;離開商場(chǎng)停車場(chǎng)時(shí),手機(jī)在您的許可下可以自動(dòng)交停車費(fèi)。這些您所享受的貼心服務(wù)都離不開背后大數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的支持。在正確的時(shí)間、正確的地點(diǎn)給用戶最有效的服務(wù),是各大互聯(lián)網(wǎng)公司智能化拓展的新戰(zhàn)場(chǎng)。
本賽題目標(biāo)為在商場(chǎng)內(nèi)精確的定位用戶當(dāng)前所在商鋪。在真實(shí)生活中,當(dāng)用戶在商場(chǎng)環(huán)境中打開手機(jī)的時(shí)候,存在定位信號(hào)不準(zhǔn)、環(huán)境信息不全、店鋪信息缺失、不同店鋪空間距離太近等等挑戰(zhàn),因此如何精確的判斷用戶所在商鋪是一個(gè)難題。
本次大賽我們將提供在2017年8月份大概100家商場(chǎng)(復(fù)賽為2017年7-8月大概500家商場(chǎng))的詳細(xì)數(shù)據(jù),包括用戶定位行為和商場(chǎng)內(nèi)店鋪等數(shù)據(jù)(已脫敏),參賽隊(duì)伍需要對(duì)其進(jìn)行數(shù)據(jù)挖掘和必要的機(jī)器學(xué)習(xí)訓(xùn)練。另外,我們會(huì)提供2017年9月份的商場(chǎng)內(nèi)用戶數(shù)據(jù)來(lái)做評(píng)測(cè),檢測(cè)您的算法是否能準(zhǔn)確的識(shí)別出當(dāng)時(shí)用戶所在的店鋪。
解決方案:
Rank1: https://github.com/drop-out/Tianchi-Wifi-Positioning Rank7: totoruo/TianChi-Shop-Location-Competition Rank9: longxiong2016/Store_positioning(十三)圖靈聯(lián)邦視頻點(diǎn)擊預(yù)測(cè)大賽
問(wèn)題背景:
移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,催生了海量視頻數(shù)據(jù)的產(chǎn)生,也為用戶提供了類型豐富的視頻數(shù)據(jù)類型。面對(duì)如何從海量視頻數(shù)據(jù)類型中選擇用戶喜歡的類型的這一難題,作為一家擁有海量視頻素材和用戶行為的數(shù)據(jù)公司,希望通過(guò)用戶行為數(shù)據(jù),用戶特征,以及視頻特征,可以在充足數(shù)據(jù)基礎(chǔ)上精準(zhǔn)的推薦給用戶喜歡的視頻類型。
本次競(jìng)賽的目的是以用戶的視頻行為數(shù)據(jù)為基礎(chǔ),構(gòu)建推薦模型,參賽隊(duì)伍則需要搭建個(gè)性化推薦模型。希望參賽隊(duì)伍能夠挖掘數(shù)據(jù)背后豐富的內(nèi)涵,為移動(dòng)用戶在合適的時(shí)間、合適的地點(diǎn)精準(zhǔn)推薦用戶感興趣的內(nèi)容,提高用戶在數(shù)據(jù)集上的點(diǎn)擊行為。
解決方案:
Rank3: LogicJake/tuling-video-click-top3 Rank4: biaobiao2/video-click-top4 Rank6: https://github.com/ljhzxc/turingtopia_video_ctr Rank7: zavierhan/turing_video_ctr_top7 Rank9: Tersaiz/Turingtopia_Videos_CTR(十四)2017 達(dá)觀杯個(gè)性化推薦算法挑戰(zhàn)賽
問(wèn)題背景:
本次比賽選取了一批用戶(candidate.txt),以及一批候選資訊內(nèi)容數(shù)據(jù)(news_info.csv)用以推薦給用戶。同時(shí)提供了這批用戶在某3天(記為第N-2天、第N-1天和第N天)對(duì)資訊內(nèi)容的多種行為數(shù)據(jù),包括點(diǎn)擊、完整閱讀、評(píng)論、收藏、分享等,作為訓(xùn)練數(shù)據(jù)。
比賽目標(biāo)是針對(duì)這批用戶(candidate.txt)和候選資訊內(nèi)容數(shù)據(jù)(news_info.csv),預(yù)測(cè)每個(gè)用戶在第4天(記為第N+1天)會(huì)產(chǎn)生行為(任何行為類型都算)的資訊列表。每個(gè)用戶必須推薦5個(gè)最可能有行為的資訊且不可重復(fù),否則推薦結(jié)果視為無(wú)效。
解決方案:
Rank6: https://github.com/hecongqing/2017-daguan-competition(十五)2019 智源-看山杯專家發(fā)現(xiàn)算法大賽
問(wèn)題背景:
比賽將提供知乎的問(wèn)題信息、用戶畫像、用戶回答記錄,以及用戶接受邀請(qǐng)的記錄,要求選手預(yù)測(cè)這個(gè)用戶是否會(huì)接受某個(gè)新問(wèn)題的邀請(qǐng)。
1、問(wèn)題信息。包括<問(wèn)題id、問(wèn)題創(chuàng)建時(shí)間、問(wèn)題的話題、問(wèn)題的文本、問(wèn)題的描述>等。
2、用戶的回答。包括<回答id、問(wèn)題id、作者id、回答的文本、回答時(shí)間、點(diǎn)贊數(shù)、收藏?cái)?shù)、感謝數(shù)、評(píng)論數(shù)>等。
3、用戶人畫像數(shù)據(jù)。包括<用戶id、性別、活躍頻次、關(guān)注話題、長(zhǎng)期興趣、鹽值>等。
4、<topic、token(詞)、單字 64維 embedding >數(shù)據(jù)。
5、最近一月的邀請(qǐng)數(shù)據(jù)包括<問(wèn)題id、用戶id、邀請(qǐng)時(shí)間、是否回答>。
解決方案:
Rank3: https://github.com/Travisgogogo/BAAI-ZHIHU-2019 Rank4: https://github.com/VoldeMortzzz/2019Baai-zhihu-Cup-findexp-4th Rank6: https://github.com/liuchenailq/zhihu-findexp Rank7: jt120/BAAI-zhihu-2019(十六)Santander Product Recommendation
問(wèn)題背景:
準(zhǔn)備好為你的第一套房子付首付了嗎?或者想要杠桿化你的房產(chǎn)權(quán)益?為了支持一系列金融決策的需求,桑坦德銀行(Santander Bank)通過(guò)個(gè)性化產(chǎn)品推薦向客戶提供貸款。在桑坦德銀行目前的體系下,只有一小部分客戶得到了許多推薦,而其他許多客戶很少看到任何推薦導(dǎo)致客戶體驗(yàn)不均衡。在第二場(chǎng)競(jìng)爭(zhēng)中,桑坦德銀行向Kagglers發(fā)出挑戰(zhàn),要求他們根據(jù)過(guò)去的行為和類似客戶的行為,預(yù)測(cè)現(xiàn)有客戶下個(gè)月將使用哪些產(chǎn)品。桑坦德銀行擁有更有效的推薦體系,能夠更好的滿足所有客戶的個(gè)性化需求,無(wú)論客戶身在何處,都能確保客戶的滿意。
解決方案:
Rank2: ttvand/Santander-Product-Recommendation Rank8: yaxen/santander-product-recommendation-8th-place(十七)2018科大訊飛AI營(yíng)銷算法大賽
問(wèn)題背景:
本次大賽提供了訊飛AI營(yíng)銷云的海量廣告投放數(shù)據(jù),參賽選手通過(guò)人工智能技術(shù)構(gòu)建預(yù)測(cè)模型預(yù)估用戶的廣告點(diǎn)擊概率,即給定廣告點(diǎn)擊相關(guān)的廣告、媒體、用戶、上下文內(nèi)容等信息的條件下預(yù)測(cè)廣告點(diǎn)擊概率。
解決方案:
Rank1: https://github.com/bettenW/2018-iFLYTEK-Marketing-Algorithms-Competition-Finals-Rank1: Rank2: infturing/kdxf(十八)2018 騰訊廣告算法大賽
問(wèn)題背景:
Lookalike 技術(shù),設(shè)計(jì)基于種子用戶畫像和關(guān)系鏈尋找相似人群,即根據(jù)種子人群的共有屬性進(jìn)行自動(dòng)化擴(kuò)展,以擴(kuò)大潛在用戶覆蓋面,提升廣告效果。具體來(lái)講,種子包里包含有廣告主提交的一批已知種子用戶,可以當(dāng)作機(jī)器學(xué)習(xí)問(wèn)題中的正樣本。廣告平臺(tái)中有海量的非種子用戶,也有大量的廣告投放歷史數(shù)據(jù),可以幫助生成負(fù)樣本。有了正負(fù)樣本后,相似人群拓展就變?yōu)榱艘粋€(gè)機(jī)器學(xué)習(xí)問(wèn)題中的二分類問(wèn)題。在線上使用中,廣告平臺(tái)可以依據(jù)二分類模型算出的后驗(yàn)概率P(y|x) 來(lái)判定候選用戶與種子包里用戶的相似程度,最后將相似度最高的一批候選用戶作為最終的結(jié)果。由于Lookalike相似人群擴(kuò)展和廣告CTR有些類似,所以我們沿用了很多阿里媽媽搜索廣告轉(zhuǎn)化預(yù)測(cè)的特征和模型。
解決方案:
Rank3: https://github.com/DiligentPanda/Tencent_Ads_Algo_2018 Rank6: nzc/tencent-contest Rank7: https://github.com/guoday/Tencent2018_Lookalike_Rank7th: Rank9: ouwenjie03/tencent-ad-game Rank10: https://github.com/keyunluo/Tencent2018_Lookalike_Rank10th:總結(jié)
以上是生活随笔為你收集整理的推荐算法竞赛TOP方案合集的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 基于Spring MVC + Sprin
- 下一篇: 1096: 水仙花数(函数专题)C语言