滴滴 KDD CUP 2020 赛题详解
由滴滴主辦的 KDD Cup 2020 強(qiáng)化學(xué)習(xí)挑戰(zhàn)賽正式開賽,邀請(qǐng)全球算法高手共同挑戰(zhàn)共享出行領(lǐng)域優(yōu)化難題。本次比賽由數(shù)據(jù)競(jìng)賽網(wǎng)站 biendata.com 提供評(píng)測(cè)支持。
?
KDD Cup(國際知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘競(jìng)賽)由美國計(jì)算機(jī)協(xié)會(huì)知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘?qū)N瘯?huì)(ACM SIGKDD)發(fā)起,從 1997 年開始,每年舉辦一次,是國際公認(rèn)的數(shù)據(jù)挖掘領(lǐng)域的最高水平的賽事。該比賽同時(shí)面向企業(yè)界和學(xué)術(shù)界,每年都會(huì)吸引世界數(shù)據(jù)挖掘界的頂尖專家、學(xué)者、工程師、學(xué)生等參加,也被譽(yù)為是數(shù)據(jù)挖掘領(lǐng)域的「世界杯」。每年都有很多杰出的學(xué)術(shù)組織及科技申請(qǐng)承辦 KDD Cup,但最終只有擁有深厚的學(xué)術(shù)積累和行業(yè)實(shí)踐的機(jī)構(gòu)能夠脫穎而出。
?
今年 KDD Cup 2020 的 RL Track(強(qiáng)化學(xué)習(xí)賽道)最終由滴滴舉辦。在這一挑戰(zhàn)賽中,滴滴邀請(qǐng)全球參賽團(tuán)隊(duì)聚焦按需出行平臺(tái),嘗試應(yīng)用機(jī)器學(xué)習(xí)解決方案來提出智能策略,在確保用戶體驗(yàn)的基礎(chǔ)上,進(jìn)一步提高出行效率和司機(jī)收入。此次比賽滴滴共設(shè)計(jì)了訂單分配和車輛調(diào)度兩個(gè)任務(wù),在派單分配任務(wù)中,參賽團(tuán)隊(duì)需設(shè)計(jì)開發(fā)算法來指定在派單窗口內(nèi)的訂單和司機(jī)的匹配;而在車輛調(diào)度任務(wù)中,參賽團(tuán)隊(duì)需設(shè)計(jì)開發(fā)調(diào)度算法指引一批空閑司機(jī)開往指定目的地。兩個(gè)任務(wù)既可分別開發(fā),也有聯(lián)動(dòng)的空間。
?
比賽將主要基于滴滴蓋亞數(shù)據(jù)開放計(jì)劃脫敏數(shù)據(jù)集,該數(shù)據(jù)集包含一定時(shí)間內(nèi)滴滴平臺(tái)專車和快車在成都市部分區(qū)域內(nèi)的脫敏軌跡數(shù)據(jù),此外還新增加了其他比賽輔助數(shù)據(jù)。參賽團(tuán)隊(duì)提交的方案會(huì)在測(cè)試環(huán)境中進(jìn)行評(píng)估打分。
01
比賽背景
隨著智能手機(jī)在我們?nèi)粘I钪械钠占?#xff0c;按需出行(MoD)或網(wǎng)約車平臺(tái)已成為一種可行的解決方案,可以提供更及時(shí)和更個(gè)性化的運(yùn)輸服務(wù)。這樣的平臺(tái)包括滴滴、優(yōu)步和 Lyft。這些平臺(tái)可以把潛在的出行需求與合適的司機(jī)聯(lián)系起來,從而更有效地利用空置車輛,滿足日益增長的運(yùn)輸需求。高效率的按需出行系統(tǒng)可以為司機(jī)和乘客提供更好的用戶體驗(yàn):司機(jī)可以通過減少空轉(zhuǎn)時(shí)間獲得更高的收入,乘客等待時(shí)間會(huì)更短,滿意度也會(huì)更高。
?
按需出行系統(tǒng)的效率取決于時(shí)空中供需分布的協(xié)調(diào)程度。如果想要調(diào)整供給分布來更好地協(xié)調(diào)需求,從而優(yōu)化運(yùn)營效率,有兩個(gè)重要的問題:車輛調(diào)度(vehicle repositioning)和訂單分配(order dispatching)。訂單分配負(fù)責(zé)把空閑的車輛分配給等待中的出行訂單,并把乘客(和司機(jī))運(yùn)輸?shù)接唵谓K點(diǎn)。車輛調(diào)度是一種更主動(dòng)的策略,可以把閑置的車輛部署到預(yù)計(jì)未來會(huì)產(chǎn)生需求的特定位置。
02
比賽任務(wù)
比賽參賽者需要同時(shí)解決按需出行平臺(tái)上訂單分配(order dispatching)和車輛調(diào)度(vehicle repositioning)問題。參賽團(tuán)隊(duì)可以解決這兩個(gè)問題或其中之一。參賽者的算法將在一個(gè)模擬出行平臺(tái)環(huán)境中進(jìn)行評(píng)估。
比賽環(huán)境
測(cè)試環(huán)境中有所有車輛和出行訂單的狀態(tài)。每輛車同時(shí)只能為一個(gè)訂單提供服務(wù),即不考慮拼車。訂單分配算法可以根據(jù)車輛和訂單的狀態(tài),把閑置車輛分配給等待中的訂單。車輛和訂單都可以處于未被分配的狀態(tài)。測(cè)試環(huán)境每?jī)擅霑?huì)調(diào)用一次訂單分配算法并執(zhí)行分配任務(wù)。被指派的車輛會(huì)根據(jù)分派指引接到訂單乘客,并運(yùn)輸?shù)侥康牡亍H绻硞€(gè)訂單沒有在當(dāng)前時(shí)間窗口內(nèi)匹配到車輛,會(huì)被認(rèn)為丟失。如果等待的時(shí)間過長,乘客可以取消訂單。在乘客下車后,司機(jī)和車輛重新進(jìn)入空置狀態(tài)。在這種狀態(tài)下,司機(jī)可以接受訂單匹配。
?
參賽者還可以在測(cè)試環(huán)境中控制一組匿名車輛(5 輛)的重新定位。如果車輛的空置時(shí)間超過 L=5 分鐘的閾值,就有資格接受調(diào)度。測(cè)試環(huán)境會(huì)定期向調(diào)度算法發(fā)送選中車組內(nèi)可用車輛的狀態(tài)信息,而調(diào)度算法會(huì)讓司機(jī)把車開到某個(gè)特定的目的地。如果司機(jī)即將在當(dāng)前位置附近逗留,他們會(huì)停留 L 分鐘,直到另一個(gè)重定位請(qǐng)求被觸發(fā)。在選中車組之外的車輛會(huì)依據(jù)一組通用轉(zhuǎn)移概率完成空置移動(dòng)。被重新定位的車輛的沿球面(也就是大圓距離上的)速度被設(shè)置為三米每秒。
任務(wù)1:訂單分配
參賽團(tuán)隊(duì)會(huì)設(shè)計(jì)開發(fā)算法來指定在 2 秒窗口內(nèi)的訂單-司機(jī)匹配。在這個(gè)窗口內(nèi)的所有未接訂單和空閑車輛的狀態(tài)信息會(huì)被傳給算法。此算法模塊會(huì)在一天模擬中的每個(gè)窗口被調(diào)用。評(píng)估模擬會(huì)跑多天,日均司機(jī)總收入(按獎(jiǎng)勵(lì)單元計(jì)算)會(huì)作為本任務(wù)的得分。
任務(wù)2:車輛調(diào)度
參賽團(tuán)隊(duì)會(huì)設(shè)計(jì)開發(fā)調(diào)度算法給一小部分( 5 輛)事先設(shè)定的車輛。這些車輛的身份對(duì)于調(diào)度算法是未知的,所以調(diào)度算法不應(yīng)依賴于調(diào)度車輛的身份。這些車輛在連續(xù)空閑 5 分鐘后,會(huì)接受調(diào)度。模擬環(huán)境周期性的調(diào)用調(diào)度算法來指引這些空閑司機(jī)開往指定目的地。本任務(wù)的得分計(jì)算為受調(diào)度車輛司機(jī)的人均收入效率(單位時(shí)間的獎(jiǎng)勵(lì)單元收入)。
參賽團(tuán)隊(duì)的算法將在模擬環(huán)境中被評(píng)估分?jǐn)?shù),但參賽者無法訪問模擬環(huán)境。參賽團(tuán)隊(duì)可以選擇同時(shí)開發(fā)兩個(gè)算法或其中的一個(gè)算法(比賽組織者會(huì)提供一個(gè)分?jǐn)?shù)較低的樣例代碼)。
比賽的兩個(gè)任務(wù)策略有相關(guān)性(即在同一個(gè)環(huán)境中測(cè)試),但是仍然是非常不同的任務(wù),所以只專注一個(gè)任務(wù)并一定顯著影像另一任務(wù)的得分。
本次比賽的設(shè)置貼近真實(shí)的業(yè)務(wù)應(yīng)用場(chǎng)景。而在真實(shí)業(yè)務(wù)場(chǎng)景中,因?yàn)椴僮骱拓?cái)務(wù)上的風(fēng)險(xiǎn),所以通常不可能直接在生產(chǎn)系統(tǒng)中直接訓(xùn)練模型,探索數(shù)據(jù)。不過,歷史操作記錄通常可以提供充足的數(shù)據(jù)。我們可以搭建模擬器來評(píng)估各種算法,但很難照顧顯示生產(chǎn)系統(tǒng)中的所有細(xì)節(jié)。
03
比賽流程
開發(fā)階段
比賽提供給每個(gè)參賽團(tuán)隊(duì)一個(gè)開發(fā)包,包括公開數(shù)據(jù)集,樣本代碼,和其他需要的信息。開發(fā)比賽任務(wù)算法并不一定需要開發(fā)模擬器,但評(píng)估環(huán)境動(dòng)力學(xué)描述會(huì)提供給參賽團(tuán)隊(duì)參考使用。任務(wù)提交方式為代碼提交,模塊接口需符合任務(wù)要求。團(tuán)隊(duì)可在比賽論壇里討論技術(shù)和支持問題。
方案驗(yàn)證
方案提交通過 zip 文件從平臺(tái)提交,zip 文件內(nèi)的文件夾結(jié)構(gòu)需符合指定要求。每個(gè)團(tuán)隊(duì)每天最多可以提交 1 次到評(píng)估環(huán)境。評(píng)估會(huì)離線進(jìn)行。每個(gè)成功的提交會(huì)得到兩個(gè)得分,對(duì)應(yīng)訂單分配和車輛調(diào)度的評(píng)估指標(biāo)。得分會(huì)在排行榜上更新。
決賽評(píng)估階段
在開發(fā)階段兩個(gè)指標(biāo)上的任意一個(gè)排名前 25 的團(tuán)隊(duì)會(huì)進(jìn)入決賽評(píng)估階段。開發(fā)階段的最后一次提交代碼會(huì)在一個(gè)不同的(開發(fā)階段未見過的)測(cè)試評(píng)估環(huán)境中進(jìn)行評(píng)估。在最終總得分中,開發(fā)階段的最后得分占 40%,決賽評(píng)估階段的得分占 60%。所有決賽隊(duì)伍會(huì)在兩個(gè)指標(biāo)上分別排名。
04
參賽方式
本次比賽的參賽頁面如下,或點(diǎn)擊“閱讀原文”報(bào)名參賽:
https://biendata.com/competition/kdd_didi/
?
????
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁搜索「PaperWeekly」
點(diǎn)擊「關(guān)注」訂閱我們的專欄吧
關(guān)于PaperWeekly
PaperWeekly 是一個(gè)推薦、解讀、討論、報(bào)道人工智能前沿論文成果的學(xué)術(shù)平臺(tái)。如果你研究或從事 AI 領(lǐng)域,歡迎在公眾號(hào)后臺(tái)點(diǎn)擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結(jié)
以上是生活随笔為你收集整理的滴滴 KDD CUP 2020 赛题详解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 全球首次,国星宇航完成卫星在轨运行 AI
- 下一篇: 中文数据集有奖公开征集