解读 | 滴滴主题研究计划:机器学习专题+
解讀 | 滴滴主題研究計(jì)劃:機(jī)器學(xué)習(xí)專題(上篇)
2018年7月31日 管理員微信分享
復(fù)制頁面地址 復(fù)制成功滴滴主題研究計(jì)劃
滴滴希望通過開放業(yè)務(wù)場(chǎng)景,與學(xué)術(shù)界發(fā)現(xiàn)與定義問題,合作共贏解決領(lǐng)域難題,構(gòu)建高水平跨境知識(shí)與研究網(wǎng)絡(luò),構(gòu)筑產(chǎn)學(xué)研合作共同體。
?
2018年秋季期主題研究計(jì)劃包含機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、語音信號(hào)處理、地理信息技術(shù)和能源與汽車五大研究方向的15個(gè)來自滴滴真實(shí)業(yè)務(wù)場(chǎng)景。誠邀全球頂尖的學(xué)者與滴滴研究員共同探討前沿技術(shù)在出行領(lǐng)域的落地應(yīng)用,以真實(shí)場(chǎng)景驅(qū)動(dòng)技術(shù)革新。
?
2018年秋季期提交申報(bào)書截止日期8月19日。請(qǐng)您關(guān)注項(xiàng)目關(guān)鍵時(shí)間節(jié)點(diǎn),選定申報(bào)命題后提前完成申報(bào)工作。
?
主題研究計(jì)劃官方網(wǎng)址:
?
https://outreach.didichuxing.com/RFP
?
本期我們將介紹機(jī)器學(xué)習(xí)方向課題,希望大家可以找到與自己研究方向匹配的申報(bào)方向。
?
機(jī)器學(xué)習(xí)
一. 供需預(yù)測(cè)
1.技術(shù)方向
時(shí)空數(shù)據(jù) 人群轉(zhuǎn)移分析 城市出行
?
2.課題背景
出行領(lǐng)域的核心在于連接司機(jī)和乘客。如何有效利用這些信息通過大數(shù)據(jù)和機(jī)器學(xué)習(xí)的技術(shù)方案,對(duì)供給和需求進(jìn)行描述和建模,實(shí)現(xiàn)高頻出行下的供需平衡,是提升整個(gè)平臺(tái)效率和服務(wù)的關(guān)鍵。通過建立一個(gè)統(tǒng)一的供需實(shí)時(shí)預(yù)測(cè)系統(tǒng),通過基礎(chǔ)能力的建設(shè)和打磨,能賦能訂單分配、司機(jī)調(diào)度、導(dǎo)流、定價(jià)、產(chǎn)品策略等業(yè)務(wù)場(chǎng)景,提升整個(gè)出行平臺(tái)的效率。
?
3.研究目標(biāo)
針對(duì)上述關(guān)鍵問題,研究目標(biāo)包括不限于:
?
1. 時(shí)空數(shù)據(jù)預(yù)測(cè)
構(gòu)建出行場(chǎng)景下時(shí)空數(shù)據(jù)預(yù)測(cè)能力,其中涉及數(shù)據(jù)集組織、特征工程、模型訓(xùn)練和驗(yàn)證。對(duì)于時(shí)空數(shù)據(jù)的分析和研究一直是業(yè)界熱議的方向之一,而時(shí)空數(shù)據(jù)預(yù)測(cè)也一直是業(yè)界的一大難題,我們擬建立科學(xué)的評(píng)估體系,對(duì)輸出的預(yù)測(cè)能力提出以下要求:提供實(shí)時(shí)預(yù)測(cè)能力,達(dá)到數(shù)據(jù)可用性,適配節(jié)假日、極端天氣、突發(fā)事件等異常情況。
2. 人群轉(zhuǎn)移分析
出行場(chǎng)景的根本是人群的轉(zhuǎn)移,只有深入挖掘人群屬性及行為特征,才能對(duì)城市出行規(guī)律做出更加科學(xué)的解讀。
?
二.拼車算法研究
1.技術(shù)方向
研究拼車合乘算法,提升拼車系統(tǒng)的效率
?
2.課題背景
網(wǎng)約車的快速發(fā)展和普及,極大地提升了出行服務(wù)的體驗(yàn)和效率。同時(shí),車輛共享使得交通擁堵得到緩解,基于大數(shù)據(jù)的供需匹配與優(yōu)化技術(shù)也助力于智慧城市的建設(shè)。其中拼車通過行程共享,致力于進(jìn)一步提升車輛利用效率,以提供低價(jià)、高效、綠色的出行服務(wù)產(chǎn)品。
?
在更少的體驗(yàn)損失下,將更多的訂單組合在一起,也將極大提升拼車效率。拼車效率的實(shí)現(xiàn)依賴于定價(jià)能力, 需求結(jié)構(gòu)及分單能力, 且各部分作用相互耦合。定價(jià)模型靈活支持不同業(yè)務(wù)目標(biāo)下的基礎(chǔ)定價(jià)及補(bǔ)貼發(fā)放策略。出行需求結(jié)構(gòu)在不同城市差異巨大: 在相似體驗(yàn)約束下,達(dá)到同等效率所需的訂單數(shù)量在不同時(shí)空域上迥異。給定供需集合,分單模塊負(fù)責(zé)將需求與需求,供給與需求進(jìn)行實(shí)時(shí)匹配,并通過匹配算法及時(shí)序決策的優(yōu)化提升拼車效率。
?
三個(gè)部分的綜合影響最終決定了拼車效率的實(shí)現(xiàn),而各獨(dú)立部分影響面的量化及相互作用關(guān)系的描述,對(duì)整體策略能力進(jìn)化必不可少。
?
針對(duì)上述關(guān)鍵問題,研究目標(biāo)包括不限于:
1. 拼車分單時(shí)序決策優(yōu)化
實(shí)時(shí)拼車業(yè)務(wù)的一個(gè)主要特征是分單系統(tǒng)對(duì)出行需求的即時(shí)響應(yīng),意味著匹配決策需要在極短的時(shí)間內(nèi)完成。對(duì)某一訂單來說,在其生命周期中往往能參與多個(gè)訂單組合,且該訂單組合的集合隨時(shí)間變化并決定了此訂單匹配效率的優(yōu)化空間。因此,匹配決策需在當(dāng)前輪次的優(yōu)化力度及未來需求的隨機(jī)性之間做權(quán)衡。即不僅提升每一輪次的匹配效率,同時(shí)需考慮訂單在時(shí)序上所能參加的匹配輪次組合并決策最佳分配點(diǎn)。
?
2. 需求結(jié)構(gòu)與分單耦合關(guān)系建模
分單框架中的各要素如基礎(chǔ)匹配算法,時(shí)序決策優(yōu)化,體驗(yàn)參數(shù)控制等,在不同的需求結(jié)構(gòu)下,對(duì)于拼車效率的影響也相應(yīng)變化。因此,在不同的需求結(jié)構(gòu)下,需靈活地根據(jù)相適應(yīng)關(guān)系調(diào)整分單框架,從而使各要素的組合能更好地實(shí)現(xiàn)拼車效率。
?
3. 需求結(jié)構(gòu)建模
在同一城市中需求結(jié)構(gòu)是異質(zhì)化的,而基于業(yè)務(wù)目標(biāo),去有向地調(diào)整需求結(jié)構(gòu)十分重要。為不同時(shí)空域內(nèi)的需求建立屬性,可增強(qiáng)對(duì)輸入訂單集合的把控能力。如動(dòng)態(tài)泛線路的挖掘,及線路間影響關(guān)系的建模等 。
?
4. 繞路識(shí)別
拼車?yán)@路的實(shí)時(shí)識(shí)別,包括拼車子單內(nèi)送駕繞路,拼友接駕繞路,全拼單整體繞路,相鄰單繞路等的識(shí)別。一般來說,這個(gè)過程涉及異常問題定義,用戶反饋收集和清洗,特征數(shù)據(jù)集構(gòu)建,模型訓(xùn)練和驗(yàn)證。其中,問題的拆解和建模是最困難的。拼車?yán)@路場(chǎng)景有著豐富的內(nèi)涵,完成機(jī)器學(xué)習(xí)建模應(yīng)該滿足以下三個(gè)要求:
?
1)內(nèi)聚性
每個(gè)子問題場(chǎng)景都有一個(gè)清晰的定義,任何兩個(gè)子場(chǎng)景之間的邊界盡可能清晰。每個(gè)子場(chǎng)景的拆分定義具有較強(qiáng)的內(nèi)聚性。
?
2)全局性
各子問題場(chǎng)景間的相關(guān)性及子場(chǎng)景與總場(chǎng)景的關(guān)系,對(duì)問題的發(fā)現(xiàn)和早期問題的及時(shí)解決有較強(qiáng)的影響,需要統(tǒng)籌考慮。
?
3)模型指標(biāo)
模型需要通盤考慮準(zhǔn)確率、召回率對(duì)成本和用戶體驗(yàn)的平衡,同時(shí)兼顧模型判責(zé)的可解釋性。
?
5. 成單調(diào)度
根據(jù)訂單時(shí)間、費(fèi)用、里程、路況、空余座位、司機(jī)屬性、乘客屬性等特征,結(jié)合成本收益體驗(yàn)等建設(shè)基于深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的拼單調(diào)度策略,從而提升資源利用率和司乘體驗(yàn)。
?
1) 多目標(biāo)優(yōu)化
充分考慮司機(jī)、乘客利益和約束,實(shí)現(xiàn)司乘體驗(yàn)的優(yōu)化,體驗(yàn)和效率、平臺(tái)長期增長的均衡。
?
2) 模型指標(biāo)
在充分理解業(yè)務(wù)和數(shù)據(jù)的基礎(chǔ)上,分場(chǎng)景建設(shè)通用的靈活可配置的調(diào)度模型。實(shí)現(xiàn)拼成率、順路率等核心業(yè)務(wù)指標(biāo)的明顯提升。
?
三 . 派單算法研究
1.技術(shù)方向
組合優(yōu)化、強(qiáng)化學(xué)習(xí)、多目標(biāo)優(yōu)化、在線系統(tǒng)
?
2.課題背景
網(wǎng)約車服務(wù)在近年來得到了廣泛的普及和長足的發(fā)展。與傳統(tǒng)的巡游出租車相比,網(wǎng)約車的優(yōu)勢(shì)之一在于其存在中心化的決策機(jī)制,可按需在線地撮合乘客和司機(jī)間的匹配,從而達(dá)到提升平臺(tái)效率和司乘體驗(yàn)的效果。訂單分配(或派單)算法作為連接司機(jī)和乘客的橋梁,是網(wǎng)約車平臺(tái)中最核心的問題之一。
?
在實(shí)際應(yīng)用中,一個(gè)可用的訂單分配算法需要滿足幾下幾個(gè)要求:
?
1. 實(shí)時(shí)計(jì)算、運(yùn)行效率高
以滴滴平臺(tái)為例,每天平臺(tái)日訂單3000萬,這對(duì)算法的實(shí)時(shí)性和復(fù)雜度有了很高的要求;
?
2. 平衡效率、體驗(yàn)等多個(gè)目標(biāo)
在訂單分配算法中,平臺(tái)不僅要考慮整體的匹配效率,還需要滿足司乘體驗(yàn)的要求、公平性、可解釋性以及平臺(tái)長期增長的訴求。如何將這些目標(biāo)有機(jī)地結(jié)合在一起是一大難題。
從上述分析可知,派單任務(wù)無法簡單地由人工配置進(jìn)行,其對(duì)機(jī)器算法有著很強(qiáng)的依賴。從另一個(gè)角度來說,派單算法也是人工智能、機(jī)器學(xué)習(xí)、運(yùn)籌優(yōu)化等研究領(lǐng)域很好的實(shí)驗(yàn)土壤。綜上,派單問題可以作為學(xué)術(shù)和工業(yè)界結(jié)合的重要應(yīng)用之一。
?
3.研究目標(biāo)
針對(duì)上述關(guān)鍵問題,研究目標(biāo)包括不限于:
?
1. 匹配算法框架
在訂單分配問題中,一個(gè)重要的特性是其存在網(wǎng)絡(luò)效應(yīng)和時(shí)序效應(yīng)。具體來說,網(wǎng)約車為一個(gè)司乘的雙邊市場(chǎng),司乘間的匹配皆不是互相獨(dú)立的,其在時(shí)間和空間上組成了一個(gè)網(wǎng)絡(luò)狀的結(jié)構(gòu)。同時(shí),派單中需要考慮平臺(tái)效率、司乘體驗(yàn)、公平性等多種因素,形成了多目標(biāo)優(yōu)化的問題。因此,設(shè)計(jì)一個(gè)可滿足以上條件的匹配框架,平衡優(yōu)化目標(biāo)和約束,并綜合時(shí)間序列和空間匹配要求,非常有研究價(jià)值。
?
2. 個(gè)性化派單
根據(jù)用戶實(shí)時(shí)狀態(tài)以及用戶特性的不同,進(jìn)行個(gè)性化的分單,以提升司乘和效率。
?
3. 派單公平性和可解釋性
滴滴的線上分單系統(tǒng)每天為大量的司機(jī)和乘客服務(wù),其服務(wù)對(duì)象均為有感情有訴求的個(gè)體,故算法的可解釋性和公平性往往與平臺(tái)效率、體驗(yàn)處于同樣重要的作用。如何把公平性引入優(yōu)化目標(biāo)或約束中,并生成可解釋可回溯的匹配標(biāo)準(zhǔn),也是算法必須要考慮的問題。
?
注意
更多項(xiàng)目信息
請(qǐng)關(guān)注主題研究計(jì)劃官方主頁:
https://outreach.didichuxing.com/RFP
?
本文來自 滴滴學(xué)術(shù)合作 微信號(hào)。
總結(jié)
以上是生活随笔為你收集整理的解读 | 滴滴主题研究计划:机器学习专题+的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AAAI 2018经典论文获奖者演讲:本
- 下一篇: 一个完整的算法开发