日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

饿了么研发总监马尧:外卖推荐算法中有哪些机制与手段?

發(fā)布時(shí)間:2025/3/19 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 饿了么研发总监马尧:外卖推荐算法中有哪些机制与手段? 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

提到市場機(jī)制和調(diào)控手段,大家可能會(huì)想起某些中央機(jī)構(gòu),而在流量的分發(fā)方面,我們的角色是類似的,搜索推薦是餓了么的核心流量入口,我們通過市場機(jī)制來實(shí)現(xiàn)流量效率的最大化,而調(diào)控手段更多的是兼顧效率和平臺(tái)長期目標(biāo)以及流量生態(tài)的健康。

今天分享的內(nèi)容分以下幾個(gè)方面,首先是餓了么外賣推薦業(yè)務(wù)形態(tài),然后是搜索推薦平臺(tái)的目標(biāo)與定位;接下來會(huì)聊聊在外賣推薦領(lǐng)域的特殊挑戰(zhàn),以及外賣推薦算法中的一些市場機(jī)制和調(diào)控手段。

1.餓了么外賣推薦業(yè)務(wù)形態(tài)

前面提到過,搜索推薦是餓了么核心的流量分發(fā)入口,平臺(tái)90%以上的用戶在下單前的決策是通過各種各樣的搜索推薦產(chǎn)品實(shí)現(xiàn)的。我們每天負(fù)責(zé)千萬級(jí)訂單的精準(zhǔn)匹配,涉及首頁推薦、搜索、金剛?cè)肟凇⒒顒?dòng)會(huì)場、發(fā)現(xiàn)頁、訂單頁等不同業(yè)務(wù)場景。平臺(tái)方面除了餓了么APP外賣,還有支付寶里面的外賣、手機(jī)淘寶里面的外賣等很多阿里系流量。類目方面也更加豐富,除了美食餐飲外賣,還有水果、買生鮮、醫(yī)藥、鮮花等可以通過外賣實(shí)現(xiàn)。

外賣業(yè)務(wù)的簡要流程:首先用戶進(jìn)入app會(huì)有一個(gè)瀏覽行為,訪問某個(gè)模塊后點(diǎn)擊某一個(gè)商家或者美食到達(dá)店內(nèi),然后會(huì)有一個(gè)選擇和加購物車的過程,再之后達(dá)成訂單。前面的步驟看起來和傳統(tǒng)電商是類似的,但是有一個(gè)核心區(qū)別點(diǎn)在于用戶下單完成后還有一個(gè)商家的出餐和即時(shí)配送的過程,這個(gè)下單后的環(huán)節(jié)也是會(huì)影響用戶的整個(gè)體驗(yàn)的,需要在推薦場景中考慮。

2. 餓了么搜索推薦平臺(tái)的?標(biāo)與定位

餓了么推薦平臺(tái)作為流量分發(fā)的中樞連接著幾個(gè)不同的角色,包括用戶(流量)、商家(供給)還有平臺(tái)本身,需要明確好定位。對(duì)于用戶/流量側(cè)主要是為用戶提供良好的決策體驗(yàn),幫助用戶選擇滿意的餐廳和美食,并優(yōu)化好用戶的整個(gè)鏈路的體驗(yàn)。對(duì)于商家側(cè)需要帶來精準(zhǔn)的流量,帶來訂單提升,并不斷提升商家曝光效率,幫助商家在平臺(tái)上成長。最后對(duì)于平臺(tái)而言,核心是提供流量的變現(xiàn)、交易的價(jià)值以及建設(shè)好健康的流量生態(tài),為平臺(tái)的長期目標(biāo)服務(wù)。

3. 外賣推薦的特殊挑戰(zhàn)

這里聊一下外賣推薦的一些特殊挑戰(zhàn),第一點(diǎn),區(qū)別于傳統(tǒng)搜索和電商,在用戶下單后有一個(gè)即時(shí)配送的過程,而配送滿意與否也是關(guān)于用戶體驗(yàn)的重要因素,因?yàn)橥赓u用戶通常是時(shí)間敏感的,尤其是午餐和晚餐高峰期。通常而言,用戶對(duì)商家的喜好以及是否轉(zhuǎn)化是衡量推薦質(zhì)量的一個(gè)重要因素,但在外賣存在一個(gè)情況就是雖然偏好商家,但是下單后很久才送到,用戶對(duì)商家很喜愛但是整個(gè)鏈路的時(shí)間體驗(yàn)比較差,這是我們?cè)诹髁糠职l(fā)階段需要考慮的問題,轉(zhuǎn)化率、決策效率、配送時(shí)長等需要綜合考慮。第二點(diǎn)就是峰值效應(yīng)比較明顯,高峰是平時(shí)幾十倍,峰值又比較尖,類似于秒殺,這在工程上會(huì)帶來很大的挑戰(zhàn),同時(shí),高峰期用戶行為分布變化比較快,對(duì)如何快速捕捉用戶行為提出了比較高的要求。第三點(diǎn)是即時(shí)性資源約束和限制,餐廳資源、物流騎手運(yùn)營資源都是在固定時(shí)間比較有限的,如何在多重約束情況下綜合優(yōu)化用戶體驗(yàn)也是一個(gè)挑戰(zhàn)。最后一點(diǎn),區(qū)域化會(huì)和流量宏觀調(diào)控有關(guān)系,外賣的流量成點(diǎn)狀區(qū)域分布,網(wǎng)格效應(yīng)弱,并且每個(gè)區(qū)域的城市發(fā)展、外賣階段、流量分布是不同的,不同的地區(qū)有不同的目標(biāo),也對(duì)應(yīng)著不同的流量策略,因此流量的調(diào)控手段顯得格外重要。

為了解決這些問題,我們簡單地分為兩個(gè)層次解決,市場機(jī)制是下面三塊,主要是解決效率最大化問題,包括識(shí)別挖掘類、精準(zhǔn)召回算法、智能化排序算法。而調(diào)控手段更多的是偏產(chǎn)品和業(yè)務(wù)規(guī)則,同時(shí)對(duì)規(guī)則中也會(huì)融入一些算法實(shí)現(xiàn)流量扶持、長期目標(biāo)、生態(tài)目標(biāo)的均衡。包括兼顧用戶體驗(yàn)的策略,扶持特殊業(yè)務(wù)的策略,新店店長成長策略等。

4. 外賣推薦算法中的市場機(jī)制

外賣推薦算法中的市場機(jī)制方面主要是把效率最大化的目標(biāo)與算法目標(biāo)做了一些關(guān)聯(lián)。基于現(xiàn)有流量及供給,通過深入挖掘、精準(zhǔn)匹配及智能化排序機(jī)制去實(shí)現(xiàn)用戶體驗(yàn)和平臺(tái)效率最大化。

對(duì)推薦算法目標(biāo)拆解如上圖所示,在外賣領(lǐng)域有四個(gè)重要角色,流量、供給、轉(zhuǎn)化和履約。搜索推薦對(duì)用戶下單轉(zhuǎn)化起到關(guān)鍵作用,會(huì)將目標(biāo)拆解為不同子模型。如GMV會(huì)分解為點(diǎn)擊模型、轉(zhuǎn)化模型、客單價(jià)模型,如果考慮每單收益時(shí)會(huì)建立單筆收益模型,還有偏向于用戶體驗(yàn)的指標(biāo),如決策效率 、就餐體驗(yàn)、等待時(shí)間,也會(huì)建模去優(yōu)化。

優(yōu)化目標(biāo)大的節(jié)奏上經(jīng)歷了從轉(zhuǎn)化率—\u0026gt;訪購率 —\u0026gt; 毛GMV —\u0026gt; 凈GMV—\u0026gt; 凈GMV+UE,早期以優(yōu)化轉(zhuǎn)化率為主,但外賣平臺(tái)具有很高的消費(fèi)頻次,很多用戶一天之內(nèi)下單超過2單以上,因此優(yōu)化目標(biāo)又調(diào)整為訪購率(訂單量/UV),除轉(zhuǎn)化率外還要優(yōu)化用戶的下單頻次。后續(xù)為了平衡用戶體驗(yàn)和平臺(tái)目標(biāo),同時(shí)加強(qiáng)品質(zhì)感,并兼顧高客單價(jià)商家的訴求,優(yōu)化目標(biāo)調(diào)整為GMV(交易額),為此也引入了客單價(jià)預(yù)估模型。再后來,為了打擊虛假自營銷和虛抬物價(jià)等行為,優(yōu)化目標(biāo)又調(diào)整為實(shí)付GMV。目前,隨著平臺(tái)目標(biāo)新一輪的變化,我們正在嘗試對(duì)新的目標(biāo)進(jìn)行優(yōu)化。

外賣推薦系統(tǒng)架構(gòu)與大部分推薦系統(tǒng)架構(gòu)類似,底層是基礎(chǔ)設(shè)施層,包括大數(shù)據(jù)處理的Spark、Hadoop,深度學(xué)習(xí)工具TensorFlow,分布式EKV,還有做實(shí)時(shí)計(jì)算的平臺(tái)及工具。目前融入阿里經(jīng)濟(jì)體后,在服務(wù)和數(shù)據(jù)上會(huì)進(jìn)行一個(gè)打通,以便更好地融入阿里技術(shù)體系。

數(shù)據(jù)/特征層包括數(shù)據(jù)的埋點(diǎn)、收集、清洗、加工、建模、應(yīng)用等多個(gè)環(huán)節(jié),特征部分非常關(guān)鍵,包括通過人工的特征工程以及通過模型做很多特征,包括用戶維度、商家維度、上下文維度的特征。

算法模型層核心是召回和排序,外賣場景是一個(gè)強(qiáng)LBS屬性的場景,召回主要是基于LBS搜索;后面也加入了標(biāo)簽化、向量化的召回。去年我們?cè)谶@塊做了一些不錯(cuò)的嘗試。比如說標(biāo)簽召回,前面提到過本地化的一個(gè)挑戰(zhàn)在于信息的非結(jié)構(gòu)化,商家上傳的菜品各式各樣,直接通過文本匹配效果是不夠好的。為此我們先通過離線挖掘的方案,挖掘菜品的口味、食材、菜系、做法等標(biāo)簽化表示,在搜索階段,再通過標(biāo)簽進(jìn)行召回,有效的解決了意圖匹配的問題。向量化主要是對(duì)商品、美食、搜索詞等通過word2vec、Item2vec等方法生成其向量化的表示,是一種更加泛化的表達(dá),生成向量后,基于向量的相似度進(jìn)行召回。該方法在各個(gè)模塊取得了不錯(cuò)的效果,其中在無結(jié)果推薦等模塊甚至取得數(shù)倍轉(zhuǎn)化率的提升。另外,在精準(zhǔn)召回環(huán)節(jié)往往還會(huì)進(jìn)行一輪粗排,主要是為了在效果和性能上進(jìn)行更好的平衡。

智能化排序(Rank)環(huán)節(jié)在外賣這種強(qiáng)LBS熟悉的業(yè)務(wù)下更為關(guān)鍵,會(huì)對(duì)召回環(huán)節(jié)的結(jié)果通過模型進(jìn)行重排序,以達(dá)到更優(yōu)的體驗(yàn)和業(yè)務(wù)目標(biāo)。在這個(gè)環(huán)節(jié),我們經(jīng)歷了算法模型和優(yōu)化目標(biāo)的多次升級(jí),后面會(huì)重點(diǎn)介紹下。

最上層是產(chǎn)品/業(yè)務(wù)層,會(huì)更偏一些調(diào)控策略。右側(cè)所示會(huì)有一些通用服務(wù),如實(shí)時(shí)數(shù)據(jù)服務(wù)、畫像服務(wù)、特征服務(wù)等。

在線服務(wù)架構(gòu):用戶請(qǐng)求過來后,Rank服務(wù)會(huì)主要負(fù)責(zé)請(qǐng)求分發(fā)、結(jié)果聚合以及用戶策略調(diào)整。會(huì)將請(qǐng)求依據(jù)用戶場景發(fā)送到搜索服務(wù)集群或者推薦召回集群,會(huì)做一個(gè)相應(yīng)的召回和初排。真正的模型預(yù)測是在模型預(yù)測服務(wù),會(huì)做機(jī)器學(xué)習(xí)預(yù)測或者精排。

Rank模型升級(jí)路線

升級(jí)路線:

從先前的人工規(guī)則演進(jìn)到線性模型的LR,再到后來的非線性模型以及模型融合階段,然后到深度學(xué)習(xí)和在線學(xué)習(xí)為主的模型。總體來看模型復(fù)雜度越來越高,時(shí)效性越來越快,由最開始的天級(jí)到后來的流式秒級(jí)更新。優(yōu)化目標(biāo)也會(huì)結(jié)合平臺(tái)目標(biāo)進(jìn)行演進(jìn),目前主要是基于GMV+用戶整體體驗(yàn)最大化。雖然模型復(fù)雜度越來越高、時(shí)效性越來越強(qiáng),但是模型總體收益與原來相比越來越少,如LR與人工規(guī)則相比相差10%,再到GBDT/GBDT+FTRL為主就是5個(gè)百分點(diǎn)提升。到深度學(xué)習(xí)模型階段,工程與算法復(fù)雜性進(jìn)一步提升,但收益的提升也進(jìn)一步縮窄。

接下來介紹下Wide\u0026amp;Deep模型在排序上的應(yīng)用,主要參照的是Google發(fā)布的論文做了一些改造,第一點(diǎn)是在Wide部分加入了GBDT的葉子節(jié)點(diǎn),包括點(diǎn)擊模型和下單模型。因?yàn)槲覀兪菑腉BDT遷移過來,很多工作可以復(fù)用,在deep部分加入一些預(yù)訓(xùn)練的商家特征或者用戶特征的embedding,或者相互間融合。后面又嘗試了DeepFM模型,總體結(jié)構(gòu)和論文中一致,改方案充分利用了DNN在學(xué)習(xí)高階交互特征方面的能力以及FM在學(xué)習(xí)二階交互特征方面的能力,完全避免的人工構(gòu)建特征,是一個(gè)端到端的模型 ,線上實(shí)驗(yàn)效果上也更佳。

在線學(xué)習(xí)與實(shí)時(shí)引擎

在線學(xué)習(xí)在外賣推薦中應(yīng)用主要是解決用戶行為變化快的問題以及商家經(jīng)營狀況、運(yùn)力、天氣等因素隨時(shí)變化。通過對(duì)實(shí)時(shí)生態(tài)體系的不斷完善,實(shí)時(shí)樣本流構(gòu)建、實(shí)時(shí)特征、實(shí)時(shí)模型更新和評(píng)估等方案逐步成熟,基于此上線的多步融合的xgboost+FTRL取得了大幅提升,在一段時(shí)間內(nèi)是效果最好的模型。主要采用Google論文算法FTRL,優(yōu)點(diǎn)有可以產(chǎn)生稀疏解、收斂速度很好、支持并行化處理、可以訓(xùn)練大規(guī)模模型、工程實(shí)現(xiàn)簡單。

左邊是實(shí)時(shí)效果引擎,會(huì)基于在線排序引擎會(huì)將業(yè)務(wù)日志和用戶行為埋點(diǎn)數(shù)據(jù)做一個(gè)聚合,生成一個(gè)實(shí)時(shí)樣本流。然后進(jìn)入在線訓(xùn)練模型做一個(gè)實(shí)時(shí)模型訓(xùn)練和更新,排序引擎會(huì)定期加載模型訓(xùn)練的參數(shù),用于線上的排序。

從模型結(jié)構(gòu)上看,將GBDT和FTRL進(jìn)行融合,會(huì)輸出GBDT的葉子節(jié)點(diǎn),將人工特征進(jìn)入模型進(jìn)行一個(gè)預(yù)測。

目前前面三個(gè)模型在線上不同應(yīng)用場景模型復(fù)雜度等方面都有流量在跑,推薦技術(shù)升級(jí)路線總體路線也包含了數(shù)據(jù)、特征、模型還有業(yè)務(wù)理解升級(jí)。

5. 外賣推薦算法中的調(diào)控手段

調(diào)控手段主要用來解決長期平臺(tái)生態(tài)問題,是效率最大化的基礎(chǔ)上的流量再分配。兼顧平臺(tái)的短期目標(biāo)與長期目標(biāo)。包括多個(gè)方面的平衡。如果單純以最大化單日GMV為目標(biāo),會(huì)存在多方面的問題,比如流量分布的馬太效應(yīng)以及新店成長問題。

? 用戶對(duì)商家、商品的偏好以及總體滿意度方面的平衡

? 當(dāng)天立即下單轉(zhuǎn)化的需求和對(duì)用戶興趣探索成本的平衡;

? 自然流量效率和商家在平臺(tái)成長或賦能線下商家間的平衡;

? 平臺(tái)短期收益和長期生態(tài)間的平衡。

? 不同業(yè)務(wù)線間流量平衡、短期平臺(tái)廣告收入與平臺(tái)轉(zhuǎn)化間的平衡。

針對(duì)這些問題采用很多調(diào)控手段解決這些問題,比如利用多模型融合結(jié)局用戶當(dāng)前轉(zhuǎn)化率與滿意度的問題,預(yù)估用戶下單時(shí)的總體時(shí)長與轉(zhuǎn)化率的關(guān)系。用EE算法迫近流量比例去促進(jìn)新店成長,還有用戶興趣的邊界探索與擴(kuò)展,防止過度個(gè)性化問題。配置區(qū)域化優(yōu)化目標(biāo),將一定流量賦能線下,支持區(qū)域化的特定目標(biāo)或者對(duì)特定業(yè)務(wù)支持,最后一點(diǎn)是長短期目標(biāo)平衡,短期GMV目標(biāo)+復(fù)購率boost,短期GMV只考慮到當(dāng)次收益最大化,需要加入復(fù)購率來平衡長期目標(biāo)。還有廣告收入vs 平臺(tái)轉(zhuǎn)化流量,通過AB Test來控制廣告流量密度,通過流量驅(qū)動(dòng)外賣商家提升,改善經(jīng)營水平。

一些嘗試:

(1)對(duì)用戶生命周期分析,核心的流失原因有(對(duì)商品滿意,對(duì)服務(wù)或配送不滿意,商家不夠豐富or推薦過窄),策略是通過多個(gè)目標(biāo)模型的融合,轉(zhuǎn)化模型(當(dāng)下轉(zhuǎn)化率/GMV)+滿意度模型(用戶整體體驗(yàn));復(fù)購率boost:流重新分配,盡量向?復(fù)購率商戶傾斜,促進(jìn)回訪和復(fù)購;新鮮感:分配?定?例流量E\u0026amp;E。

(2)區(qū)域化定制?標(biāo)與流量分配,起先依據(jù)城市建立模型,但是不理解每個(gè)城市目標(biāo)是不一樣的,只是做一個(gè)分開的建模優(yōu)化其轉(zhuǎn)化率。目前是針對(duì)每一個(gè)區(qū)域做一個(gè)目標(biāo)配置化,或者拿出一定的流量分配到特定的商家或商戶。

(3)外賣推薦調(diào)控手段——E\u0026amp;E

為了在扶持和效率上做一些平衡,介入了一些算法機(jī)制,如EE算法去解決新店成長扶持、區(qū)域化業(yè)務(wù)流量扶持、用戶新鮮感策略。策略也經(jīng)過一定的演化,從早期的鎖定位到輪播策略到現(xiàn)在的探索利用。常用的MAB算法有Thompson sampling、 Epsilon-Greedy、UCB、Lin UCB。

算法我們也做了一些探索,如冷啟動(dòng)流量扶持,流量質(zhì)量探索。Explore階段是結(jié)合業(yè)務(wù)經(jīng)驗(yàn)會(huì)賦予初始優(yōu)先級(jí),再加上Thompson sampling和定期清空參數(shù)做到足夠的探索。利用階段,用商家累計(jì)統(tǒng)計(jì)收益做一個(gè)利用,在外賣場景會(huì)出現(xiàn)不同時(shí)間場景、用戶用統(tǒng)計(jì)收益不準(zhǔn)確,因此用統(tǒng)計(jì)收益結(jié)合預(yù)估收益做利用。在新店扶持方面曝光效率和人工相比提升70%,新店扶成率提升30%。

作者介紹:

馬堯,餓了么研發(fā)總監(jiān),搜索推薦及商業(yè)策略研發(fā)負(fù)責(zé)人。目前負(fù)責(zé)流量分發(fā)和變現(xiàn)領(lǐng)域的技術(shù)體系,包括搜索、推薦、Rank以及廣告技術(shù)在餓了么平臺(tái)的應(yīng)用,帶領(lǐng)團(tuán)隊(duì)建立起搜索推薦的技術(shù)體系,并將機(jī)器學(xué)習(xí)全面引入各項(xiàng)核心業(yè)務(wù),對(duì)使用數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)提升用戶體驗(yàn)、平臺(tái)營收以及賦能商家方面有豐富實(shí)踐。曾任職美團(tuán)點(diǎn)評(píng)和騰訊。

本文來自馬堯在 DataFun 社區(qū)的演講,由 DataFun 編輯整理。

總結(jié)

以上是生活随笔為你收集整理的饿了么研发总监马尧:外卖推荐算法中有哪些机制与手段?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。