日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

开源-BDCI2018供应链需求预测模型第一名解决方案和代码

發(fā)布時間:2025/3/8 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 开源-BDCI2018供应链需求预测模型第一名解决方案和代码 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

本人經(jīng)過作者同意,公布了:BDCI2018供應(yīng)鏈需求預(yù)測數(shù)據(jù)競賽第一名的解決方案和代碼。該方案利用賽題為運用平臺積累最近1年多的商品數(shù)據(jù)預(yù)測45天后5周每周(week1~week5)的銷量,為供應(yīng)鏈提供數(shù)據(jù)基礎(chǔ),將能夠為出海企業(yè)建立全球化供應(yīng)鏈方案提供關(guān)鍵的技術(shù)支持。

賽題介紹

1.賽題名稱

供應(yīng)鏈需求預(yù)測

2.賽題網(wǎng)址:

https://www.datafountain.cn/competitions/313/details

3.賽題背景

主辦方:中國計算機學(xué)會 & 執(zhí)御

浙江執(zhí)御信息技術(shù)有限公司是一家專注出海的跨境電商企業(yè),利用移動互聯(lián)網(wǎng)創(chuàng)新和大數(shù)據(jù)應(yīng)用,助力中國制造升級,將中國和全球的優(yōu)質(zhì)品牌、設(shè)計、產(chǎn)品輸送到“一帶一路”沿線國家和地區(qū)。在電商產(chǎn)業(yè)鏈中,為提升用戶物流服務(wù)體驗,供應(yīng)鏈協(xié)同將貨品提前準備在全球各個市場的本地倉,可有效降低物流時間,極大提升用戶體驗。不同于國內(nèi)電商物流情況,出海電商的產(chǎn)品生產(chǎn)和銷售地區(qū)是全球化的,商品的采購,運輸,海關(guān)質(zhì)檢等,整個商品準備鏈路需要更長的時間。在大數(shù)據(jù)和人工智能技術(shù)快速發(fā)展的新時代背景下,運用大數(shù)據(jù)分析和算法技術(shù),精準預(yù)測遠期的商品銷售,為供應(yīng)鏈提供數(shù)據(jù)基礎(chǔ),將能夠為出海企業(yè)建立全球化供應(yīng)鏈方案提供關(guān)鍵的技術(shù)支持。

4.賽題任務(wù)

供應(yīng)鏈需求預(yù)測,對原問題做建模問題簡化??紤]商品在制造,國際航運,海關(guān)清關(guān),商品入倉的供應(yīng)鏈過程,實際的產(chǎn)品準備時長不同。這里將問題簡化,統(tǒng)一在45天內(nèi)完成,供應(yīng)鏈預(yù)測目標市場為沙特阿拉伯。賽題為運用平臺積累最近1年多的商品數(shù)據(jù)預(yù)測45天后5周每周(week1~week5)的銷量。

具體任務(wù)見賽題網(wǎng)址:

https://www.datafountain.cn/competitions/313/details

團隊介紹

隊名:你們偷塔,我來團

隊員:張予琛、羅律、羅賓理、朱丹青、江洪水

  • 張予琛,中南大學(xué)研究生在讀、電投輪機賽亞軍

  • 羅律,中南大學(xué)研究生在讀、電投輪機賽亞軍

  • 羅賓理,中南大學(xué)本科在讀、2018 KDD CUPTOP1,也創(chuàng)造了最小年齡的該獎項的獲得者記錄、2018 IJCAI TOP3、工業(yè)AI智能制造全球top2、智慧中國杯,鳳凰金融量化投資大賽top1、第十屆英特爾杯特等獎和最具創(chuàng)意潛力獎、湖南省挑戰(zhàn)杯金獎和全國銅獎。

團隊成績:1/1458 (最終排名)

賽題方案

1.賽題理解

此賽題為供應(yīng)鏈需求預(yù)測,提供了執(zhí)御平臺一部分商品一年多的銷售和其他相關(guān)日常數(shù)據(jù),要求預(yù)測部分sku 45天后的五周內(nèi)銷量。首先,這是一個典型的時間序列回歸問題。使用傳統(tǒng)的時間序列回歸方法進行預(yù)測應(yīng)該能夠起到一個還不錯的效果,可以作為一個Baseline模型。進一步的,可以構(gòu)建訓(xùn)練集,抽取一些與sku未來銷量相關(guān)性高的特征來進行機器學(xué)習(xí)模型的訓(xùn)練,把這個問題看作一個回歸問題使用機器學(xué)習(xí)的方法進行預(yù)測。

??

2.數(shù)據(jù)分析

在復(fù)賽中,總共提供了上百萬個sku的2017年3月到2018年3月16的歷史數(shù)據(jù),要求預(yù)測其中十五萬個sku在2018年5月1號開始的五周的每周銷量。因為要預(yù)測的銷量的時間單位是周,所以我們在歷史數(shù)據(jù)中新增了一個用于表示當(dāng)前時間距離2018年3月16日有多少周的列。圖1是每周全部sku的總銷量圖,圖中我們可以看出,在15周(也就是2017年11月左右)的時候,總銷量出現(xiàn)了異常高峰,明顯高于其他時期。我們推測這段時間應(yīng)該是平臺在搞大型促銷活動,所以才會導(dǎo)致出現(xiàn)如此的異常銷量高峰,在構(gòu)建訓(xùn)練集和提取特征時應(yīng)該注意避開這段時期或者進行平滑處理。通過對要進行預(yù)測的sku_id的分析,我們發(fā)現(xiàn)要求進行銷量預(yù)測的sku都是在2018年3月有過銷量的sku,也就是說此賽題是預(yù)測近期活躍sku的未來銷量。于是,我們在構(gòu)建訓(xùn)練集的時候,可以考慮模擬這種抽取近期活躍的sku的方式來構(gòu)建線下訓(xùn)練集。

要求進行銷量預(yù)測的時間的2018年5月起的五周,然后這個賽題的目標市場是在沙特阿拉伯。我們注意到,在這段時間內(nèi),有沙特阿拉伯的重要節(jié)日,開齋節(jié)。我們認為,平臺在這段時間應(yīng)該也會進行相應(yīng)的促銷活動,通過對平臺活動數(shù)據(jù)的分析發(fā)現(xiàn)果然如此,所以這段時間的銷量必然會有個起伏的過程,可以根據(jù)平臺活動節(jié)奏適當(dāng)對預(yù)測銷量進行調(diào)整。

圖1

3.特征工程

我們首先用時間序列加權(quán)回歸的方法做了一個基礎(chǔ)的模型,sku未來的銷量肯定與歷史銷量有關(guān),越是離得近的銷量數(shù)據(jù)越有參考價值。所以我們選取了離2018年3月16日最近的八周的銷量,分別賦以11,7,6,5,4,3,2,1的權(quán)重系數(shù),然后求得平均值作為線上的預(yù)測結(jié)果。這個基礎(chǔ)模型就已經(jīng)能夠在線上取得不錯的分數(shù)了,后期我們將這個預(yù)測值加入到我們的機器學(xué)習(xí)模型中作為特征。

其他的特征方面,主要分為商品歷史特征、整體活動特征以及時間序列特征。其中商品歷史特征主要是商品每周銷量/商品銷量占品類的比例/商品價格等,在這些特征中主要提分點還是基于銷量的特征。由于商品的促銷等特征在預(yù)測時段的數(shù)據(jù)并未提供,所以這部分特征我們團隊并沒有做相關(guān)的挖掘,主要還是以歷史銷量為主。整體活動特征是marketing表中所述全場活動,對整體銷量影響極大,這部分特征由于我們數(shù)據(jù)集構(gòu)造并沒有連續(xù)劃窗,所以我們并沒有直接將其放入特征中,而是對歷史銷量進行平滑,平滑掉全場大促的活動對模型的偏移。時間序列特征本質(zhì)是規(guī)則,根據(jù)衰減情況把商品歷史銷量直接作為預(yù)測值,同時,在這部分特征里對歷史銷量運用卡爾曼平滑的方法,線上提分明顯,并且線上線下都非常穩(wěn)定。

?

4.模型選擇

模型部分,我們團隊一直采用的XGboost單模型,并未做其他的模型融合操作。單模型速度較快,工業(yè)應(yīng)用價值高,并且更能體現(xiàn)特征的價值。而XGboost更是一個應(yīng)用價值非常高的模型,可以進行分布式實現(xiàn)以及調(diào)用GPU進行加速,更有利于現(xiàn)實中的工業(yè)應(yīng)用。?

復(fù)現(xiàn)方法

1.代碼和數(shù)據(jù)集

代碼和數(shù)據(jù)集可以在百度云下載:

鏈接:https://pan.baidu.com/s/1yMd_t9MhzFMM0i78iy8nHg?

提取碼:rrxm?

如果被和諧請回復(fù)“供應(yīng)鏈預(yù)測”獲取新網(wǎng)址。

備注:

作者曾在github公布過代碼,與百度云一致

https://github.com/luoda888/CCF2018-Top2-Demand-Forecast

經(jīng)過我和作者的溝通,在百度云上增加了github里沒有的數(shù)據(jù)集,如果要復(fù)現(xiàn),建議到百度云下載數(shù)據(jù)集,需要查看更新請在github下載最新代碼

2.復(fù)現(xiàn)方法

復(fù)現(xiàn)環(huán)境:python3.6

將百度云下載的數(shù)據(jù)集壓縮包解壓到代碼目錄(數(shù)據(jù)在fusai_data目錄),使用作者提供的簡易執(zhí)行代碼一鍵運行:

  • python feature-1.py

    運行時間約30分鐘即可復(fù)現(xiàn)跟比賽成績相近的結(jié)果。

?總結(jié)

本方案利用采用單模型進行預(yù)測,能取得良好的成績并非依靠模型融合的方法。方法具有良好的可擴展性,可以拓展的場景有音樂流行趨勢預(yù)測、金融序列預(yù)測、以及絕大部分效率預(yù)測問題。由于方案的簡單以及可擴展性,適合真實場景應(yīng)用,該方案最終獲得綜合評分第一名(線上成績?yōu)榈诙?#xff0c;綜合評分第一)。

分享是一種美德-感謝作者團隊的開源分享,期待廣大的機器學(xué)習(xí)愛好者開源自己的代碼,為廣大的初學(xué)者提供便利。

請關(guān)注和分享↓↓↓?

機器學(xué)習(xí)初學(xué)者

QQ群:774999266

往期精彩回顧

  • 機器學(xué)習(xí)簡易入門-附推薦學(xué)習(xí)資料

  • 機器學(xué)習(xí)初學(xué)者公眾號下載資源匯總(一)

  • 黃海廣博士的github鏡像下載(機器學(xué)習(xí)及深度學(xué)習(xí)資源)

  • 吳恩達老師的機器學(xué)習(xí)和深度學(xué)習(xí)課程筆記打印版

  • 機器學(xué)習(xí)小抄-(像背托福單詞一樣理解機器學(xué)習(xí))

  • 首發(fā):深度學(xué)習(xí)入門寶典-《python深度學(xué)習(xí)》原文代碼中文注釋版及電子書

  • 科研工作者的神器-zotero論文管理工具

  • 機器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)

  • 機器學(xué)習(xí)必備寶典-《統(tǒng)計學(xué)習(xí)方法》的python代碼實現(xiàn)、電子書及課件

  • 吐血推薦收藏的學(xué)位論文排版教程(完整版)

總結(jié)

以上是生活随笔為你收集整理的开源-BDCI2018供应链需求预测模型第一名解决方案和代码的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。