深度学习核心技术精讲100篇(六十二)-DQN 的三种改进在运筹学中的应用
前言
假設(shè)有一個(gè)客服排班的任務(wù),我們需要為 100 個(gè)人安排一個(gè)星期的排班問(wèn)題,并且有以下約束條件:
-
一天被劃分為 24 個(gè)時(shí)間段,即每個(gè)時(shí)間段為 1 個(gè)小時(shí);
-
每個(gè)客服一個(gè)星期需要上七天班,每次上班八小時(shí);
-
每個(gè)客服兩次上班時(shí)間需要間隔 12 小時(shí);
-
客服值班時(shí),一個(gè)星期最早是 0,最晚 24*7 - 1。
以下是我為大家準(zhǔn)備的幾個(gè)精品專(zhuān)欄,喜歡的小伙伴可自行訂閱,你的支持就是我不斷更新的動(dòng)力喲!
MATLAB-30天帶你從入門(mén)到精通
MATLAB深入理解高級(jí)教程(附源碼)
tableau可視化數(shù)據(jù)分析高級(jí)教程
評(píng)判標(biāo)準(zhǔn):
-
現(xiàn)在有每個(gè)時(shí)間段所需客服人數(shù),我們希望每個(gè)時(shí)段排班后的人數(shù)與實(shí)際人數(shù)盡量相近。
最優(yōu)化問(wèn)題可以使用啟發(fā)式算法來(lái)做,上次用 DQN,這次用深度強(qiáng)化學(xué)習(xí)。
Nature DQN
之前給過(guò) DQN 的代碼,但是由于沒(méi)有用批處理,所以速度非常
總結(jié)
以上是生活随笔為你收集整理的深度学习核心技术精讲100篇(六十二)-DQN 的三种改进在运筹学中的应用的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: R语言实战应用-lightgbm 算法优
- 下一篇: 深度学习核心技术精讲100篇(六十三)-