日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

强化学习使用gym时出现错误:ValueError: too many values to unpack (expected 4)

發(fā)布時(shí)間:2023/12/14 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 强化学习使用gym时出现错误:ValueError: too many values to unpack (expected 4) 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

目錄

1.問題描述

2.問題分析

(1)env.step()的返回值問題

(2)ale-py包問題

3.問題解決

4.總結(jié)


1.問題描述

????????最近在學(xué)強(qiáng)化學(xué)習(xí),用parl和gym實(shí)現(xiàn)Pong游戲的策略梯度-REINFORCE算法,主要的代碼參考paddle的parl的教程lesson4課程(具體鏈接:PARL/examples/tutorials/parl2_dygraph at develop · PaddlePaddle/PARL · GitHub)

但在寫代碼的過程中遇到了一個(gè)問題,在其他代碼沒有任何問題的情況下,運(yùn)行train.py

env.step()函數(shù)會(huì)出現(xiàn):ValueError: too many values to unpack (expected 4)

2.問題分析

????????首先排除env.step(action)的傳入?yún)?shù)沒有問題,那問題只能出現(xiàn)在env.step(action)的執(zhí)行和返回的過程中(在分析問題的過程中,我參考這個(gè)博主的帖子:pytorch報(bào)錯(cuò)ValueError: too many values to unpack (expected 4)_阮阮小李的博客-CSDN博客)

(1)env.step()的返回值問題

????????我通過gym的官網(wǎng)文檔(Core - Gym Documentation),查看了env.step()的返回值定義。

????????并將train.py代碼中的這句話

obs, reward, done, _ = env.step(act)

????????修改為

obs, reward, done, _, _, _ = env.step(act)

????????結(jié)果是問題沒有解決!

(2)ale-py包問題

????????因?yàn)樵谶@之前,我之前學(xué)習(xí)的過程中也編寫好了其他算法和gym游戲的代碼,測(cè)試過多次是可以跑通的,在這個(gè)錯(cuò)誤出現(xiàn)后,我第一時(shí)間運(yùn)行了之前的代碼,出現(xiàn)了一模一樣的錯(cuò)誤,我突然想起來因?yàn)樵?strong>創(chuàng)建Pong游戲環(huán)境時(shí),會(huì)提示Pong游戲被gym轉(zhuǎn)移到ale-py,所以pip install ale-py安裝了ale-py,所以問題就出現(xiàn)在ale-py這個(gè)功能包!

env = gym.make('Pong-v4')

3.問題解決

????????使用pip list命令檢查gym和ale-py的版本,我的ale-py版本是0.8.0(pip中可安裝的最新版本是0.8.0),而我的gym是0.22.0(此時(shí)pip可安裝的最新版本是0.26.2),我意識(shí)到是ale-py版本太高的問題,最后把a(bǔ)le-py的版本重裝為0.7.2,問題解決,并且提示我obs, reward, done, _, _, _ = env.step(act)這句話有問題,因?yàn)橹恍枰?個(gè)輸入?yún)?shù),修改之后問題解決!

4.總結(jié)

總結(jié)來說就是ale-py的版本太高,不適配gym版本。

總結(jié)

以上是生活随笔為你收集整理的强化学习使用gym时出现错误:ValueError: too many values to unpack (expected 4)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。