【代码开发】neuron_poker安装及简单使用
文章目錄
- 引子
- 安裝Anaconda
- 安裝環境及相關依賴
- 運行代碼
引子
最近調研了蠻多能跑德州撲克的平臺,但有些代碼太老,有些太過復雜,很難找到開源的、方便的代碼供研究。最近發現neuron_poker,考慮安裝的復雜程度、代碼閱讀難度、運行效率等因素,綜合來看算是不錯,而且還帶有GUI界面,唯一的遺憾就是里面Keras和torch.keras混用,而我pytorch用的比較多,所以沒有深入研究。
本文簡單介紹一下neuron_poker的安裝及使用。這是一個用于強化學習研究德州撲克的環境,主要用于學術研究。github鏈接:https://github.com/dickreuter/neuron_poker。
雖然readme里面的內容已經足夠了,但對于完全的小白來說可能比較不友好,于是我決定寫一篇保姆級別的使用教程。順帶一提,我的操作系統是win10。
安裝Anaconda
順便還可以安裝一下pycharm。這部分網上的教程非常多,能看見這篇博文的同學搜索引擎隨便搜,點開前幾個鏈接看看準沒錯。
可以用conda -V 和python -V來檢查自己有沒有安裝好。
安裝環境及相關依賴
主要分為三步:git clone , conda create env 和pip install
選擇一個文件夾,命令行進入。
命令行輸入git clone https://github.com/dickreuter/neuron_poker.git,回車運行。
如果報錯提示缺少git就用 pip install git這個命令安裝一下,如果沒有辦法訪問github就用國內的鏡像。
安裝好neuron_poker.git后,運行cd neroun_poker-master進入對應的文件夾。
運行指令 conda create -n neuron_poker python=3.7,創建一個虛擬環境,neuron_poker就是環境名稱,如果是第一次創建的話可能需要自動下載一些第三方拓展包,等待一會兒之后conda activate neuron_poker打開虛擬環境。
我直接使用的環境是base。
然后運行指令pip install -r requirements.txt就可以自動安裝需要的第三方依賴庫了。
現實Requirement already satisfied 就說明安裝第三方依賴完成了。
運行代碼
直接在命令行輸入指令。
python main.py selfplay random --render
用隨機決策的電腦玩家自博弈。
命令行會有輸出,并且會自動跳出游戲界面:
如果到了這一步,恭喜你,代碼已經可以正常運行了!
后面補充一些其它的指令:
python main.py selfplay keypress --render
用鍵盤按鍵與電腦AI交互博弈。
python main.py selfplay equity_improvement --improvement_rounds=20 --episodes=10
用遺傳算法與自我改善訓練一個agent。
python main.py selfplay dqn_train -c
使用 c++ 蒙特卡洛訓練DQN agent。
里面這些參數的含義就要具體在main.py里面找了。
上面顯示的自博弈是只有2個agent。這部分是在main.py的第106行修改玩家人數為6就可以了。
這是6個agent的的界面。
如果想深入細節更改源碼,就需要進一步閱讀源碼和項目文檔了,也就是代碼的doc文件夾及readme.rst等文件。開啟neuron_poker的探索之旅吧!
祝好!
總結
以上是生活随笔為你收集整理的【代码开发】neuron_poker安装及简单使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 无法导入android 工程--提示项目
- 下一篇: 计算机国二复习攻略,全国计算机等级考试二