强化学习1 高斯赛德尔迭代
生活随笔
收集整理的這篇文章主要介紹了
强化学习1 高斯赛德尔迭代
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
開始看《深入淺出強化學習——原理入門》,由于時間有限,做個簡要的筆記。
“深度學習如圖像識別和語音識別解決的是感知問題,強化學習解決的是決策問題,人工智能的終極目標就是經過感知進行智能決策?!?/p>
1、區分有模型 無模型: 狀態轉移概率Pss'已知,是有模型的強化學習;
2、(有模型的強化學習)值函數是怎么來的:高斯賽德爾迭代,用前一次的值計算后一次的值,直到收斂!
以下是高斯賽德爾迭代求值函數內容:
?
?
?
?
?
總結
以上是生活随笔為你收集整理的强化学习1 高斯赛德尔迭代的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: html代码打猎小游戏,html贪吃蛇小
- 下一篇: 多线程问题汇总