書單推薦
更多
新書推薦
更多

強(qiáng)化學(xué)習(xí):原理與Python實現(xiàn)

強(qiáng)化學(xué)習(xí):原理與Python實現(xiàn)

定  價:89 元

叢書名:智能系統(tǒng)與技術(shù)叢書

        

當(dāng)前圖書已被 7 所學(xué)校薦購過!
查看明細(xì)

  • 作者:肖智清
  • 出版時間:2019/7/1
  • ISBN:9787111631774
  • 出 版 社:機(jī)械工業(yè)出版社
  • 中圖法分類:TP181 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
6
8
3
7
1
1
7
1
7
1
4

本書理論完備,涵蓋主流非深度強(qiáng)化學(xué)習(xí)算法和深度強(qiáng)化學(xué)習(xí)算法;實戰(zhàn)性強(qiáng),基于Python、Gym、TensorFlow 2等構(gòu)建,并有AlphaZero等綜合案例。全書共12章,主要內(nèi)容如下。

第1章:介紹強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識與強(qiáng)化學(xué)習(xí)環(huán)境庫Gym的使用,并給出完整的編程實例。

第2~9章:介紹強(qiáng)化學(xué)習(xí)的理論知識。以Markov決策過程為基礎(chǔ)模型,覆蓋了所有主流強(qiáng)化學(xué)習(xí)理論和算法,包括資格跡等經(jīng)典算法和深度確定性梯度策略等深度強(qiáng)化學(xué)習(xí)算法。所有章節(jié)都提供了與算法配套的Python程序,使讀者完全掌握強(qiáng)化學(xué)習(xí)算法的原理與應(yīng)用。

第10~12章:介紹了多個熱門綜合案例,包括電動游戲、棋盤游戲和自動駕駛。算法部分涵蓋了在《自然》《科學(xué)》等權(quán)威期刊上發(fā)表的多個深度強(qiáng)化學(xué)習(xí)明星算法,包括AlphaGo的*改進(jìn)版AlphaZero。


 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容