強化學習：原理與Python實現

肖智清　著

出版商: 機械工業
出版日期: 2019-07-01
定價: $534
售價: 8.5 折 $454
語言: 簡體中文
ISBN: 7111631773
ISBN-13: 9787111631774
相關分類: Reinforcement

立即出貨 (庫存 < 3)

買這商品的人也買了...

~~$534~~ $507

貝葉斯方法：概率編程與貝葉斯推斷 (Bayesian Methods for Hackers: Probabilistic Programming and Bayesian Inference)
$331

實用機器學習 (Real-world Machine Learning)
~~$857~~ $806

深度學習 (Deep Learning)
$403

深度學習與計算機視覺 : 算法原理、框架應用與代碼實現 (Deep Learning & Computer Vision:Algorithms and Examples)
$403

深入淺出強化學習 : 原理入門
$408

強化學習精要：核心算法與 TensorFlow 實現
$607

強化學習
$301

深度學習入門基於 Python 的理論與實現
$352

Python 強化學習實戰 : 應用 OpenAI Gym 和 TensorFlow 精通強化學習和深度強化學習
~~$780~~ $616

深度學習｜內行人的做法 (Deep Learning: A Practitioner's Approach)
~~$520~~ $442

用 Python 實作強化學習｜使用 TensorFlow 與 OpenAI Gym (Hands-On Reinforcement Learning with Python)
$505

深度強化學習原理與實踐
$403

統計強化學習：現代機器學習方法 (Statistical Reinforcement Learning: Modern Machine Learning Approaches)
~~$301~~ $283

特徵工程入門與實踐 (Feature Engineering Made Easy)
~~$680~~ $612

因果革命：人工智慧的大未來 (硬殼精裝)(The Book of Why: The New Science of Cause and Effect)
~~$500~~ $425

實戰人工智慧之深度強化學習｜使用 PyTorch x Python
$611

深度學習與圖像識別：原理與實踐
~~$857~~ $806

強化學習, 2/e (Reinforcement Learning: An Introduction, 2/e)
$505

白話強化學習與 PyTorch
~~$580~~ $458

深度學習｜生命科學應用 (Deep Learning for the Life Sciences)
~~$620~~ $527

LINE Bot 與人工智慧辨識開發實戰｜使用 C# 與 Azure Cognitive Services (增訂版)
~~$690~~ $538

動手做深度強化學習 (Deep Reinforcement Learning Hands-On)
$422

深度學習：基於案例理解深度神經網絡
~~$750~~ $593

NumPy 高速運算徹底解說 - 六行寫一隻程式？你真懂深度學習？手工算給你看！
~~$580~~ $458

機器學習的數學基礎 : AI、深度學習打底必讀

商品描述

本書理論完備，涵蓋主流經典強化學習算法和深度強化學習算法；實戰性強，基於Python、Gym、TensorFlow 2、AlphaZero等構建，配套代碼與綜合案例。全書共12章，主要內容如下。
第1章：介紹強化學習的基礎知識與強化學習環境庫Gym的使用，並給出完整的編程實例。
第2～9章：介紹強化學習的理論知識。以Markov決策過程為基礎模型，覆蓋了所有主流強化學習理論和算法，包括資格跡等經典算法和深度確定性梯度策略等深度強化學習算法。所有章節都提供了與算法配套的Python程序，使讀者完全掌握強化學習算法的原理與應用。
第10～12章：介紹了多個熱門綜合案例，包括電動游戲、棋盤游戲和自動駕駛。算法部分涵蓋了在《自然》《科學》等權威期刊上發表的多個深度強化學習明星算法。

強化學習是一種重要的機器學習方法。近幾年不斷有新的明星強化學習算法發表，在科研機構和互聯網等行業中引起巨大反響。強化學習已經成為互聯網等行業從業人員的必備知識。為了讓讀者從理論與實踐方面系統地掌握強化學習，本書寫作時考慮了以下幾個方面。
本書亮點：
保證了理論完整性，涵蓋了主流經典強化學習算法和深度強化學習算法，且採用同一套字母演繹，方便理解。
為每章都配套了代碼（特別是深度強化學習），代碼的變量名與實現方法均一致，且代碼兼容Windows。
深度強化學習配套代碼基於TensorFlow 2實現，方便讀者研習掌握先進的算法與工具。
多個綜合案例，涵蓋AlphaZero應用、基於模擬環境的自動駕駛等。
對硬件配置要求低，第2~9章的配套代碼不需要GPU即可運行，第10~12章的配套代碼只需普通的GPU即可運行。