強化學習:原理與Python實現
肖智清 著
- 出版商: 機械工業
- 出版日期: 2019-07-01
- 定價: $534
- 售價: 8.5 折 $454
- 語言: 簡體中文
- ISBN: 7111631773
- ISBN-13: 9787111631774
-
相關分類:
Reinforcement、Reinforcement
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
貝葉斯方法:概率編程與貝葉斯推斷 (Bayesian Methods for Hackers: Probabilistic Programming and Bayesian Inference)$534$507 -
$352實用機器學習 (Real-world Machine Learning) -
$796深度學習 -
$474深度學習與計算機視覺 : 算法原理、框架應用與代碼實現 (Deep Learning & Computer Vision:Algorithms and Examples) -
$403深入淺出強化學習 : 原理入門 -
$408強化學習精要:核心算法與 TensorFlow 實現 -
$607強化學習 -
$354深度學習入門 基於 Python 的理論與實現 -
$352Python 強化學習實戰 : 應用 OpenAI Gym 和 TensorFlow 精通強化學習和深度強化學習 -
深度學習|內行人的做法 (Deep Learning: A Practitioner's Approach)$780$616 -
用 Python 實作強化學習|使用 TensorFlow 與 OpenAI Gym (Hands-On Reinforcement Learning with Python)$520$411 -
$594深度強化學習原理與實踐 -
統計強化學習:現代機器學習方法 (Statistical Reinforcement Learning: Modern Machine Learning Approaches)$474$450 -
$280特徵工程入門與實踐 (Feature Engineering Made Easy) -
因果革命:人工智慧的大未來 (硬殼精裝)(The Book of Why: The New Science of Cause and Effect)$680$578 -
實戰人工智慧之深度強化學習|使用 PyTorch x Python$500$395 -
$611深度學習與圖像識別:原理與實踐 -
$756強化學習, 2/e (Reinforcement Learning: An Introduction, 2/e) -
$505白話強化學習與 PyTorch -
深度學習|生命科學應用 (Deep Learning for the Life Sciences)$580$458 -
LINE Bot 與人工智慧辨識開發實戰|使用 C# 與 Azure Cognitive Services (增訂版)$620$490 -
動手做深度強化學習 (Deep Reinforcement Learning Hands-On)$690$538 -
$422深度學習:基於案例理解深度神經網絡 -
NumPy 高速運算徹底解說 - 六行寫一隻程式?你真懂深度學習?手工算給你看!$750$638 -
機器學習的數學基礎 : AI、深度學習打底必讀$580$458
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書理論完備,涵蓋主流經典強化學習算法和深度強化學習算法;實戰性強,基於Python、Gym、TensorFlow 2、AlphaZero等構建,配套代碼與綜合案例。全書共12章,主要內容如下。
第1章:介紹強化學習的基礎知識與強化學習環境庫Gym的使用,並給出完整的編程實例。
第2~9章:介紹強化學習的理論知識。以Markov決策過程為基礎模型,覆蓋了所有主流強化學習理論和算法,包括資格跡等經典算法和深度確定性梯度策略等深度強化學習算法。所有章節都提供了與算法配套的Python程序,使讀者完全掌握強化學習算法的原理與應用。
第10~12章:介紹了多個熱門綜合案例,包括電動遊戲、棋盤遊戲和自動駕駛。算法部分涵蓋了在《自然》《科學》等權威期刊上發表的多個深度強化學習明星算法。
強化學習是一種重要的機器學習方法。近幾年不斷有新的明星強化學習算法發表,在科研機構和因特網等行業中引起巨大反響。強化學習已經成為因特網等行業從業人員的必備知識。為了讓讀者從理論與實踐方面系統地掌握強化學習,本書寫作時考慮了以下幾個方面。
本書亮點:
保證了理論完整性,涵蓋了主流經典強化學習算法和深度強化學習算法,且採用同一套字母演繹,方便理解。
為每章都配套了代碼(特別是深度強化學習),代碼的變量名與實現方法均一致,且代碼兼容Windows。
深度強化學習配套代碼基於TensorFlow 2實現,方便讀者研習掌握先進的算法與工具。
多個綜合案例,涵蓋AlphaZero應用、基於模擬環境的自動駕駛等。
對硬件配置要求低,第2~9章的配套代碼不需要GPU即可運行,第10~12章的配套代碼只需普通的GPU即可運行。
第1章:介紹強化學習的基礎知識與強化學習環境庫Gym的使用,並給出完整的編程實例。
第2~9章:介紹強化學習的理論知識。以Markov決策過程為基礎模型,覆蓋了所有主流強化學習理論和算法,包括資格跡等經典算法和深度確定性梯度策略等深度強化學習算法。所有章節都提供了與算法配套的Python程序,使讀者完全掌握強化學習算法的原理與應用。
第10~12章:介紹了多個熱門綜合案例,包括電動遊戲、棋盤遊戲和自動駕駛。算法部分涵蓋了在《自然》《科學》等權威期刊上發表的多個深度強化學習明星算法。
強化學習是一種重要的機器學習方法。近幾年不斷有新的明星強化學習算法發表,在科研機構和因特網等行業中引起巨大反響。強化學習已經成為因特網等行業從業人員的必備知識。為了讓讀者從理論與實踐方面系統地掌握強化學習,本書寫作時考慮了以下幾個方面。
本書亮點:
保證了理論完整性,涵蓋了主流經典強化學習算法和深度強化學習算法,且採用同一套字母演繹,方便理解。
為每章都配套了代碼(特別是深度強化學習),代碼的變量名與實現方法均一致,且代碼兼容Windows。
深度強化學習配套代碼基於TensorFlow 2實現,方便讀者研習掌握先進的算法與工具。
多個綜合案例,涵蓋AlphaZero應用、基於模擬環境的自動駕駛等。
對硬件配置要求低,第2~9章的配套代碼不需要GPU即可運行,第10~12章的配套代碼只需普通的GPU即可運行。
