Python 強化學習實戰:使用 OpenAI Gym、TensorFlow 和 Keras (Applied Reinforcement Learning with Python: With Openai Gym, Tensorflow, and Keras)
Taweh Beysolow II 敖富江 杜靜 張民壘 譯
- 出版商: 清華大學
- 出版日期: 2021-02-01
- 定價: $299
- 售價: 8.5 折 $254
- 語言: 簡體中文
- 頁數: 127
- 裝訂: 平裝
- ISBN: 7302570094
- ISBN-13: 9787302570097
-
相關分類:
Reinforcement
- 此書翻譯自: Applied Reinforcement Learning with Python: With Openai Gym, Tensorflow, and Keras
立即出貨
買這商品的人也買了...
-
$454強化學習實戰:強化學習在阿裡的技術演進和業務創新 匯集了阿裡巴巴一線算法工程師在強化學習應用方面的經驗和心得。 -
用 Python 實作強化學習|使用 TensorFlow 與 OpenAI Gym (Hands-On Reinforcement Learning with Python)$520$411 -
實戰人工智慧之深度強化學習|使用 PyTorch x Python$500$395 -
動手做深度強化學習 (Deep Reinforcement Learning Hands-On)$690$538 -
$327邊做邊學深度強化學習:PyTorch 程序設計實踐 -
$709遷移學習 -- TRANSFER LEARNING (楊強教授新作) -
SQL 必知必會, 5/e (Sams Teach Yourself SQL in 10 Minutes a Day, 5/e)$294$279 -
$407JavaScript 重難點實例精講 -
$352Python 最優化算法實戰 -
圖解機器學習 -- 算法原理與 Python 語言實現$419$398 -
$422深度學習 — 從神經網絡到深度強化學習的演進 -
深度強化式學習 (Deep Reinforcement Learning in Action)$1,000$790 -
$454深度學習理論與實戰 — PyTorch 案例詳解 -
$454Python 科學計算及實踐 -
$422機器學習原理與實踐 (Python版) -
$473機器學習算法評估實戰 (全彩印刷) -
深入淺出聯邦學習:原理與實踐$474$450 -
$534元學習:基礎與應用 -
圖解機器學習算法 (全彩印刷)$479$455 -
$301深度學習的數學原理與實現 -
$403速通機器學習 -
核心開發者親授!PyTorch 深度學習攻略 (Deep Learning with Pytorch)$1,000$790 -
深度強化學習落地指南$654$621 -
動手學強化學習$539$512 -
$449基於 Python 的強化學習 (Reinforcement Learning Algorithms with Python : Learn, understand, and develop smart algorithms for addressing AI challenges)
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
主要內容:
使用Python實現強化學習算法; 應用A相架,例如OpenAl Gym.TensorFlow和人cras利用雲資源部窖並訓練基於強化學習的解決方案;
實戰遢化學習實際應用
作者簡介
Taweh Beysolow II
是一位數據科學家和作家,目前居住在美國。
他擁有美國聖約翰大學的經濟學學士學位和福特漢姆大學的應用統計學理學碩士學位。
在成功退出與他人共同創立的初創公司後,他現在擔任總部位於舊金山的私人股本公司Industry Capital的董事,
在那裡領導加密貨幣和區塊鏈平臺。
目錄大綱
目 錄
第1章 強化學習導論 1
1.1 強化學習的發展史 2
1.2 MDP及其與強化學習的關系 3
1.3 強化學習算法和強化學習框架 5
1.4 Q學習 8
1.5 強化學習的應用 9
1.5.1 經典控制問題 9
1.5.2 《超級馬裏奧兄弟》遊戲 10
1.5.3 《毀滅戰士》遊戲 11
1.5.4 基於強化學習的做市策略 12
1.5.5 《刺蝟索尼克》遊戲 12
1.6 本章小結 13
第2章 強化學習算法 15
2.1 OpenAI Gym 15
2.2 基於策略的學習 16
2.3 策略梯度的數學解釋 17
2.4 基於梯度上升的策略優化 19
2.5 使用普通策略梯度法求解車桿問題 20
2.6 什麼是折扣獎勵,為什麼要使用它們 23
2.7 策略梯度的不足 28
2.8 近端策略優化(PPO)和Actor-Critic模型 29
2.9 實現PPO並求解《超級馬裏奧兄弟》 30
2.9.1 《超級馬裏奧兄弟》概述 30
2.9.2 安裝環境軟件包 31
2.9.3 資源庫中的代碼結構 32
2.9.4 模型架構 32
2.10 應對難度更大的強化學習挑戰 37
2.11 容器化強化學習實驗 39
2.12 實驗結果 41
2.13 本章小結 41
第3章 強化學習算法:Q學習及其變種 43
3.1 Q學習 43
3.2 時序差分(TD)學習 45
3.3 epsilon-greedy算法 46
3.4 利用Q學習求解冰湖問題 47
3.5 深度Q學習 50
3.6 利用深度Q學習玩《毀滅戰士》遊戲 51
3.7 訓練與性能 56
3.8 深度Q學習的局限性 57
3.9 雙Q學習和雙深度Q網絡 58
3.10 本章小結 59
第4章 基於強化學習的做市策略 61
4.1 什麼是做市 61
4.2 Trading Gym 63
4.3 為什麼強化學習適用於做市 64
4.4 使用Trading Gym合成訂單簿數據 66
4.5 使用Trading Gym生成訂單簿數據 67
4.6 實驗設計 68
4.6.1 強化學習方法1:策略梯度 71
4.6.2 強化學習方法2:深度Q網絡 71
4.7 結果和討論 73
4.8 本章小結 74
第5章 自定義OpenAI強化學習環境 75
5.1 《刺蝟索尼克》遊戲概述 75
5.2 下載該遊戲 76
5.3 編寫該環境的代碼 78
5.4 A3C Actor-Critic 82
5.5 本章小結 88
附錄A 源代碼 91



