基於模型的強化學習
高藝 夏宇翔 陳鋒 劉攀 鍾家華
- 出版商: 東南大學
- 出版日期: 2024-07-01
- 定價: $588
- 售價: 7.9 折 $465
- 語言: 簡體中文
- 頁數: 236
- ISBN: 7576610441
- ISBN-13: 9787576610444
-
相關分類:
Reinforcement
- 此書翻譯自: Model-Based Reinforcement Learning: From Data to Continuous Actions with a Python-Based Toolbox (Hardcvoer)
立即出貨
買這商品的人也買了...
-
王者歸來-用 Linux 移植各種硬體$620$527 -
Multidimensional Signal, Image, and Video Processing and Coding, 2/e (Hardcover)$1,380$1,352 -
Practical Image and Video Processing Using MATLAB (Hardcover)$6,610$6,280 -
Permanent Magnet Brushless DC Motor Drives and Controls (Hardcover)$8,860$8,417 -
Microprogrammed State Machine Design (Hardcover)$9,850$9,358 -
跟著範例學會 Visual C# 2015 (適用2015/2013)$420$328 -
7天學會 Android App 程式開發$450$351 -
$301機器學習入門到實戰 — MATLAB 實踐應用 -
Excel VBA 實戰技巧|金融數據 x 網路爬蟲$620$527 -
動手做深度強化學習 (Deep Reinforcement Learning Hands-On)$690$538 -
最新圖解馬達入門$300$255 -
超圖解 Arduino 互動設計入門, 4/e$680$578 -
工業4.0 的物聯網智慧工廠應用與實作:使用 Arduino.Node-RED.MySQL.Node.js$500$199 -
FPGA 數字圖像採集與處理 — 從理論知識、模擬驗證到板級調試的實例精講$414$393 -
無線秘籍 — 射頻電路設計入門$414$393 -
$454OpenCV 4.5 電腦視覺開發實戰 (基於 VC++) -
$301機器學習與振動信號處理 -
NLP 大神 RNN 網路:Python 原始程式碼手把手帶你寫$890$703 -
$560數字圖像處理與機器視覺 — Visual C++ 與 Matlab 實現, 2/e -
$398深度強化學習實戰 用 OpenAI Gym 構建智能體 -
$454智能演化優化 -
$250天線理論與工程設計 -
永磁同步電機無位置傳感器控制$1,194$1,134 -
機器人模擬、控制與應用 (簡體書)$474$450 -
機器人抓取力學$894$849
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
強化學習是機器學習的一個基本範示,其中智能體執行動作以確保設備的最優性能。雖然這種機器學習範式近年來取得了巨大的成功和普及,但先前的學術研究要麼集中在理論上(最優控制和動態規劃),要麼集中在演算法上,其中大多數是基於模擬的。 《基於模型的強化學習》提供了一個基於模型的框架來橋接這兩個方面,從而創建了一個基於模型的線上學習控制主題的整體處理。在此過程中,作者尋求開發一個基於模型的資料驅動控制框架,該框架將資料系統識別、基於模型的強化學習和最優控制以及每個主題的應用連接起來。這種評估經典結果的新技術將會是更有效的強化學習系統。本書的核心是提供一個端到端的框架——從設計到應用——一種更容易處理的模型為基礎的強化學習技術。
作者簡介
米拉德·法爾西(Milad Farsi),於2010年獲得大不裏士大學電機工程(電子)學士學位,2013年獲薩罕德科技大學電機工程(控制系統)專業碩士學位。 2012年至2016年,擔任控制系統工程師,累積相關產業工作經驗。於2022年獲得加拿大滑鐵盧大學應用數學博士學位,目前擔任該校博士後研究員。研究方向包括:控制系統、強化學習及其在機器人和電力電子中的應用。
目錄大綱
前言
1 非線性系統分析
1.1 符號
1.2 非線性動態系統
1.3 Lyapunov穩定性分析
1.4 離散時間動態系統的穩定性分析
1.5 總結
參考文獻
2 優化控制
2.1 問題描述
2.2 動態規劃
2.3 線性二次型調節器
2.4 總結
參考文獻
3 強化學習
3.1 具有二次成本的控制仿射系統
3.2 精確策略疊代
3.3 未知動力學和函數逼近的策略疊代
3.4 總結
參考文獻
4 動態模型的學習
4.1 簡介
4.2 模型選擇
4.3 參數模型
4.4 參數化學習演算法
4.5 持續激勵
4.6 Python工具箱
4.7 對比結果
4.8 總結
參考文獻
5 基於結構化線上學習的連續時間非線性系統控制
5.1 簡介
5.2 結構化近似最適控制框架
5.3 局部穩定性與最適性分析
5.4 SOL演算法
5.5 模擬結果
5.6 小結
參考文獻
6 結構化線上學習方法在未知動態非線性追蹤的應用
6.1 簡介
6.2 追蹤控制的結構化線上學習
6.3 使用SOL的基於學習的追蹤控制
6.4 模擬結果
6.5 總結
參考文獻
7 分段學習與控制及其穩定性保證
7.1 簡介
7.2 問題公式化描述
7.3 分段學習與控制框架
7.4 不確定性邊界分析
7.5 分段仿射學習與控制的穩定性驗證
7.6 數值結果
7.7 總結
參考文獻
8 太陽能光電系統應用
8.1 簡介
8.2 問題描述
8.3 光伏陣列的最佳控制
8.4 應用註意事項
8.5 模擬結果
8.6 總結
參考文獻
9 四旋翼無人機低階控制應用
9.1 簡介
9.2 四旋翼無人機模型
9.3 基於RLS辨識器的四旋翼無人機結構化線上學習
9.4 數值結果
9.5 總結
參考文獻
10 Python工具箱
10.1 概述
10.2 用戶輸入
10.3 SOL
10.4 顯示與輸出
10.5 總結
參考文獻
附錄
A.1 註5.4的補充分析
A.2 註5.5的補充分析
