強化學習實戰 — 從零開始製作 AlphaGo 圍棋 (微課視頻版)
劉佳
- 出版商: 清華大學
- 出版日期: 2023-04-01
- 定價: $419
- 售價: 8.5 折 $356
- 語言: 簡體中文
- 頁數: 191
- ISBN: 7302629692
- ISBN-13: 9787302629696
-
相關分類:
Reinforcement
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$374強化學習入門:從原理到實踐 -
Python 深度學習異常檢測 : 使用 Keras 和 PyTorch$588$559 -
$403商用機器學習:數據科學實踐 -
強化式學習:打造最強 AlphaZero 通用演算法$780$663 -
$505深度學習與圍棋 -
$378深度學習處理結構化數據實戰 -
動手學強化學習$539$512 -
$458基於機器學習的工作流活動推薦 -
深度強化學習$779$740 -
$559因果推斷與機器學習 -
$465深度學習在醫學圖像中的應用 -
$296機器學習 (MATLAB版) -
$407Python 統計機器學習 -
3D 科研繪圖與學術圖表繪製從入門到精通$654$621 -
$407機器學習與深度學習(基於Python實現) -
$359程序員的制勝技 -
$469LaTeX 論文寫作教程 -
CPU 眼裡的 C/C++$534$507 -
$374時間黑客:用數據分析做個明白人 -
$426R語言醫學多元統計分析 -
自然語言處理與醫療文本的知識抽取$539$512 -
深度強化學習理論及其在機器人運動控制中的應用實踐$534$507 -
$280光纖傳感器及其應用技術 -
深度強化學習$479$455 -
讓 AI 好好說話!從頭打造 LLM (大型語言模型) 實戰秘笈$680$537
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書通過基礎理論和算法實踐相結合,循序漸進地介紹了人工智能領域中的常見算法,並以圍棋遊戲作為媒介,全面、系統地介紹了人工智能算法的實現方法,並通過Keras和PyTorch框架實踐人工智能算法中的深度強化學習內容。全書共10章,分別介紹圍棋的基礎知識、如何製作圍棋軟件、傳統棋類智能算法、神經網絡入門知識、如何實現圍棋智能體程序、通用化圍棋智能體程序、策略梯度算法、基於價值的深度學習網絡(DQN)算法、ActorCritic算法、如何實踐AlphaGo和AlphaZero等知識,書中的每個知識點都有相應的實現代碼和實例。 本書主要面向廣大從事數據分析、機器學習、數據挖掘或深度學習的專業人員,從事高等教育的專任教師,高等學校的在讀學生及相關領域的廣大科研人員。
目錄大綱
目錄
第一部分電腦圍棋的基礎知識和傳統的智能算法
第1章圍棋: 黑白的世界
1.1什麼是圍棋
1.2圍棋的規則
1.3勝負的判定
1.4圍棋棋手的棋力
1.5電腦眼中的圍棋
1.5.1SGF文件
1.5.2GTP
第2章實現一個圍棋軟件
2.1軟件版本
2.2圍棋軟件的組成
2.3佐布裡斯特散列
2.4圍棋智能體
2.5圍棋的棋盤
2.6引入裁判
2.7讓智能體下棋
第3章傳統的棋類智能
3.1極小化極大算法
3.2AlphaBeta剪枝算法
3.3棋類局面評估
3.4蒙特卡羅模擬
3.4.1蒙特卡羅算法
3.4.2蒙特卡羅樹搜索
3.4.3蒙特卡羅算法改進
3.4.4需要註意的問題
3.5監督學習
3.6傳統方法的討論
第二部分基於神經網絡的機器學習
第4章機器學習入門
4.1人工神經網絡
4.1.1神經元
4.1.2常見的激活函數
4.1.3多層感知器
4.1.4捲積神經網絡
4.1.5反向傳播算法
4.1.6小批量訓練法
4.1.7殘差網絡
4.1.8多層感知器的應用示例
4.1.9捲積網絡對圖片進行多分類的應用示例
4.2優化神經網絡
4.2.1訓練集、驗證集、測試集以及交叉驗證
4.2.2欠擬合與過擬合
4.2.3損失函數的正則化
4.2.4精確率和召回率的權衡
4.3其他人工智能方法簡介
4.3.1K近鄰算法
4.3.2樸素貝葉斯法
4.3.3決策樹
4.3.4Boosting算法/Bagging算法
4.3.5支持向量機
4.3.6隨機場算法
4.3.7傳統智能算法所面臨的挑戰
第5章第一個圍棋智能體
5.1電子圍棋棋譜
5.2HDF5文件結構
5.3數據模型
5.4獲取訓練樣本
5.5代碼演示
第6章通用化圍棋智能體程序
6.1在網絡上發布圍棋智能體
6.2本地對戰
6.2.1電腦的圍棋語言
6.2.2圍棋的對弈圖形界面
6.2.3圍棋引擎
6.3讓圍棋智能體自己去網上下棋
第三部分強化學習
第7章策略梯度
第8章深度價值網絡
8.1傳統的QLearning算法
8.1.1原始版QLearning
8.1.2原始版QLearning計算時的優化
8.1.3QLearning的變種Sarsa
8.1.4Sarsa的進化Sarsaλ
8.2在神經網絡上應用DQN
第9章ActorCritic算法
第10章AlphaGo和AlphaZero
10.1AlphaGo的結構和訓練流程
10.2AlphaZero的結構與訓練流程
10.3可行的優化
附錄AKeras入門
附錄BPyTorch入門
附錄C反向傳播算法
C.1命名約定
C.2正文
C.3進一步討論
C.4拓展
附錄D不同地區的圍棋規則
D.1中國規則
D.2日本規則
D.3應氏規則
D.4新西蘭規則
D.5美國規則
D.6智運會規則
D.7TrompTaylor規則



