人工智能算法在博弈理論和實踐中的應用

鄧小鐵 李文新 孔雨晴

  • 出版商: 清華大學
  • 出版日期: 2025-09-01
  • 售價: $360
  • 語言: 簡體中文
  • 頁數: 200
  • ISBN: 7302697167
  • ISBN-13: 9787302697169
  • 相關分類: Machine Learning
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書詳細探討非 非 信息博弈動力學理論、 方法與實踐。主要內容包括 智能體在非 信息條件下 的認知差異和博弈行為、多 智能體博弈動力學、智能決 策和人機博弈等多個領域。 書中通過理論分析與實證數 據相結合,深入分析了非完 全信息環境下的動態博弈特 性,並提出相應的優化工具 與解決方案。 本書主要特點在於提出 了適用於智能體博弈環境的 完整理論框架,特別是針對 信息擴散與非對稱博弈行為 優化的深入探討。書中既包 含了豐富的理論模型,又結 合實際案例進行了詳細分析 ,為實際應用提供了指導。 本書適合從事人工智能 、博弈論及其應用研究的學 者和工程師學習參考,也可 作為高等學校相關專業研究 生的參考書。

目錄大綱

部分 非 信息博弈動力學
第1章 近似納什均衡算法進展
1.1 引言
1.2 定義和符號
1.3 算法
1.4 3種方法的緊實例
1.5 生成緊實例
1.6 Deligkas-Fasoulakis-Markakis算法的緊性
1.7 實驗分析
1.8 本章總結與討論
第2章 計算一般和隨機博弈中馬爾可夫 均衡的覆雜性
2.1 引言
2.1.1 直觀理解和主要方法概述
2.1.2 相關工作
2.2 定義和主要定理
2.3 關於馬爾可夫精煉均衡的存在性
2.4 近似保證
2.5 本章總結與討論
第3章 區塊鏈中的礦池挖礦均衡
3.1 引言
3.2 研究背景及相關工作
3.3 遠見挖礦策略
3.4 策略收益分析
3.5 挖礦博弈與均衡
3.5.1 策略空間
3.5.2 期望收益函數
3.5.3 均衡刻畫
3.6 模擬實驗
3.6.1 遠見挖礦與自私挖礦對比實驗
3.6.2 遠見挖礦實驗
3.6.3 均衡可視化
3.7 本章總結與討論
第4章 讚助搜索拍賣中的私有數據操縱
4.1 引言
4.2 模型
4.2.1 單參數環境
4.2.2 私有數據操縱博弈
4.3 私有數據操縱模型中拍賣等價性
4.3.1 Myerson拍賣
4.3.2 Mye和GFP之間的等價性
4.4 讚助搜索拍賣中的等效性
4.4.1 先驗無關拍賣
4.4.2 讚助搜索拍賣中的PDM博弈
4.5 本章總結與討論
第2部分 信息論方法
第5章 基於信息論的 賽制設計
5.1 引言
5.2 預備知識
5.3 量化觀眾的驚喜和對感知質量的關系
5.3.1 數據收集方式
5.3.2 原始數據和初步結果
5.3.3 主要結論
5.4 在“答題競賽”中設計 “遊戲改變者”
5.4.1 遊戲模型
5.4.2 技術概覽
5.4.3 結果簡述
5.4.4 技術細節
5.5 在“魁地奇”中設計 “遊戲改變者”
5.5.1 遊戲模型
5.5.2 技術概覽
5.5.3 結果簡述
5.5.4 技術細節
5.6 在MOBA遊戲中設計 “遊戲改變者”
5.6.1 遊戲模型
5.6.2 參數選擇
5.6.3 數值求解
5.7 本章總結與討論
第3部分 非 信息博弈算法實踐方法論
第6章 遊戲作為博弈算法實踐的試驗場
6.1 引言
6.2 遊戲的分類與性質
6.3 遊戲建模方法
6.3.1 強化學習
6.3.2 博弈論
6.4 遊戲AI研究平臺
6.5 本章總結與討論
第7章 遊戲中的智能決策算法
7.1 引言
7.2 基於先驗知識的算法
7.3 基於規劃的算法
7.3.1 啟發式搜索
7.3.2 博弈搜索
7.3.3 MCTS及其變種
7.3.4 基於CFR的規劃算法
7.4 基於學習的算法
7.4.1 進化算法
7.4.2 監督學習
7.4.3 強化學習
7.4.4 多智能體學習算法
7.5 本章總結與討論
第8章 遊戲智能決策算法系統的案例分析
8.1 引言
8.2 圍棋
8.3 德州撲克
8.4 麻將
8.5 鬥地主
8.6 MOBA遊戲
8.7 本章總結與討論
第9章 遊戲智能決策框架和範式
9.1 引言
9.2 通用框架
9.2.1 AlphaGo框架
9.2.2 CFR框架
9.2.3 DRL框架
9.2.4 未來趨勢
9.3 算法差異與遊戲性質
9.3.1 自對弈策略
9.3.2 非 信息
9.3.3 異質智能體
9.4 本章總結與討論
參考文獻
本書詳細探討非 非 信息博弈動力學理論、 方法與實踐。主要內容包括 智能體在非 信息條件下 的認知差異和博弈行為、多 智能體博弈動力學、智能決 策和人機博弈等多個領域。 書中通過理論分析與實證數 據相結合,深入分析了非完 全信息環境下的動態博弈特 性,並提出相應的優化工具 與解決方案。 本書主要特點在於提出 了適用於智能體博弈環境的 完整理論框架,特別是針對 信息擴散與非對稱博弈行為 優化的深入探討。書中既包 含了豐富的理論模型,又結 合實際案例進行了詳細分析 ,為實際應用提供了指導。 本書適合從事人工智能 、博弈論及其應用研究的學 者和工程師學習參考,也可 作為高等學校相關專業研究 生的參考書。