機器學習與人工智能

張舉華著

  • 出版商: 科學出版
  • 出版日期: 2020-06-01
  • 定價: $354
  • 售價: 7.0$248
  • 語言: 簡體中文
  • 頁數: 213
  • 裝訂: 平裝
  • ISBN: 7030649567
  • ISBN-13: 9787030649560
  • 相關分類: Machine Learning
  • 立即出貨

商品描述

本書涵蓋了與人工智能相關的機器學習核心方法,包括深度卷積神經網絡、循環神經網絡、
生成對抗網絡、蒙特卡羅樹搜索、強化學習。本書也包括一些應用非常廣泛的機器學習方法,
例如,支持向量機、決策樹和隨機森林、隱馬爾可夫模型、聚類與自組織映射。
本書還包含一些重要的大數據分析方法,如主成分分析、回歸分析等。

目錄大綱

目錄
第1章導言1
1.1機器學習的概念1
1.2機器學習的類別1
1.3機器學習和其他領域的關係2
1.4人工智能的發展歷程3
1.5機器學習和人工智能的關係5

第2章機器學習基礎7
2.1概率和統計基礎7
2.1.1概率7
2.1.2隨機變量8
2.1.3線性相關9
2.1.4常用概率分佈10
2.1.5貝葉斯定理11
2.2凸函數12
2.3極大似然估計13
2.4熵和散度13
2.5主成分分析15
2.5.1數據標準化15
2.5.2數據矩陣的正交變換16
2.5.3主成分18
2.5.4因子和因子載荷18
2.6隨機梯度下降算法19
2.6.1函數的梯度和方嚮導數19
2.6.2梯度下降算法20
2.6.3隨機梯度下降20
2.6.4動量21
2.7過擬合和欠擬合22
2.8交叉驗證22
2.9二分類模型的評價23
2.10機器學習的工具包26

第3章回歸分析27
3.1回歸分析問題27
3.2線性回歸分析28
3.2.1線性回歸分析問題28
3.2.2線性回歸形式29
3.2.3簡單線性回歸29
3.3 Logistic回歸30
3.3.1 Logistic函數30
3.3.2線性二分類31
3.3.3對數似然函數與代價函數32
3.3.4 *優參數的學習34

第4章支持向量機36
4.1引言36
4.2二分類支持向量機算法36
4.2.1二分類線性支持向量機37
4.2.2二分類非線性支持向量機41
4.2.3核函數42
4.3支持向量機分類性能的評價43
4.4序貫*小優化算法44

第5章聚類和自組織映射47
5.1向量、範數和向量間的距離47
5.2 K-均值聚類48
5.3自組織映射49
5.3.1 Kohonen模型49
5.3.2突觸權重向量的初始化50
5.3.3競爭過程50
5.3.4合作過程50
5.3.5自適應過程52
5.3.6定序與收斂53

第6章隱馬爾可夫模型55
6.1馬爾可夫鏈55
6.2隱馬爾可夫模型的含義56
6.2.1模型的含義56
6.2.2統計推斷58
6.3後驗概率解碼58
6.4狀態路徑的推斷60
6.5隱馬爾可夫模型中參數的估計61
6.5.1已知完整數據的參數估計62
6.5.2期望*大算法62
6.5.3 Baum-Welch算法65

第7章決策樹和隨機森林67
7.1樹67
7.1.1圖67
7.1.2二叉樹68
7.2決策樹學習69
7.2.1度量69
7.2. 2 ID3算法71
7.2.3 C4.5算法74
7.3自舉聚集法75
7.4隨機森林76

第8章蒙特卡羅樹搜索77
8.1引言77
8.2蒙特卡羅積分78
8.3博弈78
8.3.1組合博弈79
8.3 .2博弈樹79
8.3.3極小極大算法79
8.3.4多臂老虎機81
8.3.5 2-貪心82
8.3.6遺憾82
8.3.7上置信界82
8.4蒙特卡羅樹搜索算法83
8.5樹的上置信界85
8.6蒙特卡羅樹搜索的特徵87
8.6.1啟發式87
8.6.2隨時性88
8.6.3非對稱性88

第9章卷積神經網絡89
9.1引言89
9.2有監督學習90
9.3背景知識91
9.3.1張量和向量化91
9.3.2向量的計算以及鍊式法則91
9.3.3克羅內克積92
9.4 CNN簡述92
9.4.1結構92
9.4.2前向傳播93
9.4.3隨機梯度下降93
9.4.4誤差反向傳播93
9.5卷積層94
9.5.1輸入,輸出,濾波,記號94
9.5.2卷積95
9.5.3卷積展開95
9.5.4卷積展開的推廣96
9.5.5更高維度的指標矩陣98
9.5.6反向傳播的參數99
9.5.7反向傳播:監督信號100
9.6池化層101
9.7逆向操作102
9.8 ReLU層103

第10章深度卷積神經網絡104
10.1 Alex網絡104
10.2 VGG網絡106
10.3 Inception網絡107
10.4殘差網絡111
10.4.1殘差塊112
10.4.2殘差網絡的結構113
10.5深度卷積神經網絡的訓練114
10.5.1權值初始化114
10.5.2學習率更新115
10.5. 3批量正則化115
10.5.4增大數據集116
10.5.5圖形處理器與並行計算117
10.6全卷積神經網絡與圖像的分割117
10.6.1全卷積神經網絡117
10.6.2圖像分割117
10.7深度卷積神經網絡在DNA序列分析中的應用120

第11章循環神經網絡124
11.1循環的含義124
11.2循環神經網絡的架構125
11.3循環神經網絡中梯度的計算128
11.4長短期記憶網絡130
11.5門控循環單元133
11.6循環神經網絡的實現與應用案例134
11.6.1訓練數據的獲取134
11.6.2循環神經網絡的訓練135
11.6.3報告對比137
11.6.4基於PyTorch的LSTM網絡訓練138

第12章生成對抗網絡140
12.1引言140
12.2生成對抗網絡原理141
12.2.1損失函數和極大極小博弈142
12.2.2算法142
12.2.3 *優判別器143
12.3 GAN的缺陷:梯度的消失144
12.4深度卷積生成對抗網絡的架構145

第13章有完整模型的強化學習148
13.1強化學習導引148
13.2馬爾可夫獎賞過程150
13.2.1馬爾可夫獎賞過程表現形式150
13.2.2狀態值函數和貝爾曼方程151
13.3馬爾可夫決策過程151
13.3.1值函數與貝爾曼方程153
13.3.2 *優策略和*優值函數156
13.3.3行動值方法159
13.4動態規劃159
13.4.1策略評價160
13.4.2策略改進161
13.4.3策略迭代162
13.4.4值迭代162
13.4.5異步動態規劃163
13.4.6廣義策略迭代164

第14章無完整模型的強化學習166
14.1蒙特卡羅方法166
14.1.1蒙特卡羅策略預測167
14.1.2行動值的蒙特卡羅估計169
14.1.3蒙特卡羅控制170
14.1.4無探索起始的既定策略蒙特卡羅控制172
14.1.5通過重要性抽樣實現離策略預測173
14.1.6增量形式175
14.1.7離策略蒙特卡羅控制176
14.1.8蒙特卡羅方法與動態規劃方法的比較177
14.2時間差分學習178
14.2.1時間差分預測179
14.2.2 Sarsa:既定策略時間差分控制181
14.2.3 Q-學習:離策略時間差分控制182
14.2.4期望Sarsa 182
14.2.5 *大偏差和加倍學習183
14.2.6持續探索185
第15章深度Q網絡186
15.1深度Q網絡原理187
15.2深度Q網絡中的深度卷積神經網絡187
15.3深度Q網絡算法188
15.4深度Q網絡訓練190
參考文獻194
附錄A:AlexNet代碼196
附錄B:Inception網絡代碼198
附錄C:ResNet代碼204
附錄D:深度卷積神經網絡的訓練代碼208