機器學習開發者指南 Machine Learning for Developer

[阿根廷]魯道夫·邦寧(Rodolfo Bonnin) AI研習社譯

  • 機器學習開發者指南-preview-1
  • 機器學習開發者指南-preview-2
機器學習開發者指南-preview-1

買這商品的人也買了...

商品描述

本書將帶領讀者學習如何實施各種機器學習技術及其日常應用的開發。
本書分為9章,從易於掌握的語言基礎數據和數學模型開始,
向讀者介紹機器學習領域中使用的各種庫和框架,然後通過有趣的示例實現回歸、
聚類、分類、神經網絡等,從而解決如圖像分析、自然語言處理和時間序列數據的異常檢測等實際問題。

本書適合機器學習的開發人員、數據分析人員、
機器學習領域的從業人員,以及想要學習機器學習的技術愛好者閱讀。

使用任何腳本語言的編程人員都可以閱讀本書,
但如果熟悉Python語言的話,將有助於充分理解本書的內容。

作者簡介

Rodolfo Bonnin

是阿根廷國家科技大學的系統工程師,博士。
他在德國斯圖加特大學學習並行編程和圖像理解的研究生課程。

自2005年以來,他一直在研究高性能計算,並於2008年開始研究和實現卷積神經網絡,
編寫支持CPU和GPU的神經網絡前饋階段。
*近,他一直致力於利用神經網絡進行欺詐模式檢測的工作,並使用機器學習技術進行信號分類。

他也是《Tensorflow機器學習項目實戰》的作者。

目錄大綱


第1章機器學習和統計科學1
1.1 機器學習的發展2
1.2 編程語言與庫6
1.3 基本數學概念11
1.3.1 統計學——不確定性建模的基本支柱11
1.3.2 概率與隨機變量14
1.3.3 概率函數的統計度量21
1.3.4 微分基礎22
1.3.5 預備知識22
1.4 小結27
 

第2章學習過程28
2.1 理解問題28
2.2 數據集定義與檢索30
2.2.1 ETL過程30
2.2.2 加載數據與使用Scipy和Pandas進行探索分析31
2.2.3 與IPython交互32
2.2.4 二維數據處理34
2.3 特徵工程37
2.3.1 缺失數據估算37
2.3.2 獨熱編碼38
2.4 數據預處理39
規範化和特徵縮放39
2.5 模型定義41
提出正確的問題41
2.6 損失函數定義42
2.7 模型擬合和評價43
數據集劃分43
2.8 模型應用與結果分析44
2.8.1 回歸指標45
2.8.2 分類指標46
2.8.3 聚類質量評估48
2.9 小結50
 

第3章聚類51
3.1 分組—— 一種人類行為51
3.2 自動化聚類過程52
3.3 尋找一個共同的中心—— K-means 53
3.3.1 K-means的優缺點56
3.3.2 K-means算法分解56
3.3.3 K-means算法實現58
3.4 *近鄰(Nearest Neighbors) 62
3.5 K-NN算法實現示例64
3.6 算法擴展67
3.7 小結68
 

第4章線性回歸和邏輯回歸69
4.1 回歸分析69
回歸的應用70
4.2 線性回歸71
4.2.1 代價函數的確定72
4.2.2 分析方法74
4.2.3 協方差和相關性75
4.2.4 尋找協方差和相關性的斜率和截距77
4.2.5 梯度下降法79
4.2.6 遞歸過程表示83
4.3 實踐中的數據研究和線性回歸86
4.3.1 鳶尾花數據集87
4.3.2 線性回歸與梯度下降93
4.4 邏輯回歸103
4.4.1 線性回歸和邏輯回歸103
4.4.2 logit函數105
4.4.3 應用邏輯回歸建立心臟疾病模型的實例109
4.5 小結112
 

第5章神經網絡113
5.1 神經模型的歷史114
5.1.1 感知器模型115
5.1.2 改進預測結果——ADALINE算法116
5.1.3 感知器和ADALINE之間的異同118
5.1.4 單層和多層感知器120
5.2 使用單層感知器實現簡單的功能124
5.2.1 定義並繪製傳遞函數類型124
5.2.2 表示和理解傳遞函數125
5.2.3 Sigmoid函數或邏輯函數126
5.2.4 使用Sigmoid函數126
5.2.5 修正線性單元128
5.2.6 線性傳遞函數129
5.2.7 定義損失函數130
5.3 小結136
 

第6章卷積神經網絡137
6.1 卷積神經網絡的起源137
6.1.1 從卷積開始138
6.1.2 卷積核和卷積140
6.1.3 在實例中實現二維離散卷積143
6.1.4 下採樣(池化) 146
6.1.5 通過Dropout操作提高效率148
6.2 深度神經網絡149
6.2.1 深度卷積網絡框架的發展149
6.2.2 深度卷積神經網絡解決的問題類型154
6.3 使用Keras部署一個深度神經網絡156
6.4 用Quiver開髮捲積模型158
6.4.1 用Quiver開髮捲積網絡158
6.4.2 遷移學習的實現162
6.5 小結167
 

第7章循環神經網絡168
7.1 按順序解決問題—— RNN 168
7.1.1 RNN的定義169
7.1.2 RNN的發展169
7.2 LSTM 172
7.2.1 門和乘法運算172
7.2.2 設置遺忘參數(輸入門) 174
7.2.3 設置保持參數174
7.2.4 修改單元175
7.2.5 輸出過濾後的單元狀態175
7.3 採用電能消耗數據預測單變量時間序列176
數據集的描述和加載176
7.4 小結182
 

第8章近期的新模型及其發展183
8.1 GAN 183
GAN的應用類別184
8.2 強化學習188
8.2.1 馬爾可夫決策過程189
8.2.2 優化馬爾可夫過程190
8.3 基本強化學習技術:Q學習191
8.4 小結193
 

第9章軟件安裝與配置194
9.1 Linux系統環境安裝194
9.1.1 初始配置要求195
9.1.2 Anaconda安裝195
9.1.3 pip安裝200
9.2 macOS X系統環境安裝201
9.2.1 Anaconda安裝201
9.2.2 pip安裝204
9.3 Windows系統環境安裝205
Anaconda安裝205
9.4 小結208


參考資料209