機器學習實戰:基於 Scikit-Learn 和 TensorFlow (Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques for Building Intelligent Systems) 机器学习实战:基于Scikit-Learn和TensorFlow

奧雷利安·傑龍 (Aurélien Géron)

立即出貨

買這商品的人也買了...

相關活動主題

20181206 %e7%b0%a1%e9%ab%94%e6%9b%b8 s

商品描述

本書主要分為兩個部分。

第一部分為第1章到第8章,涵蓋機器學習的基礎理論知識和基本算法——從線性回歸到隨機森林等,幫助讀者掌握Scikit-Learn的常用方法;

第二部分為第9章到第16章,探討深度學習和常用框架TensorFlow,一步一個腳印地帶領讀者使用TensorFlow搭建和訓練深度神經網絡,以及捲積神經網絡。

本書是對使用神經網絡來解決問題的理論和實踐的一個很好的介紹。它涵蓋了你建立高效應用的關鍵點,以及足夠的背景知識以應對新研究的出現。我推薦這本書給有興趣學習用機器學習來解決實際問題的人。

- Pete Warden,Mobile Lead for TensorFlow

作者簡介

隨著一系列的突破,深度學習點燃了整個機器學習領域。現在,即使是對這項技術毫無基礎的程序員,也可以使用簡單高效的工具來實現“可以自動從數據中學習”的程序。本書將展示如何做到這一點。

通過具體的例子、非常少的理論和兩個產品級的Python框架——Scikit-learn和TensorFlow 。作者幫助你很直觀地理解並掌握構建智能係統的概念和工具。你將學習一系列技術,從簡單的線性回歸開始到深度神經網絡等。每章都有習題來幫助你應用學到的知識,你所需要的只是一點編程經驗,僅此而已。

-探索機器學習的全景圖,特別是神經網絡。
-使用Scikit-Learn來端到端地建立一個機器學習項目的示例。
-探索多種訓練模型,包括支持向量機、決策樹、隨機森林和集成方法。
-使用TensorFlow庫建立和訓練神經網絡。
-深入神經網絡架構,包括卷積網絡、遞歸網絡和深度強化學習。
-學習訓練和伸縮深度神經網絡的技巧。
-應用可以工作的代碼示例,而無須過多的機器學習理論或算法細節。

本書是關於使用神經網絡來解決問題的理論和實踐的一本導論。它涵蓋了你建立高效應用的關鍵點,以及足夠的背景知識以應對新研究的出現。我推薦這本書給有興趣學習用機器學習來解決實際問題的人。

- Pete Warden 
- TensorFlow移動端負責人

Aurelien Geron是機器學習方面的顧問。

他是Google的前員工,在2013年到2016年領導過YouTube視頻分類團隊。

2002年至2012年,他還是Wifirst公司的創始人和技術官,在2001年,他是Ployconseil公司的創始人和技術官。

目錄大綱

目錄
前言1 
第一部分機器學習基礎
第1章機器學習概覽11 
什麼是機器學習12 
為什麼要使用機器學習12 
機器學習系統的種類15 
監督式/無監督式學習16 
批量學習和在線學習21 
基於實例與基於模型的學習24 
機器學習的主要挑戰29 
訓練數據的數量不足29 
訓練數據不具代表性30 
質量差的數據32 
無關特徵32 
訓練數據過度擬合33 
訓練數據擬合不足34 
退後一步35 
測試與驗證35 
練習37 
第2章端到端的機器學習項目39 
使用真實數據39 
觀察大局40 
框架問題41 
選擇性能指標42 
檢查假設45 
獲取數據45 
創建工作區45 
下載數據48 
快速查看數據結構49 
創建測試集52 
從數據探索和可視化中獲得洞見56 
將地理數據可視化57 
尋找相關性59 
試驗不同屬性的組合61
機器學習算法的數據準備62 
數據清理63 
處理文本和分類屬性65 
自定義轉換器67 
特徵縮放68 
轉換流水線68 
選擇和訓練模型70 
培訓和評估訓練集70 
使用交叉驗證來更好地進行評估72 
微調模型74 
網格搜索74 
隨機搜索76 
集成方法76 
…… 
通過測試集評估系統77 
啟動、監控和維護系統78 
試試看79 
練習79 
第3章分類80 
MNIST80 
訓練一個二元分類器82 
性能考核83 
使用交叉驗證測量精度83 
混淆矩陣84 
精度和召回率86 
精度/召回率權衡87 
ROC曲線90 
多類別分類器93 
錯誤分析95 
多標籤分類98 
多輸出分類99 
練習100 
第4章訓練模型102 
線性回歸103 
標準方程104 
計算複雜度106 
梯度下降107 
批量梯度下降110 
隨機梯度下降112
小批量梯度下降114 
多項式回歸115 
學習曲線117 
正則線性模型121 
嶺回歸121 
套索回歸123 
彈性網絡125 
早期停止法126 
邏輯回歸127 
概率估算127 
訓練和成本函數128 
決策邊界129 
Softmax回歸131 
練習134 
第5章支持向量機136 
線性SVM分類136 
軟間隔分類137 
非線性SVM分類139 
多項式核140 
添加相似特徵141 
高斯RBF核函數142 
計算複雜度143 
SVM回歸144 
工作原理145 
決策函數和預測146 
訓練目標146 
二次規劃148 
對偶問題149 
核化SVM149 
在線SVM151 
練習152 
第6章決策樹154 
決策樹訓練和可視化154 
做出預測155 
估算類別概率157 
CART訓練算法158 
計算複雜度158 
基尼不純度還是信息熵159
正則化超參數159 
回歸161 
不穩定性162 
練習163 
第7章集成學習和隨機森林165 
投票分類器165 
bagging和pasting168 
Scikit-Learn的bagging和pasting169 
包外評估170 
Random Patches和隨機子空間171 
隨機森林172 
極端隨機樹173 
特徵重要性173 
提升法174 
AdaBoost175 
梯度提升177 
堆疊法181 
練習184 
第8章降維185 
維度的詛咒186 
數據降維的主要方法187 
投影187 
流形學習189 
PCA190 
保留差異性190 
主成分191 
低維度投影192 
使用Scikit-Learn192 
方差解釋率193 
選擇正確數量的維度193 
PCA壓縮194 
增量PCA195 
隨機PCA195 
核主成分分析196 
選擇核函數和調整超參數197 
局部線性嵌入199
其他降維技巧200 
練習201 
第二部分神經網絡和深度學習
第9章運行TensorFlow205 
安裝207 
創建一個計算圖並在會話中執行208 
管理圖209 
節點值的生命週期210 
TensorFlow中的線性回歸211 
實現梯度下降211 
手工計算梯度212 
使用自動微分212 
使用優化器214 
給訓練算法提供數據214 
保存和恢復模型215 
用TensorBoard來可視化圖和訓練曲線216 
命名作用域219 
模塊化220 
共享變量222 
練習225 
第10章人工神經網絡簡介227 
從生物神經元到人工神經元227 
生物神經元228 
具有神經元的邏輯計算229 
感知器230 
多層感知器和反向傳播233 
用TensorFlow的高級API來訓練MLP236 
使用純TensorFlow訓練DNN237 
構建階段237 
執行階段240 
使用神經網絡241 
微調神經網絡的超參數242 
隱藏層的個數242
每個隱藏層中的神經元數243 
激活函數243 
練習244 
第11章訓練深度神經網絡245 
梯度消失/爆炸問題245 
Xavier初始化和He初始化246 
非飽和激活函數248 
批量歸一化250 
梯度剪裁254 
重用預訓練圖層255 
重用TensorFlow模型255 
重用其他框架的模型256 
凍結低層257 
緩存凍結層257 
調整、丟棄或替換高層258 
模型動物園258 
無監督的預訓練259 
輔助任務中的預訓練260 
快速優化器261 
Momentum優化261 
Nesterov梯度加速262 
AdaGrad263 
RMSProp265 
Adam優化265 
學習速率調度267 
通過正則化避免過度擬合269 
提前停止269 
1和2正則化269 
dropout270 
最大範數正則化273 
數據擴充274 
實用指南275 
練習276 
第12章跨設備和服務器的分佈式TensorFlow279
一台機器上的多個運算資源280 
安裝280 
管理GPU RAM282 
在設備上操作284 
並行執行287 
控制依賴288 
多設備跨多服務器288 
開啟一個會話290 
master和worker服務290 
分配跨任務操作291 
跨多參數服務器分片變量291 
用資源容器跨會話共享狀態292 
使用TensorFlow隊列進行異步通信294 
直接從圖中加載數據299 
在TensorFlow集群上並行化神經網絡305 
一台設備一個神經網絡305 
圖內與圖間複製306 
模型並行化308 
數據並行化309 
練習314 
第13章卷積神經網絡31