機器學習系統設計 : Python 語言實現 (Designing Machine Learning Systems with Python) 机器学习系统设计:Python语言实现 (智能系统与技术丛书)

戴維·朱利安(David Julian)

買這商品的人也買了...

商品描述

本書涵蓋了建立機器學習系統的方方面面,相對比較基礎,其中最有價值的是,書中介紹了機器學習系統設計的整個過程,以及相關的Python庫,在各個知識環節中都給出了Python示例。

無論對於機器學習系統的新兵還是老手,本書都有一定的參考價值。

對於機器學習系統的初學者而言,本書較為系統地介紹了相關知識,同時也在一開始就給出了語言和環境,能夠讓大家甩開膀子,擼起袖子,伸手開乾;而對於機器學習系統的老手而言,其更多的參考價值在於如何使用Python來實現那些概念。

作者簡介

作者:(美國)戴維·朱利安(David Julian)譯者:李洋

 

戴維·朱利安(David Julian),數據分析員、信息系統諮詢顧問和培訓講師。他目前正致力於Urban Ecological Systems和Blue Smart Farms的機器學習項目,該項目旨在發現和預測溫室作物蟲害。

目錄大綱

譯者序

前言

第1章機器學習的思維1 

1.1人機界面1 

1.2設計原理4 

1.2.1問題的類型6 

1.2.2問題是否正確7 

1.2.3任務8 

1.2.4統一建模語言27 

1.3總結31 

第2章工具和技術32 

2.1Python與機器學習33 

2.2IPython控制台33 

2.3安裝SciPy棧34 

2.4NumPy35 

2.4.1構造和變換數組38 

2.4.2數學運算39 

2.5Matplotlib41 

2.6Pandas45 

2.7SciPy47 

2.8Scikit—learn50 

2.9總結57 

第3章將數據變為信息58 

3.1什麼是數據58 

3.2大數據59 

3.2.1大數據的挑戰60 

3.2.2數據模型62 

3.2.3數據分佈63 

3.2.4來自數據庫的數據67 

3.2 .5來自互聯網的數據68 

3.2.6來自自然語言的數據70 

3.2.7來自圖像的數據72 

3.2.8來自應用編程接口的數據72 

3.3信號74 

3.4數據清洗76 

3.5數據可視化78 

3.6總結80 

第4章模型—從信息中學習81 

4.1邏輯模型81 

4.1.1一般性排序83 

4.1.2解釋空間84 

4.1.3覆蓋空間86 

4.1.4PAC學習和計算複雜性87 

4.2樹狀模型88 

4.3規則模型92 

4.3 .1有序列表方法94 

4.3.2基於集合的 則模型95 

4.4總結98 

第5章線性模型100 

5.1最小二乘法101 

5.1.1梯度下降102 

5.1.2正規方程法107 

5.2logistic回歸109 

5.3多分類113 

5.4正則化115 

5.5總結117 

第6章神經網絡119 

6.1神經網絡入門119 

6.2logistic單元121 

6.3代價函數126 

6.4神經網絡的實現128 

6.5梯度檢驗133 

6.6其他神經網絡架構134 

6.7總結135 

第7章特徵—算法眼中的世界136 

7.1特徵的類型137 

7.1. 1定量特徵137 

7.1.2有序特徵138 

7.1.3分類特徵138 

7.2運算和統計139 

7.3結構化特徵141 

7.4特徵變換141 

7.4.1離散化143 

7.4.2歸一化144 

7.4.3校準145 

7.5主成分分析149 

7.6總結151 

第8章集成學習152 

8.1集成學習的類型152 

8.2Bagging方法153 

8.2.1隨機森林154 

8.2.2極端隨機樹155 

8.3Boosting方法159 

8.3.1AdaBoost161 

8.3.2梯度Boosting163 

8.4集成學習的策略165 

8.5總結168 

第9章設計策略和案例研究169 

9.1評價模型的表現169 

9.2模型的選擇174 

9.3學習曲線176 

9.4現實世界中的案例研究178 

9.4.1 立一個推薦系統178 

9.4.2溫室蟲害探測185 

9.5機器學習一瞥188 

9.6總結190