Scikit-Learn 機器學習核心技術與實踐

譚貞軍

  • 出版商: 清華大學
  • 出版日期: 2022-03-01
  • 定價: $474
  • 售價: 7.9$374
  • 語言: 簡體中文
  • ISBN: 7302599483
  • ISBN-13: 9787302599487
  • 相關分類: Machine Learning
  • 立即出貨 (庫存 < 3)

  • Scikit-Learn 機器學習核心技術與實踐-preview-1
  • Scikit-Learn 機器學習核心技術與實踐-preview-2
  • Scikit-Learn 機器學習核心技術與實踐-preview-3
Scikit-Learn 機器學習核心技術與實踐-preview-1

買這商品的人也買了...

商品描述

《Scikit-Learn機器學習核心技術與實踐》循序漸進地講解了使用 Scikit-Learn 開發機器學習程序的核心知識,並通過具體實例的實現過程演練了使用 Scikit-Learn 的方法和流程。全書共10章,包括人工智能與Scikit-Learn 簡介,加載數據集,監督學習,無監督學習,模型選擇和評估,數據集轉換,實現大數據計算,英超聯賽比分預測系統(Matplotlib+Scikit-Learn+Flask+Pandas),AI考勤管理系統(face-recognition+Matplotlib+ Django+Scikit-Learn+Dlib),實時電影推薦系統(Scikit-Learn+Flask+Pandas)。本書簡潔而不失其技術深度,內容豐富全面,易於閱讀。 《Scikit-Learn機器學習核心技術與實踐》適用於已經瞭解Python語言基礎語法的讀者,以及想進一步學習機器學習和深度學習技術的讀者,還可以作為大專院校相關專業的師生用書和培訓學校的專業教材。

目錄大綱

第1 章 人工智能與Scikit-Learn 簡介   1

1.1 人工智能技術的興起  2

1.1.1 人工智能介紹        2

1.1.2 人工智能的研究領域       2

1.1.3 和人工智能相關的幾個重要概念       3

1.1.4 人工智能的兩個重要發展階段       4

1.2 機器學習和深度學習  4

1.2.1 機器學習        5

1.2.2 深度學習        5

1.2.3 機器學習和深度學習的區別     6

1.3 初步認識Scikit-Learn     7

1.3.1 Scikit-Learn 介紹    7

1.3.2 使用pip 安裝Scikit-Learn        7

1.3.3 使用Anaconda 安裝Scikit-Learn      8

1.3.4 解決速度過慢的問題       9

1.4 準備開發工具     10

第2 章 加載數據集         11

2.1 標準數據集API        12

2.1.1 波士頓房價數據集(適用於回歸任務)      12

2.1.2 威斯康星州乳腺癌數據集(適用於分類問題)         13

2.1.3 糖尿病數據集(適用於回歸任務)      13

2.1.4 手寫數字數據集(適用於分類任務)      14

2.1.5 Fisher 的鳶尾花數據集(適用於分類問題)      15

2.1.6 紅酒數據集(適用於分類問題)            15

2.2 自定義數據集     16

2.2.1 生成聚類數據       16

2.2.2 生成同心圓樣本點         17

2.2.3 生成模擬分類數據集      18

2.2.4 生成太極型非凸集樣本點       19

第3 章 監督學習         21

3.1 廣義線性模型     22

3.1.1 普通最小二乘法    22

3.1.2 嶺回歸          24

3.1.3 Lasso 回歸     25

3.2 線性判別分析和二次判別分析    27

3.2.1 使用線性判別分析來降維       28

3.2.2 LDA 和QDA 分類器的數學公式      30

3.2.3 收縮      30

3.3 內核嶺回歸         32

3.4 支持向量機         33

3.4.1 分類      34

3.4.2 回歸      36

3.4.3 密度估計和異常檢測      38

3.5 隨機梯度下降     39

3.5.1 分類            40

3.5.2 回歸      42

3.5.3 稀疏數據的隨機梯度下降       42

第4 章 無監督學習         49

4.1 高斯混合模型     50

4.1.1 高斯混合       50

4.1.2 變分貝葉斯高斯混合     53

4.2 流形學習     55

4.3 聚類        57

4.3.1 KMeans 算法        57

4.3.2 MiniBatchKMeans 算法          60

4.4 雙聚類         62

4.4.1 譜聚類算法    63

4.4.2 光譜聯合聚類算法         66

第5 章 模型選擇和評估       69

5.1 交叉驗證:評估估算器的表現     70

5.1.1 計算交叉驗證的指標      71

5.1.2 交叉驗證迭代器    75

5.2 調整估計器的超參數     76

5.2.1 網格追蹤法:窮盡的網格搜索      77

5.2.2 隨機參數優化       80

5.3 模型評估: 量化預測的質量  82

5.3.1 得分參數scoring :定義模型評估規則       83

5.3.2 分類指標       85

第6 章 數據集轉換         89

6.1 Pipeline(管道)和 FeatureUnion(特徵聯合)         90

6.1.1 Pipeline : 鏈式評估器     90

6.1.2 FeatureUnion(特徵聯合):特徵層          93

6.2 特徵提取     95

6.2.1 從字典類型加載特徵      95

6.2.2 特徵哈希       96

6.2.3 提取文本特徵       97

6.2.4 提取圖像特徵       99

6.3 預處理數據       102

6.3.1 標準化處理        102

6.3.2 非線性轉換        103

6.4 無監督降維       106

6.4.1 PCA :主成分分析       106

6.4.2 隨機投影     110

第7 章 實現大數據計算     117

7.1 計算擴展策略          118

7.1.1 使用外核學習實例進行拓展           118

7.1.2 使用外核方法進行分類        119

7.2 計算性能           129

7.2.1 預測延遲     129

7.2.2 預測吞吐量        137

第8 章 英超聯賽比分預測系統(Matplotlib+Scikit-Learn+Flask+Pandas)         143

8.1 英超聯賽介紹          144

8.2 系統模塊介紹          144

8.3 數據集       144

8.3.1 獲取api-football 密鑰    145

8.3.2 獲取數據     145

8.3.3 收集最新數據     150

8.4 特徵提取和數據可視化       152

8.4.1 提取數據     153

8.4.2 數據可視化        154

8.5 模型選擇和訓練      161

8.5.1 機器學習函數     161

8.5.2 數據降維     172

8.5.3 MLP 神經網絡    175

8.6 模型評估           178

8.6.1 近鄰模型和混淆矩陣模型     179

8.6.2 隨機森林模型和混淆矩陣模型           186

8.6.3 SVM 模型和混淆矩陣模型           190

8.7 Web 可視化     197

8.7.1 獲取預測數據     197

8.7.2 Flask Web 主頁    200

第9 章 AI 考勤管理系統(face-recognition+Matplotlib+Django+Scikit-Learn+Dlib)          203

9.1 背景介紹           204

9.2 系統需求分析          204

9.2.1 可行性分析        204

9.2.2 系統操作流程分析       204

9.2.3 系統模塊設計     204

9.3 系統配置           205

9.3.1 Django 配置文件         205

9.3.2 路徑導航文件     206

9.4 用戶註冊和登錄驗證   207

9.4.1 登錄驗證     207

9.4.2 添加新用戶        208

9.4.3 設計數據模型     210

9.5 採集照片和機器學習   210

9.5.1 設置採集對象     210

9.5.2 採集照片     212

9.5.3 訓練照片模型     214

9.6 考勤打卡           216

9.6.1 上班打卡簽到     216

9.6.2 下班打卡     218

9.7 可視化考勤數據      220

9.7.1 統計最近兩周員工的考勤數據           220

9.7.2 查看本人在指定時間段內的考勤信息     225

9.7.3 查看某員工在指定時間段內的考勤信息     229

第10 章 實時電影推薦系統(Scikit-Learn+Flask+Pandas)      233

10.1 系統介紹         234

10.1.1 背景介紹    234

10.1.2 推薦系統和搜索引擎          234

10.1.3 項目介紹    235

10.2 系統模塊         235

10.3 數據採集和整理   235

10.3.1 數據整理    236

10.3.2 電影詳情數據    239

10.3.3 提取電影特徵    247

10.4 情感分析和序列化操作     252

10.5 Web 端實時推薦       253

10.5.1 Flask 啟動頁面          253

10.5.2 模板文件    256

10.5.3 後端處理    263