Python機器學習工程實戰(第2版)

殷海英 等

  • 出版商: 電子工業
  • 出版日期: 2025-04-01
  • 售價: $1,188
  • 語言: 簡體中文
  • 頁數: 428
  • ISBN: 7121500167
  • ISBN-13: 9787121500169
  • 相關分類: Machine Learning
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書是一本面向機器學習實務的專業指南,通過系統化的工程學視角幫助讀者將機器學習理論轉化為實際應用。全書共九章。內容從基礎知識到模型標準化、部署模式、擴展規模及深度學習應用,層層深入,逐步構建機器學習工程的完整知識體系。書中特別強調如何在Python中高效編碼與設計,如何在大規模數據集上開發,以及當下熱門的大型語言模型(LLM)構建與運營方法。本書不僅傳播技術,更傳遞了工程學的嚴謹與實踐精神,旨在培養能夠解決復雜技術問題並引領數據科學發展的專業人才。無論是初學者,還是行業從業者,本書對讀者來說都是一次深入機器學習工程的寶貴探索。

目錄大綱

第1章 機器學習工程簡介 1
技術要求 2
定義數據學科的分類 4
數據科學家 4
機器學習工程師 5
機器學習運維工程師 6
數據工程師 8
作為一個高效的團隊進行協作 8
在現實世界中的機器學習工程 9
什麽是機器學習解決方案? 12
為什麽使用Python? 14
機器學習系統的高層設計 14
示例1:批量異常檢測服務 15
示例2:預測API 21
示例3:分類流程 26
本章小結 30
第2章 機器學習開發流程 32
技術要求 33
配置我們的工具 34
設置AWS賬戶 38
從概念到解決方案的四個步驟 39
將這與CRISP-DM進行比較 41
發現 42
使用用戶故事 43
運行 45
開發 46
部署 63
瞭解你的部署選項 63
理解DevOps和MLOps 65
使用GitHub Actions構建第一個CI/CD示例 68
持續模型性能測試 72
持續模型訓練 74
本章小結 76
第3章 從模型到模型工廠 78
技術要求 79
定義模型工廠 80
掌握學習的方法 81
定義目標 81
減小損失 82
準備數據 83
為機器學習設計特徵工程 84
設計分類特徵工程 84
設計數值特徵工程 86
設計訓練系統 89
訓練-系統設計選項 90
訓練-運行模式 91
訓練-持久化 92
模型重訓練 93
檢測數據漂移 95
檢測概念漂移 98
設置限制 100
診斷漂移 101
修正數據漂移 103
其他監控工具 105
自動訓練 109
自動化的層次結構 109
優化超參數 111
AutoML 118
持久化你的模型 121
構建模型工廠與管道 125
Scikit-learn管道 126
Spark ML管道 130
本章小結 133
第4章 打包封裝 135
技術要求 136
編寫優秀的Python代碼 136
回顧基礎知識 137
訣竅與技巧 139
堅持標準 142
編寫高質量的PySpark代碼 144
選擇風格 145
面向對象編程 145
函數式編程 148
打包你的代碼 150
為什麽要打包? 151
選擇打包的用例 152
設計你的包 153
構建你自己的包 158
使用Makefile管理你的環境 160
使用Poetry進行打包 165
測試、日誌記錄、安全性和錯誤處理 170
測試 170
保護你的解決方案 174
分析自己的代碼以發現安全問題 175
分析依賴項以發現安全問題 177
記錄日誌 180
錯誤處理 183
不要重復發明輪子 191
本章小結 191
第5章 部署模式和工具 193
技術要求 194
設計系統 194
基於原則構建 196
探索一些標準的機器學習模式 199
在數據湖中暢游 199
微服務 200
基於事件的設計 202
批處理 203
容器化 204
在AWS上托管你自己的微服務 208
推送到ECR 209
在ECS上托管 211
使用Airflow構建通用管道 224
Airflow 224
構建高級機器學習管道 237
使用ZenML 237
使用Kubeflow 249
選擇你的部署策略 259
本章小結 260
第6章 擴展規模 262
技術要求 263
使用Spark進行擴展 263
Spark技巧和竅門 265
雲上的Spark 273
啟動無服務器基礎設施 283
使用Kubernetes實現大規模容器化 292
使用Ray進行擴展 294
開始使用Ray進行機器學習 298
設計大規模系統 305
本章小結 308
第7章 深度學習、生成人工智能和LLMOps 310
深入探討深度學習 311
使用PyTorch 314
將深度學習擴展並投入生產實踐 318
微調和遷移學習 322
使用LLM 331
理解LLM 332
通過API使用LLM 333
使用LLM進行編碼 336
利用LLM構建未來 340
LLM驗證 341
PromptOps 343
本章小結 344
第8章 構建ML微服務 345
技術要求 345
理解預測問題 346
設計我們的預測服務 348
選擇工具 350
規模化訓練 352
使用FastAPI提供模型服務 356
響應和請求模式 359
在微服務中管理模型 363
將所有內容整合在一起 366
容器化並部署到Kubernetes 371
將應用程序容器化 372
使用Kubernetes進行擴展 373
部署策略 376
本章小結 377
第9章 構建一個提取、轉換、機器學慣用例 379
技術要求 380
理解批處理問題 382
設計ETML解決方案 384
工具選擇 386
接口和存儲 386
模型的擴展 387
ETML管道的調度 388
執行構建 389
使用高級Airflow功能構建ETML管道 390
本章小結 403