Kubeflow學習指南:生產級機器學習系統實現 Kubeflow for Machine Learning: From Lab to Production

Trevor Grant ,Holden Karau,Boris Lublinsky ,Richard Liu,Ilan Filonenko 譯 狄衛華

商品描述

Kubeflow是基於K8S的機器學習工具包,
是為數據科學家和數據工程師構建生產級別的機器學習實現而設計的。
本書採用循序漸進的方式,從 Kubeflow 的安裝、使用和設計開篇,隨後從模型訓練的整個週期展開,
涵蓋了數據探索、特徵準備、模型訓練/調優、模型服務、模型測試、模型監測和模型版本管理等各個環節,
既有相關的理論知識也囊括了真實的使用案例,
能夠讓讀者在學習 Kubeflow 知識的同時全面了解機器學習的相關知識,
是入門和深入學習Kubeflow以及機器學習的良好指南。

目錄大綱

序言 1
前言 3
第1章 Kubeflow及其適用對象 13
1.1 模型開發生命週期 13
1.2 Kubeflow 適合什麼場景 14
1.3 為什麼需要容器化 14
1.4 為什麼需要 Kubernetes 15
1.5 Kubeflow的設計和核心組件 15
1.6 Kubeflow的替代方案 19
1.7 案例研究 21
1.8 總結 22

第2章 你好,Kubeflow 24
2.1 搭建Kubeflow 24
2.2 訓練和部署模型 30
2.3 超越本地部署 34
2.4 總結 34

第3章 Kubeflow設計:超越基礎 35
3.1 中央儀錶盤 36
3.2 支持組件 43
3.3 總結 50

第4章 Kubeflow Pipeline 51
4.1 Pipeline入門 51
4.2 Kubeflow Pipeline組件介紹 60
4.3 Pipeline高級主題 68
4.4 總結 72

第5章 數據準備和特徵準備 73
5.1 選擇正確的工具 74
5.2 本地數據準備和特徵準備 74
5.3 分佈式工具 78
5.4 將其整合到一個Pipeline中 92
5.5 將整個notebook作為數據準備Pipeline階段使用 94
5.6 總結 95

第6章 製品和元數據存儲 96
6.1 Kubeflow ML Metadata 97
6.2 基於Kubeflow的MLflow元數據工具 102
6.3 總結 110

第7章 訓練機器學習模型 111
7.1 用TensorFlow構建推薦器 111
7.2 部署TensorFlow訓練作業 117
7.3 分佈式訓練 120
7.4 使用scikit-learn訓練模型 125
7.5 總結 132

第8章 模型推斷 133
8.1 模型服務 133
8.2 模型監控 136
8.3 模型更新 137
8.4 推理要求概述 138
8.5 Kubeflow中的模型推理 138
8.6 TensorFlow Serving 139
8.7 Seldon Core 143
8.8 KFServing 158
8.9 總結 174

第9章 多工具使用案例 175
9.1 CT掃描去噪示例 175
9.2 共享Pipeline 186
9.3 總結 186

第10章 超參調優和自動化機器學習 187
10.1 AutoML概述 187
10.2 使用Kubeflow Katib進行超參調優 188
10.3 Katib概念 189
10.4 安裝Katib 191
10.5 運行第一個Katib實驗 192
10.6 調優分佈式訓練作業 200
10.7 神經網絡架構搜索 201
10.8 Katib的優勢 204
10.9 總結 205
附錄A Argo執行器配置和權衡 207
附錄B 特定於雲的工具和配置 208
附錄C 在應用程序中使用模型服務 210