利用Ray進行MLOps(大模型從開發到部署)
黎千
- 出版商: 清華大學
- 出版日期: 2025-09-01
- 售價: $594
- 語言: 簡體中文
- 頁數: 255
- ISBN: 7302701636
- ISBN-13: 9787302701637
-
相關分類:
Machine Learning
- 此書翻譯自: MLOps with Ray: Best Practices and Strategies for Adopting Machine Learning Operations
下單後立即進貨 (約4週~6週)
商品描述
本書圍繞MLOps展開, 全面闡釋其概念與落地實踐 。開篇對MLOps進行概述, 剖析其體系架構、價值定位 與技術棧。隨後各章從特征 工程、模型訓練與推理,到 可觀測性基礎設施,通過理 論闡述與架構解析,並結合 Uber、Meta等知名案例, 分享建設思路。此外,本書 還介紹Ray Core及Ray AI庫 的使用,並提供大語言模型 訓練部署實例。 ,本書 對MLOps及AI/ML的發展 趨勢進行展望。 本書條理清晰,理論與 實踐結合緊密,數據豐富, 且案例 代表性,適合機 器學習工程師、數據科學家 、MLOps從業者及對AI工程 化落地感興趣的技術人員閱 讀,助力其深入理解並構建 MLOps體系。
目錄大綱
第1章 MLOps概覽
1.1 MLOps體系解析
1.1.1 機器學習項目
1.1.2 機器學習項目的輸入和輸出
1.2 MLOps的價值定位
1.2.1 機器學習項目實施的挑戰
1.2.2 MLOps的願景與價值
1.3 MLOps標準技術棧
1.3.1 MLOps體系架構
1.3.2 核心組件解析
1.4 小結
第2章 MLOps實施策略與案例研究
2.1 實施策略
2.1.1 戰略協同
2.1.2 MLOps需求評估
2.1.3 MLOps基礎設施構建方法
2.2 MLOps全景介紹
2.3 案例研究
2.3.1 Uber的Michelangelo平臺
2.3.2 Meta的FBLearner平臺
2.4 小結
第3章 特征工程基礎設施
3.1 概述
3.2 架構
3.2.1 特征規範與定義
3.2.2 特征註冊表
3.2.3 特征編排
3.2.4 特征存儲
3.2.5 特征上傳
3.2.6 特征服務
3.2.7 監控體系
3.3 自建與采購
3.3.1 重要考量因素
3.3.2 自建方案分析
3.3.3 采購方案評估
3.4 組織性挑戰
3.4.1 數據可用性
3.4.2 數據治理
3.5 案例研究
3.5.1 開源
3.5.2 自建
3.5.3 廠商解決方案
3.6 小結
第4章 模型訓練基礎設施
4.1 概述
4.2 架構
4.2.1 模型開發環境
4.2.2 實驗追蹤
4.3 模型訓練管道
4.3.1 編排
4.3.2 持續模型訓練
4.4 大規模模型訓練
4.5 模型註冊表
4.6 案例研究
4.6.1 自建
4.6.2 開源
4.7 小結
第5章 模型推理基礎設施
5.1 概述
5.2 架構
5.2.1 特征存儲
5.2.2 模型註冊表
5.2.3 指標服務
5.2.4 日誌服務
5.2.5 推理服務
5.2.6 預測步驟設計選項
5.3 案例研究
5.3.1 自建
5.3.2 開源
5.4 小結
第6章 ML可觀測性基礎設施
6.1 概述
6.1.1 模型性能
6.1.2 漂移
6.1.3 數據質量
6.1.4 可解釋性
6.2 架構
6.3 案例研究
6.3.1 Lyft:模型監控體系
6.3.2 開源
6.4 小結
第7章 Ray Core
7.1 Ray Core解析
7.1.1 基礎概念
7.1.2 API基礎
7.1.3 架構基礎
7.1.4 調度
7.1.5 容錯
7.2 KubeRay
7.3 小結
7.4 參考文獻
第8章 Ray AI庫
8.1 概述
8.2 Ray AI庫簡介
8.3 使用Ray進行機器學習
8.4 Ray AI庫簡介
8.4.1 數據集與預處理器
8.4.2 訓練器
8.4.3 調優器與檢查點
8.4.4 運行批量預測
8.4.5 在線服務部署
8.5 大語言模型訓練與部署實例
8.5.1 啟動Ray集群與管理依賴
8.5.2 加載數據集並對其進行預處理
8.5.3 微調語言模型
8.5.4 為GPT-J模型執行批量推理
8.5.5 運行在線模型推理
8.6 Ray的集成生態
8.6.1 Ray與同類系統的對比
8.6.2 分布式Python框架對比
8.6.3 Ray AI庫與 廣泛的ML生態
8.6.4 將Ray集成到機器學 臺
8.7 小結
第9章 MLOps展望
9.1 MLOps發展現狀
9.1.1 機器學習開發生命周期
9.1.2 機器學習基礎設施架構
9.1.3 MLOps成熟度模型
9.1.4 MLOps解決方案生態
9.2 AI/ML發展現狀
9.3 大語言模型運維的崛起
9.3.1 LLM應用架構原型
9.3.2 LLOps技術棧
9.4 小結
本書圍繞MLOps展開, 全面闡釋其概念與落地實踐 。開篇對MLOps進行概述, 剖析其體系架構、價值定位 與技術棧。隨後各章從特征 工程、模型訓練與推理,到 可觀測性基礎設施,通過理 論闡述與架構解析,並結合 Uber、Meta等知名案例, 分享建設思路。此外,本書 還介紹Ray Core及Ray AI庫 的使用,並提供大語言模型 訓練部署實例。 ,本書 對MLOps及AI/ML的發展 趨勢進行展望。 本書條理清晰,理論與 實踐結合緊密,數據豐富, 且案例 代表性,適合機 器學習工程師、數據科學家 、MLOps從業者及對AI工程 化落地感興趣的技術人員閱 讀,助力其深入理解並構建 MLOps體系。