構建大模型數據科學應用:從機器學習升級到大模型 Machine Learning Upgrade: A Data Scientist's Guide to Mlops, Llms, and ML Infrastructure: A Data Scientist's Guide to Mlops, Llms, and ML Infrastructu

[美] 克裡斯汀·科勒(Kristen Kehrer) 凱萊布·凱撒(Caleb Kaiser)著 王奕逍 譯

  • 構建大模型數據科學應用:從機器學習升級到大模型-preview-1
  • 構建大模型數據科學應用:從機器學習升級到大模型-preview-2
  • 構建大模型數據科學應用:從機器學習升級到大模型-preview-3
構建大模型數據科學應用:從機器學習升級到大模型-preview-1

相關主題

商品描述

" 在兩位**數據科學家的引導下,你將系統瞭解LLM前沿技術的更新進展,學習理論知識,以最負責任的方式將LLM技術融入商業場景;將構建一個LLM驅動的應用,直觀感受框架的實際運作,掌握數據版本控制、實驗跟蹤、模型監控和倫理等知識點。 本書旨在為不同層級的數據領域從業者提供助力,使用前沿技術與方法論,全方位呈現LLM應用,介紹上佳技術實踐。通過“數據優先”視角,識別整合LLM並驅動業務成功的機會。"

目錄大綱

目    錄

 

第1章 現代機器學習簡介   1

1.1  數據科學與商業智能漸行漸遠   2

1.2  從CRISP-DM過渡到最新的多組件ML系統   3

1.3  LLM提升了ML的能力和復雜度   5

1.4  你能從本書中學到哪些知識   6

第2章 一種端到端的方法   9

2.1  YouTube搜索智能體的組件   11

2.2  生產中使用的ML系統的核心原則   13

2.2.1  可觀察性   14

2.2.2  可再現性   15

2.2.3  互操作性   15

2.2.4  可擴展性   16

2.2.5  可改進性   17

2.2.6  關於工具的註意事項   18

第3章 以數據為中心   19

3.1  基礎模型的出現   19

3.2  現成組件的角色   20

3.3  數據驅動的方法   21

3.4  有關數據倫理的註意事項   22

3.5  構建數據集   23

3.5.1  使用向量數據庫   25

3.5.2  數據版本控制和管理   38

3.5.3  開始使用數據版本控制工具   41

3.6  適度瞭解數據工程知識   45

第4章 LLM   47

4.1  選擇LLM   47

4.1.1  我需要執行哪種類型的推理   49

4.1.2  這項任務是通用的還是專用的   50

4.1.3  數據的隱私級別有多高   50

4.1.4  該模型需要多高的成本   51

4.2  LLM實驗管理   52

4.3  LLM推理   56

4.3.1  提示工程的基本原理   56

4.3.2  上下文學習   58

4.3.3  中間計算   64

4.3.4  RAG   67

4.3.5  智能體技術   71

4.4  用Comet ML優化LLM推理   77

4.5  微調LLM   84

4.5.1  微調LLM的時機   84

4.5.2  量化、QLoRA和參數高效微調   85

4.6  本章小結   90

第5章 合成一個完整的應用   91

5.1  用Gradio得到應用的雛形   93

5.2  使用Plotnine創建圖形   94

5.2.1  添加選擇框   102

5.2.2  添加徽標   103

5.2.3  添加選項卡   103

5.2.4  添加標題和副標題   104

5.2.5  更改按鈕的顏色   104

5.2.6  添加下載按鈕   105

5.2.7  將組件合在一起   105

5.3  將模型部署為API   107

5.3.1  用FastAPI實現API   109

5.3.2  實現Uvicorn   111

5.4  監控LLM   111

5.4.1  用Docker部署服務   113

5.4.2  部署LLM   115

5.5  小結   119

第6章 完成ML生命周期   121

6.1  部署一個簡單的隨機森林模型   121

6.2  模型監控簡介   125

6.3  用Evidently AI監控模型   131

6.4  構建模型監控系統   134

6.5  有關監控的總結   141

第7章 最佳實踐   143

7.1  第一步:理解問題   143

7.2  第二步:選擇和訓練模型   144

7.3  第三步:部署和維護   145

7.4  第四步:協作與溝通   148

7.5  LLM的發展趨勢   149

7.6  進一步的研究   150