大模型核心原理與企業落地實踐

林學森、吳鋒、王勁濤、代聲馨

  • 出版商: 清華大學
  • 出版日期: 2025-05-01
  • 售價: $594
  • 語言: 簡體中文
  • ISBN: 7302687943
  • ISBN-13: 9787302687948
  • 相關分類: LangChain
  • 下單後立即進貨 (約4週~6週)

  • 大模型核心原理與企業落地實踐-preview-1
  • 大模型核心原理與企業落地實踐-preview-2
  • 大模型核心原理與企業落地實踐-preview-3
大模型核心原理與企業落地實踐-preview-1

相關主題

商品描述

"全書分兩大篇。第 1 篇原理篇(第 1、2 章),嘗試引導讀者共同探索和揭秘研發領域大模型背後的核心原理,以使讀者“既知其然,又知其所以然”,並為後續章節的學習打下堅實的基礎。從概率、**化等基礎理論入手,進而深入淺出地闡述 Transformer、神經元等大模型的核心組成元素,以及評估方法、數據工程建設等通用能力的建設。針對技術細節,採用通俗易懂的行文風格,並輔以大量的圖表和數據,“零基礎”的讀者也可以高效地學習。第 2 篇應用實踐篇(第3 ~ 8章),是產業界**實踐成果的總結。選取代碼生成、代碼轉換、知識問答、推理加速、運維運營等研發大模型領域的高頻業務作為剖析對象,詳細展示作者在針對這些問題時的端到端思考,包括設計理念、關鍵技術瓶頸、解決方案及落地結果等。 無論你是初學者還是行業專家,都能在本書中找到寶貴的知識和實用的技巧,本書將幫助你在大模型技術的浪潮中乘風破浪。"

目錄大綱

目錄

CONTENTS

第1篇 原理篇

第1章 人工智能概述 002

1.1 人工智能的定義 002

1.2 人工智能發展簡史 003

1.2.1 史前文明,曙光初現(1956年之前) 004

1.2.2 初出茅廬,一戰成名(1956—1974年) 008

1.2.3 寒風凜冽,首次入冬(1974—1980年) 011

1.2.4 捲土重來,威震八方(1980—1987年) 012

1.2.5 失望彌漫,再度入冬(1987—1993年) 014

1.2.6 重出江湖,漸入佳境(1993年至今) 016

1.3 自然語言處理和大語言模型 018

1.3.1 自然語言處理 018

1.3.2 大語言模型 037

第2章 大模型的數學基礎 039

2.1 微分學 039

2.1.1 鏈式求導法則 039

2.1.2 對數函數求導 039

2.1.3 梯度和梯度下降算法 040

2.2 線性代數 041

2.2.1 向量 041

2.2.2 矩陣拼接 046

2.2.3 特徵值和特徵向量 053

2.2.4 幾何變換 054

2.3 概率論 056

2.3.1 概率分佈 056

2.3.2 先驗概率和後驗概率 058

2.3.3 最大似然估計 059

2.3.4 貝葉斯法則 060

2.4 統計學 061

2.4.1 數據的標準化和歸一化 061

2.4.2 標準差 062

2.4.3 偏差和方差 062

2.4.4 協方差和協方差矩陣 063

2.5 深度神經網絡基礎 064

2.5.1 神經元 064

2.5.2 激活函數 067

2.5.3 前向傳播和後向傳播算法 072

2.5.4 損失函數 077

2.6 Transformer機制詳解 084

2.6.1 Transformer簡介 084

2.6.2 分詞及向量化 085

2.6.3 位置編碼 086

2.6.4 自註意力和多頭註意力 087

2.6.5 殘差連接和層歸一化 089

2.6.6 Transformer小結 090

2.7 其他 093

2.7.1 訓練、驗證和測試數據集 093

2.7.2 過擬合和欠擬合 096

2.7.3 奧卡姆剃刀原則 097

2.7.4 信息熵  098

第2篇 應用實踐篇

第3章 大語言模型與檢索增強生成技術 102

3.1 檢索增強生成背景 102

3.2 檢索增強生成技術框架 102

3.2.1 信息檢索 104

3.2.2 提示工程 111

第4章 基於大語言模型的智能問答助手 114

4.1 文檔離線預處理與存儲 114

4.1.1 格式化 115

4.1.2 切割 115

4.1.3 向量化與存儲 119

4.2 聯網在線預處理與存儲 122

4.3 在線 QA 服務 123

4.3.1 用戶問題向量化 124

4.3.2 Prompt 組裝 124

4.3.3 問答召回 124

4.4 長記憶與多輪對話 125

4.5 歸因與可解釋性 128

4.6 評測 129

4.7 用戶反饋 131

4.8 待解決的系列問題 131

第5章 基於大語言模型的智能數據助手 134

5.1 數據標準化 135

5.2 工具 140

5.3 案例 143

第6章 基於大語言模型的鴻蒙代碼轉換探索 145

6.1 背景概述 145

6.2 問題剖析 145

6.3 探索破題 150

6.3.1 總體思路概述 151

6.3.2 基於“知識體系”的數據工程建設 152

6.3.3 針對被轉換對象“庖丁解牛” 155

6.3.4 提取典型問題模式,利用關鍵技術“各個擊破” 157

6.3.5 不斷優化“反饋迴路”,緩解工程復雜性 159

第7章 大語言模型的推理加速 161

7.1 引言 161

7.2 推理加速技術原理 165

7.2.1 推理計算與顯存分析 165

7.2.2 模型壓縮 169

7.2.3 計算加速 181

7.2.4 技術總覽 198

7.3 推理加速框架 199

7.3.1 vLLM 199

7.3.2 TGI 206

7.4 推理加速工程實踐 209

7.4.1 Llama3 在vLLM 框架上的推理 209

7.4.2 Llama3 在TGI框架上的推理 211

7.4.3 推理測試 212

第8章 大語言模型的運維與持續優化 223

8.1 運維背景 223

8.2 鏈路追蹤 224

8.3 數據管理與測試用例管理 236

8.3.1 Web 數據集管理 236

8.3.2 SDK 數據集管理 236

8.3.3 數據集版本管理 237

8.3.4 few-shot 動態管理 238

8.4 一站式評測 239

8.4.1 評測 239

8.4.2 單元測試 241

8.4.3 回歸測試 241

8.4.4 流量錄制回放測試 241

8.4.5 Agent/Tool 評測 242

8.4.6 RAG 評測 244

8.5 Prompt管理 246

8.6 監控告警 248

8.6.1 過濾器 248

8.6.2 監控 248

8.7 部署 249

8.7.1 框架 249

8.7.2 k8s 部署 250

參考文獻 253