深入大模型系統:提示工程、符號推理與智能體實踐

白鈺

  • 出版商: 人民郵電
  • 出版日期: 2025-12-01
  • 定價: $479
  • 售價: $478
  • 語言: 簡體中文
  • 頁數: 234
  • ISBN: 7115687072
  • ISBN-13: 9787115687074
  • 相關分類: Prompt Engineering
  • 下單後立即進貨 (約4週~6週)

  • 深入大模型系統:提示工程、符號推理與智能體實踐-preview-1
深入大模型系統:提示工程、符號推理與智能體實踐-preview-1

商品描述

本書從發展概述、核心技術原理與產業實踐的角度深入解析大模型系統。 全書共 9 章。第1章首先對大模型技術進行概述,系統梳理其概念、發展裏程碑及未來趨勢。第2章轉入產業視角,深入剖析競爭格局、商業策略與產業落地面臨的挑戰。第3~5章介紹大模型系統的技術實現,從監督學習、遷移學習等方法入手,逐步深入文本標記化、編碼器-解碼器架構與從 RNN/LSTM 到 Transformer 的革新,再介紹縮放定律、數據 / 算力/參數等預訓練要素,以及指令微調、基於人類反饋的強化學習對齊機制。第6~9章從產業實踐的角度解析應用層技術,包括上下文學習、檢索增強生成等提示工程方法,深入剖析以思維鏈為代表的符號推理,以及從工作記憶、長期記憶到認知架構的語言智能體體系的構建。 本書適合人工智能領域從業者、高校計算機相關專業師生,以及所有對大模型技術感興趣的人士閱讀。

作者簡介

白鈺,AI與雲計算技術專家,在多模態大模型算法及AI系統方面有豐富的知識儲備和實踐經驗。曾在Comcast、亞馬遜、阿裏雲等企業擔任AI算法負責人,帶領團隊開發多項服務億級用戶的AI系統,在多模態大模型研發和大規模機器學習系統落地方面積累了大量經驗;曾在NeurIPS、NSDI、S&P等頂級會議、期刊上發表多篇論文,擁有20余項專利,參與多項AI標準制定,現任中國中文信息學會大模型與生成專業委員會委員、中國計算機學會技術前沿委員會委員。

目錄大綱

1 章 大模型技術概述 1

11 大模型相關概念辨析 1

111 基礎模型 1

112 GenAI 模型 2

113 LLM 3

114 大模型 3

12 大模型技術發展歷程 4

121 技術發展的階段 4

122 技術發展的驅動力 7

123 當前挑戰與未來發展方向 8

13 大模型系統發展路徑 9

131 基礎語言理解與生成 9

132 工具賦能的增強智能 10

133 自主思考的深入探索 11

134 連接物理世界的具身智能 13

第 2 章 大模型產業發展概述 15

21 大模型產業發展回顧 15

211 Transformer 架構誕生 15

212 商業模式探索 16

213 ChatGPT 與生態競賽 16

214 “百家爭鳴”時代 17

22 商業化核心戰略 18

221 構建可持續的商業閉環 18

222 平民化 20

223 專業化 21

224 具身化 22

23 產業落地模式 23

231 場景創新 23

232 工具創新 24

233 方法創新 24

234 評估大模型帶來的創新價值 24

24 產業競爭格局與挑戰 25

241 領跑者的技術透明化挑戰 25

242 後發者的市場局限 25

243 創業公司的生存壓力 26

第 3 章 模型預訓練技術基礎 27

31 監督學習 27

311 監督學習的定義 27

312 監督學習的統計建模 28

313 監督學習的統計前提 29

314 監督學習中模型結構的選擇 31

315 監督學習中模型的泛化機制 32

316 案例分析:從實驗觀測數據發現牛頓第二定律 34

32 深度學習 36

321 層次結構與函數表達能力 36

322 網絡訓練機制 38

323 DNN 的過擬合風險與壓縮張力 41

324 DNN 壓縮機制 42

325 DNN 的結構化能力 45

33 表示學習 46

331 表示學習的基本思想 47

332 CNN 與層次化空間表示 49

333 殘差網絡 53

34 遷移學習 55

341 概念引入:從已見分布到未知分布 55

342 遷移學習的基本策略:凍結還是微調 56

343 ResNet 與 ImageNet 58

344 遷移學習的流程 59

345 實踐案例:ResNet-152羊駝五分類微調 61

346 遷移學習的範式轉變 63

第 4 章 預訓練語言模型基礎 64

41 標記化 64

411 記號 64

412 詞匯表 65

413 未登錄詞 65

414 標記化策略 66

415 編碼與解碼 67

42 編碼器-解碼器架構 68

421 編碼器-解碼器架構概念 68

422 隱層語義空間 69

423 通用性和模塊化 70

43 自監督學習 71

431 自監督學習的借口任務 71

432 CLM 73

44 RNN 74

441 RNN 基礎與工作原理 74

442 RNN 編碼器 76

443 RNN 解碼器 77

444 強制教學與計劃采樣 79

445 LSTM 與門控結構記憶 82

446 註意力機制 84

45 Transformer 與並行檢索 88

451 從循環依賴到並行計算 88

452 自註意力機制 90

453 位置編碼機制 91

454 多頭註意力機制 92

455 標準的 Transformer 層結構 93

456 自監督的預訓練範式 95

第 5 章 LLM 基礎 98

51 預訓練階段 98

511 縮放定律 98

512 數據 99

513 算力 102

514 參數規模 104

52 後訓練階段 108

521 分類頭微調 109

522 指令微調 110

523 環境價值體系對齊 112

524 RLHF 的滾雪球式自舉對齊 117

第 6 章 提示工程方法 122

61 上下文學習原理機制 122

611 測試時模型的生成行為控制問題 122

612 少樣本提示與新任務學習機制 123

613 零樣本提示的能力 125

62 RAG 的知識遷移機制 128

621 建立檢索模塊的“語義可比性”基礎 128

622 檢索模塊中的效率與精度權衡 130

623 面向生成質量的新排序器訓練範式 132

624 將外部知識註入模型上下文 134

63 AI 搜索 136

631 從信息檢索到任務執行的範式躍遷 136

632 結構化知識索引機制 137

633 工具環境中的檢索機制 139

634 用戶偏好環境中的召回機制 142

635 多通道融合機制 144

636 搜索型系統的演化趨勢:從檢索接口到語義代理 146

第 7 章 符號推理方法 150

71 狀態空間 150

711 狀態空間的構造 150

712 推理的本質 152

713 默認搜索機制的局限 154

72 路徑深度與推理能力 155

721 輸出長度作為“行動預算” 156

722 CoT 提示 157

73 自一致性機制 159

731 以路徑多樣性提升推理魯棒性 159

732 搜索策略的演進 161

74 ToT:構建顯式的結構化搜索範式 162

741 DFS 的結構性瓶頸 163

742 早期結構化嘗試 164

743 ToT 的核心 166

744 ToT 應用 167

75 語言作為控制器 169

751 顯式提示驅動 169

752 交互式引導 171

753 策略的內化 173

754 策略的湧現:超越模仿,邁向自組織的復雜搜索

行為 175

第 8 章 語言智能體的構建 178

81 工作記憶 178

811 將 LLM 的生成過程重新詮釋為策略函數 178

812 構建智能體的動態認知 180

813 ReAct 框架 183

82 長期記憶 186

821 ReAct 框架的局限與突破 186

822 長期記憶的運作機制 188

823 長期記憶的架構與流程 190

83 語言智能體的本質 192

831 先驗知識體系 192

832 環境交互機制 194

833 先驗與反饋的協同進化 196

第 9 章 智能體的認知架構 198

91 認知架構總覽 198

911 認知架構的核心設計原則 198

912 SOAR 認知架構 199

913 CoALA 202

92 情節記憶 204

921 在線層-近線層-離線層 3 層架構 205

922 在線寫入 206

923 近線處理 208

924 離線反思 209

925 在線檢索 211

93 程序記憶 212

931 認知過程的規則與調度 214

932 規則的固化與執行 215

933 程序記憶的整合與治理 217

94 行動規劃 218

941 行動策略的演進 218

942 規劃的生成 220

943 流水線架構 222

944 應用案例分析:博弈場景的“博弈樹”優化 223

95 交互協議 MCP 224

951 MCP 224

952 工具的使用模式 228

953 工具的動態生成 229

954 工具生態的治理 231

955 可信賴自主交互的頂層設計 233

最後瀏覽商品 (17)