深入大模型系統:提示工程、符號推理與智能體實踐
白鈺
- 出版商: 人民郵電
- 出版日期: 2025-12-01
- 定價: $479
- 售價: $478
- 語言: 簡體中文
- 頁數: 234
- ISBN: 7115687072
- ISBN-13: 9787115687074
-
相關分類:
Prompt Engineering
下單後立即進貨 (約4週~6週)
商品描述
本書從發展概述、核心技術原理與產業實踐的角度深入解析大模型系統。 全書共 9 章。第1章首先對大模型技術進行概述,系統梳理其概念、發展裏程碑及未來趨勢。第2章轉入產業視角,深入剖析競爭格局、商業策略與產業落地面臨的挑戰。第3~5章介紹大模型系統的技術實現,從監督學習、遷移學習等方法入手,逐步深入文本標記化、編碼器-解碼器架構與從 RNN/LSTM 到 Transformer 的革新,再介紹縮放定律、數據 / 算力/參數等預訓練要素,以及指令微調、基於人類反饋的強化學習對齊機制。第6~9章從產業實踐的角度解析應用層技術,包括上下文學習、檢索增強生成等提示工程方法,深入剖析以思維鏈為代表的符號推理,以及從工作記憶、長期記憶到認知架構的語言智能體體系的構建。 本書適合人工智能領域從業者、高校計算機相關專業師生,以及所有對大模型技術感興趣的人士閱讀。
作者簡介
白鈺,AI與雲計算技術專家,在多模態大模型算法及AI系統方面有豐富的知識儲備和實踐經驗。曾在Comcast、亞馬遜、阿裏雲等企業擔任AI算法負責人,帶領團隊開發多項服務億級用戶的AI系統,在多模態大模型研發和大規模機器學習系統落地方面積累了大量經驗;曾在NeurIPS、NSDI、S&P等頂級會議、期刊上發表多篇論文,擁有20余項專利,參與多項AI標準制定,現任中國中文信息學會大模型與生成專業委員會委員、中國計算機學會技術前沿委員會委員。
目錄大綱
1 章 大模型技術概述 1
11 大模型相關概念辨析 1
111 基礎模型 1
112 GenAI 模型 2
113 LLM 3
114 大模型 3
12 大模型技術發展歷程 4
121 技術發展的階段 4
122 技術發展的驅動力 7
123 當前挑戰與未來發展方向 8
13 大模型系統發展路徑 9
131 基礎語言理解與生成 9
132 工具賦能的增強智能 10
133 自主思考的深入探索 11
134 連接物理世界的具身智能 13
第 2 章 大模型產業發展概述 15
21 大模型產業發展回顧 15
211 Transformer 架構誕生 15
212 商業模式探索 16
213 ChatGPT 與生態競賽 16
214 “百家爭鳴”時代 17
22 商業化核心戰略 18
221 構建可持續的商業閉環 18
222 平民化 20
223 專業化 21
224 具身化 22
23 產業落地模式 23
231 場景創新 23
232 工具創新 24
233 方法創新 24
234 評估大模型帶來的創新價值 24
24 產業競爭格局與挑戰 25
241 領跑者的技術透明化挑戰 25
242 後發者的市場局限 25
243 創業公司的生存壓力 26
第 3 章 模型預訓練技術基礎 27
31 監督學習 27
311 監督學習的定義 27
312 監督學習的統計建模 28
313 監督學習的統計前提 29
314 監督學習中模型結構的選擇 31
315 監督學習中模型的泛化機制 32
316 案例分析:從實驗觀測數據發現牛頓第二定律 34
32 深度學習 36
321 層次結構與函數表達能力 36
322 網絡訓練機制 38
323 DNN 的過擬合風險與壓縮張力 41
324 DNN 壓縮機制 42
325 DNN 的結構化能力 45
33 表示學習 46
331 表示學習的基本思想 47
332 CNN 與層次化空間表示 49
333 殘差網絡 53
34 遷移學習 55
341 概念引入:從已見分布到未知分布 55
342 遷移學習的基本策略:凍結還是微調 56
343 ResNet 與 ImageNet 58
344 遷移學習的流程 59
345 實踐案例:ResNet-152羊駝五分類微調 61
346 遷移學習的範式轉變 63
第 4 章 預訓練語言模型基礎 64
41 標記化 64
411 記號 64
412 詞匯表 65
413 未登錄詞 65
414 標記化策略 66
415 編碼與解碼 67
42 編碼器-解碼器架構 68
421 編碼器-解碼器架構概念 68
422 隱層語義空間 69
423 通用性和模塊化 70
43 自監督學習 71
431 自監督學習的借口任務 71
432 CLM 73
44 RNN 74
441 RNN 基礎與工作原理 74
442 RNN 編碼器 76
443 RNN 解碼器 77
444 強制教學與計劃采樣 79
445 LSTM 與門控結構記憶 82
446 註意力機制 84
45 Transformer 與並行檢索 88
451 從循環依賴到並行計算 88
452 自註意力機制 90
453 位置編碼機制 91
454 多頭註意力機制 92
455 標準的 Transformer 層結構 93
456 自監督的預訓練範式 95
第 5 章 LLM 基礎 98
51 預訓練階段 98
511 縮放定律 98
512 數據 99
513 算力 102
514 參數規模 104
52 後訓練階段 108
521 分類頭微調 109
522 指令微調 110
523 環境價值體系對齊 112
524 RLHF 的滾雪球式自舉對齊 117
第 6 章 提示工程方法 122
61 上下文學習原理機制 122
611 測試時模型的生成行為控制問題 122
612 少樣本提示與新任務學習機制 123
613 零樣本提示的能力 125
62 RAG 的知識遷移機制 128
621 建立檢索模塊的“語義可比性”基礎 128
622 檢索模塊中的效率與精度權衡 130
623 面向生成質量的新排序器訓練範式 132
624 將外部知識註入模型上下文 134
63 AI 搜索 136
631 從信息檢索到任務執行的範式躍遷 136
632 結構化知識索引機制 137
633 工具環境中的檢索機制 139
634 用戶偏好環境中的召回機制 142
635 多通道融合機制 144
636 搜索型系統的演化趨勢:從檢索接口到語義代理 146
第 7 章 符號推理方法 150
71 狀態空間 150
711 狀態空間的構造 150
712 推理的本質 152
713 默認搜索機制的局限 154
72 路徑深度與推理能力 155
721 輸出長度作為“行動預算” 156
722 CoT 提示 157
73 自一致性機制 159
731 以路徑多樣性提升推理魯棒性 159
732 搜索策略的演進 161
74 ToT:構建顯式的結構化搜索範式 162
741 DFS 的結構性瓶頸 163
742 早期結構化嘗試 164
743 ToT 的核心 166
744 ToT 應用 167
75 語言作為控制器 169
751 顯式提示驅動 169
752 交互式引導 171
753 策略的內化 173
754 策略的湧現:超越模仿,邁向自組織的復雜搜索
行為 175
第 8 章 語言智能體的構建 178
81 工作記憶 178
811 將 LLM 的生成過程重新詮釋為策略函數 178
812 構建智能體的動態認知 180
813 ReAct 框架 183
82 長期記憶 186
821 ReAct 框架的局限與突破 186
822 長期記憶的運作機制 188
823 長期記憶的架構與流程 190
83 語言智能體的本質 192
831 先驗知識體系 192
832 環境交互機制 194
833 先驗與反饋的協同進化 196
第 9 章 智能體的認知架構 198
91 認知架構總覽 198
911 認知架構的核心設計原則 198
912 SOAR 認知架構 199
913 CoALA 202
92 情節記憶 204
921 在線層-近線層-離線層 3 層架構 205
922 在線寫入 206
923 近線處理 208
924 離線反思 209
925 在線檢索 211
93 程序記憶 212
931 認知過程的規則與調度 214
932 規則的固化與執行 215
933 程序記憶的整合與治理 217
94 行動規劃 218
941 行動策略的演進 218
942 規劃的生成 220
943 流水線架構 222
944 應用案例分析:博弈場景的“博弈樹”優化 223
95 交互協議 MCP 224
951 MCP 224
952 工具的使用模式 228
953 工具的動態生成 229
954 工具生態的治理 231
955 可信賴自主交互的頂層設計 233

