大語言模型:原理與工程實踐
楊青
- 出版商: 電子工業
- 出版日期: 2024-03-01
- 定價: $714
- 售價: 7.9 折 $564
- 語言: 簡體中文
- 頁數: 260
- ISBN: 7121473046
- ISBN-13: 9787121473043
-
相關分類:
Large language model
-
相關翻譯:
自己開發 ChatGPT - LLM 從頭開始動手實作 (繁中版)
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$509點雲庫 PCL 從入門到精通 -
$305Python Web 開發案例教程 — 使用 Flask、Tornado、Django (慕課版) -
$454金融AI算法:人工智能在金融領域的前沿應用指南 -
$512智能風控實踐指南:從模型、特徵到決策 -
擴散模型從原理到實戰$479$455 -
$760PyTorch 電腦視覺實戰:目標偵測、影像處理與深度學習 -
$510多模態大模型:技術原理與實戰 -
$473YOLO 目標檢測 -
AI 時代 Math 元年 : 用 Python 全精通矩陣及線性代數$1,280$1,011 -
Python 量化投資指南 — 基礎、數據與實戰$588$559 -
$536網絡安全等級保護安全設計技術要求(通用要求部分)應用指南 -
$422LangChain 實戰:從原型到生產,動手打造 LLM 應用 -
$408深度學習與神經網絡 -
GPT5 新時代 - 多模態深度學習精實操練$680$537 -
新範式來臨 - 用 PyTorch 了解 LLM 開發微調 ChatGLM 全過程$980$774 -
$464可解釋 AI 實戰 (PyTorch版) -
$305網絡安全與管理(微課視頻版) -
AI 神助攻!程式設計新境界 – GitHub Copilot 開發 Python 如虎添翼 : 提示工程、問題分解、測試案例、除錯$560$442 -
$360LangChain 簡明講義:從0到1建構 LLM 應用程式 -
$559大語言模型:基礎與前沿 -
新一代 Keras 3.x 重磅回歸:跨 TensorFlow 與 PyTorch 建構 Transformer、CNN、RNN、LSTM 深度學習模型$750$593 -
$602Power BI 數據可視化指南:讓數據鮮活與可定製的視覺設計 (Charticulator篇) -
$564多模態大模型:新一代人工智能技術範式 -
LLM 的瑞士刀 - 用 LangChain 極速開發可擴充大型應用程式$880$695 -
$512基於 Python 的金融分析與風險管理 (暢享版)(基礎捲)
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書用10章對大語言模型進行全面且深入的介紹。首先對大語言模型的基本概念進行介紹。其次,從大語言模型的基礎技術、預訓練數據構建、預訓練技術等方面展開討論,幫助讀者深入瞭解大語言模型的構建和訓練過程。然後,詳細介紹有監督微調和強化對齊等技術,以及如何評估大語言模型的性能。此外,介紹提示工程和工程實踐等方面的內容,幫助讀者瞭解大語言模型的應用和實際操作過程。最後,介紹如何從零開始微調大語言模型,輔以代碼示例,幫助讀者更好地應用這些技術。通過閱讀本書,讀者可以獲得全面且深入的大語言模型的知識框架。
目錄大綱
目 錄
1 解鎖大語言模型1
1.1 什麼是大語言模型·1
1.2 語言模型的發展·2
1.3 GPT 系列模型的發展·3
1.4 大語言模型的關鍵技術·4
1.5 大語言模型的湧現能力·5
1.6 大語言模型的推理能力·5
1.7 大語言模型的縮放定律·6
參考文獻·7
2 大語言模型基礎技術·8
2.1 語言表示介紹·8
2.1.1 詞表示技術·8
2.1.2 分詞技術·9
2.2 經典結構 Transformer·14
2.2.1 輸入模塊·15
2.2.2 多頭自註意力模塊·16
2.2.3 殘差連接與層歸一化·19
2.2.4 前饋神經網絡·19
2.2.5 解碼器·19
2.3 預訓練語言模型·21
2.3.1 Decoder 的代表:GPT 系列·21
2.3.2 Encoder 的代表:BERT·23
2.4 初探大語言模型·24
2.4.1 InstructGPT·24
2.4.2 LLaMA 系列·28
參考文獻·30
3 預訓練數據構建·32
3.1 數據的常見類別及其來源·32
3.1.1 網頁數據·33
3.1.2 書籍數據·34
3.1.3 百科數據·34
3.1.4 代碼數據·34
3.1.5 其他數據·36
3.2 數據的預處理方式·36
3.2.1 正文提取·37
3.2.2 質量過濾·37
3.2.3 文檔去重·38
3.2.4 數據集凈化·39
3.3 常用數據集的完整構建方式 ·40
3.3.1 C4·40
3.3.2 MassiveText·40
3.3.3 RefinedWeb·41
3.3.4 ROOTS·42
3.4 難點和挑戰·43
3.4.1 數據收集的局限性·43
3.4.2 數據質量評估的挑戰·43
3.4.3 自動生成數據的風險·44
參考文獻·44
4 大語言模型預訓練·46
4.1 大語言模型為什麼這麼強·46
4.2 大語言模型的核心模塊·49
4.2.1 核心架構·49
4.2.2 組成模塊選型·51
4.3 大語言模型怎麼訓練·60
4.3.1 訓練目標·60
4.3.2 數據配比·62
4.4 預訓練還有什麼沒有解決·65
參考文獻·66
5 挖掘大語言模型潛能:有監督微調·67
5.1 揭開有監督微調的面紗·67
5.1.1 什麼是有監督微調·67
5.1.2 有監督微調的作用與意義·68
5.1.3 有監督微調的應用場景·68
5.2 有監督微調數據的構建·69
5.2.1 有監督微調數據的格式·69
5.2.2 有監督微調數據的自動化構建·70
5.2.3 有監督微調數據的選擇·75
5.3 大語言模型的微調方法·76
5.3.1 全參數微調·76
5.3.2 適配器微調·76
5.3.3 前綴微調·77
5.3.4 提示微調·78
5.3.5 低秩適配·79
5.4 大語言模型的微調和推理策略·79
5.4.1 混合微調策略·80
5.4.2 基於上下文學習的推理策略·81
5.4.3 基於思維鏈的推理策略·82
5.5 大語言模型微調的挑戰和探索·83
5.5.1 大語言模型微調的幻覺問題·83
5.5.2 大語言模型微調面臨的挑戰·84
5.5.3 大語言模型微調的探索與展望 ·84
參考文獻·85
6 大語言模型強化對齊·87
6.1 強化學習基礎 ·87
6.1.1 強化學習的基本概念·87
6.1.2 強化學習中的隨機性·88
6.1.3 強化學習的目標·89
6.1.4 Q 函數與 V 函數·89
6.2 DQN 方法·91
6.2.1 DQN 的結構·91
6.2.2 DQN 訓練:基本思想·92
6.2.3 DQN 訓練:目標網絡·94
6.2.4 DQN 訓練:探索策略·94
6.2.5 DQN 訓練:經驗回放·95
6.2.6 DQN 訓練:完整算法·95
6.2.7 DQN 決策·96
6.3 策略梯度方法·96
6.3.1 策略網絡的結構·96
6.3.2 策略網絡訓練:策略梯度·97
6.3.3 策略網絡訓練:優勢函數·99
6.3.4 PPO 算法·100
6.4 揭秘大語言模型中的強化建模·101
6.4.1 Token-level 強化建模·101
6.4.2 Sentence-level 強化建模·102
6.5 獎勵模型·103
6.5.1 獎勵模型的結構·103
6.5.2 獎勵模型的訓練·104
6.5.3 獎勵模型損失函數分析·106
6.6 RLHF·108
6.6.1 即時獎勵·108
6.6.2 RLHF 算法·109
6.7 RLHF 實戰框架·111
6.8 RLHF 的難點和問題·111
6.8.1 數據瓶頸·112
6.8.2 硬件瓶頸·113
6.8.3 方法瓶頸·114
參考文獻·115
7 大語言模型的評測·117
7.1 基座語言模型的評測·117
7.1.1 主要的評測維度和基準概述·118
7.1.2 具體案例:LLaMA 2 選取的評測基準·118
7.2 大語言模型的對話能力評測·120
7.2.1 評測任務·120
7.2.2 評測集的構建標準·131
7.2.3 評測方式·132
7.3 大語言模型的安全性評測·132
7.3.1 評測任務·133
7.3.2 評測方式和標準·134
7.4 行業大語言模型的評測:以金融行業大語言模型為例·134
7.4.1 金融行業大語言模型的自動化評測集·135
7.4.2 金融行業大語言模型的人工評測集·136
7.5 整體能力的評測·137
7.6 主流評測數據集及基準·138
參考文獻·142
8 大語言模型的應用·143
8.1 大語言模型為什麼需要提示工程·143
8.1.1 人類和大語言模型進行復雜決策的對比·144
8.1.2 提示工程的作用·144
8.2 什麼是提示詞·145
8.2.1 提示詞的基礎要素·146
8.2.2 提示詞設計的通用原則·146
8.3 推理引導·147
8.3.1 零樣本提示·147
8.3.2 少樣本提示·148
8.3.3 思維鏈提示·149
8.3.4 自我一致性提示·150
8.3.5 思維樹提示·151
8.4 動態交互·155
8.4.1 檢索增強生成技術·155
8.4.2 推理和行動協同技術·159
8.5 案例分析·161
8.5.1 案例介紹·161
8.5.2 工具設計·161
8.5.3 提示詞設計·165
8.5.4 案例運行·167
8.6 局限和發展·172
8.6.1 目前的局限·172
8.6.2 未來的發展·173
參考文獻·173
9 工程實踐·175
9.1 大語言模型訓練面臨的挑戰·175
9.2 大語言模型訓練綜述·176
9.2.1 數據並行·176
9.2.2 模型並行·179
9.2.3 ZeRO 並行·181
9.3 大語言模型訓練技術選型技巧·184
9.4 大語言模型訓練優化秘籍·186
9.4.1 I/O 優化·186
9.4.2 通信優化·187
9.4.3 穩定性優化·190
9.5 大語言模型訓練工程實踐·190
9.5.1 DeepSpeed 架構·191
9.5.2 DeepSpeed 訓練詳解·191
9.5.3 DeepSpeed 訓練調優實踐·194
9.6 強化學習工程實踐·196
9.6.1 DeepSpeed-Chat 混合引擎架構·196
9.6.2 DeepSpeed-Chat 訓練詳解·197
9.6.3 DeepSpeed-Chat 訓練調優實踐·199
9.7 大語言模型推理工程·201
9.7.1 提升規模:模型量·202
9.7.2 提高並行度:張量並行·205
9.7.3 推理加速:算子優化·207
9.7.4 降低計算量:KV-Cache·208
9.7.5 推理工程綜合實踐·210
參考文獻·212
10 手把手教你訓練 7B 大語言模型·214
10.1 自動化訓練框架·214
10.1.1 自動化訓練框架介紹·214
10.1.2 主要模塊介紹·215
10.2 動手訓練 7B 大語言模型·237
10.2.1 語料預處理·238
10.2.2 預訓練實踐·240
10.2.3 指令微調實踐·245
10.3 小結·247
