大模型導論
張成文
- 出版商: 人民郵電
- 出版日期: 2024-07-01
- 定價: $419
- 售價: 8.5 折 $356
- 語言: 簡體中文
- 頁數: 262
- 裝訂: 平裝
- ISBN: 7115637989
- ISBN-13: 9787115637987
-
相關分類:
Large language model
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
輕鬆學量子程式設計|從量子位元到量子演算法$520$411 -
量子科技入門$420$378 -
$458深度學習與醫學圖像處理 -
零基礎學會 Python 程式交易:一本讀懂 Python 實作金融資產配置$600$468 -
機器學習圖解$768$730 -
$611數據科學:基本概念、技術及應用 -
$250矩陣論及其應用 -
$305算法設計與實踐 -
$283大模型入門:技術原理與實戰應用 -
$662深度學習高手筆記 捲2:經典應用 -
$352Linux實戰——從入門到精通 -
$505電網可靠度評估—模型與方法 -
$469推薦系統全連結設計:原始理解與業務實踐 -
$454矽谷 Python 工程師面試指南:資料結構、演算法與系統設計 -
$611數據驅動的進化優化 -
$356量子機器學習理論與實戰 -
$611大數據演算法 -
$469AIGC 大語言模型輕鬆學: 從個人應用到企業實踐 -
$473基於機器學習的個性化推薦算法及應用 -
多模態大模型:算法、應用與微調$714$678 -
LLM 大型語言模型的絕世祕笈:27路獨步劍法,帶你闖蕩生成式 AI 的五湖四海 (iThome鐵人賽系列書)$650$507 -
$505我在矽谷管芯片:芯片設計公司運營之道 -
集成學習實戰$768$730 -
$469基於深度學習的圖像處理與實踐 -
精確掌握 AI 大趨勢!深度學習技術解密:日本 AI 神人,帶你正確學會從機器學習到生成式 AI 的核心基礎$630$498
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書主要介紹了大模型的發展與演變、相關技術、應用場景、未來發展趨勢和前景。本書首先回顧了大模型技術的起源和發展歷程,然後介紹了數據預處理、Transformer、預訓練與微調、模型推理和PyTorch框架等技術。此外,本書還通過具體的案例和實踐展示瞭如何應用大模型技術來解決實際問題。本書旨在幫助讀者全面瞭解大模型技術的發展與應用,並推動其在各個領域的應用和發展。
本書圖文並茂,理論翔實,案例豐富,適合從事大模型開發的科研人員以及廣大的開發者作為技術參考和培訓資料,亦可作為高校本科生和研究生的教材。
作者簡介
張成文,博士,北京郵電大學副教授、碩士生導師。中國人工智能學會高級會員,任中國電子商會大模型應用產業專委會秘書長、中國人工智能產業發展聯盟產學研工作組副組長,中國醫學裝備協會人工智能和醫用機器人工作委員會常委、中國教育發展戰略學會人工智能與機器人專委會理事等。他在網絡技術專業領域有著深入的研究,並且完成了國家科技重大專項、國家重點研發計劃、國家自然科學基金等項目。專業方向包括人工智能、大數據個性化推薦、雲計算、電腦視覺等。他在國內外一流期刊上發表了多篇高水平論文,並出版了多本教材和專著。
目錄大綱
第 1章 大模型概述 1
1.1 大模型介紹 2
1.1.1 生成原理 4
1.1.2 關鍵技術 5
1.1.3 關鍵術語 10
1.2 大模型分類 11
1.2.1 按模型結構劃分 12
1.2.2 按模態劃分 12
1.2.3 按微調方式劃分 13
1.2.4 帶插件系統的大模型 13
1.3 大模型的開發流程 13
1.3.1 確定項目目標 14
1.3.2 數據準備 15
1.3.3 模型設計 16
1.3.4 模型訓練 16
1.3.5 模型部署 17
1.3.6 模型應用 17
1.4 應用場景 18
1.5 未來發展方向 20
1.5.1 AI智能體 20
1.5.2 具身智能 21
1.6 小結 22
1.7 課後習題 22
第 2章 數據預處理 23
2.1 文本數據預處理 23
2.1.1 構造方法 24
2.1.2 構造流程 26
2.1.3 處理手段 28
2.1.4 常用類庫 37
2.2 圖像數據預處理 47
2.2.1 圖像去噪 48
2.2.2 圖像重採樣 52
2.2.3 圖像增強 53
2.3 圖文對數據預處理 56
2.4 Datasets庫 58
2.4.1 安裝與配置 58
2.4.2 使用方法 58
2.5 小結 63
2.6 課後習題 64
第3章 Transformer 65
3.1 註意力機制 65
3.1.1 自註意力機制 66
3.1.2 多頭自註意力機制 68
3.2 Transformer簡介 70
3.2.1 位置編碼 70
3.2.2 整體結構 71
3.2.3 稀疏Transformer 72
3.3 Visual Transformer簡介 73
3.3.1 模型結構 74
3.3.2 與Transformer對比 75
3.4 Q-Former 75
3.5 transformers庫 77
3.5.1 基本組成 77
3.5.2 使用方法 78
3.5.3 微調實踐 83
3.6 小結 85
3.7 課後習題 86
第4章 預訓練 87
4.1 預訓練介紹 87
4.1.1 發展歷程 88
4.1.2 模型類型 88
4.1.3 掩碼預訓練 89
4.2 預訓練任務 89
4.3 應用於下遊任務的方法 91
4.3.1 遷移學習 91
4.3.2 微調 91
4.4 預訓練模型的應用 92
4.5 小結 93
4.6 課後習題 93
第5章 訓練優化 94
5.1 模型訓練挑戰 94
5.2 訓練優化技術 95
5.2.1 數據並行 95
5.2.2 模型並行 97
5.2.3 流水線並行 98
5.2.4 混合精度訓練 99
5.3 訓練加速工具 100
5.3.1 DeepSpeed 100
5.3.2 Megatron-LM 103
5.3.3 Colossal-AI 104
5.3.4 BMTrain 104
5.4 小結 107
5.5 課後習題 108
第6章 模型微調 109
6.1 監督微調 110
6.2 PEFT技術 110
6.2.1 Adapter tuning 111
6.2.2 Prefix tuning 111
6.2.3 Prompt tuning 112
6.2.4 P-tuning v1 113
6.2.5 P-tuning v2 114
6.2.6 LoRA 114
6.2.7 QLoRA 115
6.3 PEFT庫 116
6.3.1 關鍵步驟 117
6.3.2 微調方法 118
6.4 小結 124
6.5 課後習題 124
第7章 模型推理 125
7.1 模型壓縮和加速技術 125
7.1.1 模型量化 126
7.1.2 知識蒸餾 127
7.1.3 模型剪枝 130
7.1.4 稀疏激活 132
7.2 推理服務提升技術 133
7.2.1 KV Cache 134
7.2.2 PagedAttention 134
7.3 小結 136
7.4 課後習題 136
第8章 PyTorch框架 137
8.1 安裝與配置 137
8.2 基礎組件 138
8.2.1 張量 138
8.2.2 CUDA張量 142
8.2.3 Autograd 144
8.2.4 DataLoader 146
8.3 構建線性回歸模型 148
8.4 構建Transformer模型 151
8.4.1 數據準備與參數設置 151
8.4.2 位置編碼 153
8.4.3 掩碼操作 154
8.4.4 註意力計算 154
8.4.5 前饋神經網絡 155
8.4.6 編碼器與解碼器 155
8.4.7 構建Transformer 157
8.4.8 模型訓練 157
8.4.9 模型測試 158
8.5 小結 158
8.6 課後習題 159
第9章 向量數據庫 160
9.1 Milvus 160
9.1.1 安裝與配置 161
9.1.2 Milvus 1.0的基本操作 162
9.1.3 Milvus 2.0的基本操作 163
9.2 Pinecone 166
9.2.1 註冊與配置 166
9.2.2 基本操作 166
9.3 Chroma 168
9.3.1 安裝與配置 168
9.3.2 基本操作 168
9.4 小結 170
9.5 課後習題 170
第 10章 前端可視化工具 171
10.1 Gradio 171
10.1.1 Gradio安裝 172
10.1.2 常用操作 172
10.1.3 Interface使用詳解 175
10.1.4 Blocks使用詳解 176
10.2 Streamlit 178
10.2.1 安裝與配置 178
10.2.2 數據展示API 180
10.2.3 控件API 182
10.2.4 頁面佈局API 184
10.2.5 狀態存儲 185
10.3 小結 185
10.4 課後習題 186
第 11章 LangChain 187
11.1 LangChain組件 187
11.1.1 Models 188
11.1.2 Prompts 188
11.1.3 Indexes 190
11.1.4 Memory 190
11.1.5 Chains 194
11.1.6 Agents 196
11.2 基礎操作 199
11.2.1 Prompts的用法 200
11.2.2 Chains的用法 201
11.2.3 Agents的用法 202
11.2.4 Memory的用法 204
11.3 進階實戰 205
11.3.1 對話式檢索問答 205
11.3.2 長短文本總結 207
11.3.3 結合向量數據庫實現問答 209
11.4 基於私域數據的問答系統 211
11.4.1 環境準備 212
11.4.2 模型測試 213
11.4.3 構建提示詞模板 213
11.4.4 生成詞向量 214
11.4.5 創建向量數據庫 216
11.4.6 構建問答系統 217
11.5 小結 219
11.6 課後習題 219
第 12章 常用開源模型的部署與微調 220
12.1 ChatGLM3模型部署與微調 220
12.1.1 環境準備 220
12.1.2 加載模型 222
12.1.3 數據準備 224
12.1.4 定義模型 228
12.1.5 模型訓練 230
12.1.6 保存模型 232
12.1.7 模型評估 232
12.2 Baichuan2模型部署與微調 233
12.2.1 環境準備 233
12.2.2 加載模型 234
12.2.3 數據準備 238
12.2.4 定義模型 241
12.2.5 模型訓練 242
12.2.6 保存模型 244
12.2.7 模型評估 245
12.3 LLaMA2模型部署與微調 247
12.3.1 模型使用申請 248
12.3.2 環境準備 248
12.3.3 加載模型 249
12.3.4 數據準備 250
12.3.5 模型訓練 251
12.3.6 保存模型 254
12.3.7 模型評估 255
12.4 小結 256
12.5 課後習題 256
參考文獻 257


