大語言模型深度解析：架構、生態與場景實戰

劉學君、吳永豪主編馬楠、晏湧

出版商: 化學工業
出版日期: 2026-06-01
售價: $528
語言: 簡體中文
頁數: 202
ISBN: 712250008X
ISBN-13: 9787122500083
相關分類: Large language model

下單後立即進貨 (約4週~6週)

商品描述

本書是一部聚焦實戰、旨在打通大語言模型從核心原理到應用落地的全鏈路指南。全書在清晰講解Transformer架構等核心理論的基礎上，將重點放在如何有效應用大模型解決實際問題上。
本書不僅通過豐富的示例講解了提示工程、思維鏈與檢索增強生成（RAG）的核心應用範式,更通過詳盡的示例展示了如何實現API集成、工具調用、RAG系統構建、多模態API調用以及本地部署，清晰勾勒出一條完整的工程落地路徑。本書的一大亮點是深度剖析了百度大模型的完整工業案例，從數據標註到技能編排，真實還原了前沿技術在覆雜工業場景中的落地過程。
本書面向希望通過動手實踐深入理解LLM全貌的高校師生，可作為高等院校“人工智能”“自然語言處理”等課程的教材，尤其適合作為項目驅動式教學與工程實踐環節的核心參考；亦可供渴望將模型能力轉化為實際應用的AI工程師、開發者與產品經理等人群參考使用。

目錄大綱

第1章大語言模型概述 / 1
1.1 大語言模型的定義與演進 / 1
1.1.1 概念界定 / 1
1.1.2 規模的含義 / 2
1.1.3 演進歷程 / 4
1.2 大語言模型的關鍵特性 / 6
1.2.1 自監督學習 / 6
1.2.2 上下文理解 / 7
1.2.3 少樣本學習 / 8
1.2.4 湧現 / 9
1.3 大語言模型與傳統AI 模型的對比 / 11
1.3.1 設計理念與學習方式 / 11
1.3.2 核心能力與應用模式 / 12
1.3.3 特性對比與應用定位 / 13
1.4 中國大語言模型的發展現狀 / 14
本章小結 / 17

第2章 Transformer 核心架構 / 19
2.1 Transformer 誕生基礎 / 19
2.1.1 循環神經網絡的核心思想 / 19
2.1.2 長短期記憶網絡的改進 / 21
2.1.3 歷史的瓶頸 / 23
2.2 Transformer 的宏觀結構 / 23
2.2.1 編碼器層(encoder layer)結構 / 26
2.2.2 解碼器層(decoder layer)結構 / 27
2.3 Transformer 的關鍵模塊解析 / 29
2.3.1 輸入表示 / 29
2.3.2 多頭註意力機制 / 33
2.3.3 逐位置前饋網絡 / 37
2.3.4 殘差連接與層歸一化 / 38
2.3.5 Softmax和最終輸出 / 39
2.4 Transformer 的主流架構範式 / 40
2.4.1 編碼器架構 / 40
2.4.2 解碼器架構 / 41
2.4.3 編碼器-解碼器架構 / 43
本章小結 / 45

第3章 Transformer 架構的演進與擴展 / 46
3.1 Transformer 的技術改進 / 46
3.1.1 專家混合 / 46
3.1.2 稀疏註意力 / 49
3.1.3 註意力優化技術 / 52
3.2 Transformer 架構的多模態擴展 / 55
3.2.1 模態編碼與表征 / 55
3.2.2 模態對齊與高效橋接 / 57
3.2.3 深度融合與交互架構 / 58
3.2.4 多模態輸出 / 59
本章小結 / 62

第4章大語言模型的訓練 / 63
4.1 預訓練的原理與目標 / 63
4.1.1 自監督學習範式 / 63
4.1.2 主流預訓練任務 / 64
4.1.3 模型能力的規模定律 / 67
4.2 訓練數據的構建與處理 / 68
4.2.1 預訓練語料的構成 / 68
4.2.2 數據預處理流程 / 70
4.2.3 後訓練階段數據 / 73
4.3 硬件基礎設施 / 76
本章小結 / 77

第5章大語言模型的適配與優化 / 78
5.1 模型交互與高級提示 / 78
5.1.1 提示詞工程 / 78
5.1.2 思維鏈 / 80
5.2 基於模型的應用架構 / 82
5.2.1 檢索增強生成 / 82
5.2.2 多智能體系統 / 85
5.3 面向特定任務的模型微調 / 88
5.3.1 全量微調 / 88
5.3.2 參數高效微調 / 89
5.4 面向生產環境的模型優化 / 90
5.4.1 知識蒸餾 / 90
5.4.2 量化 / 91
5.4.3 剪枝 / 94
本章小結 / 95

第6章大語言模型的評估體系 / 97
6.1 性能與質量的關鍵評估維度 / 97
6.1.1 核心語言與推理能力 / 97
6.1.2 安全、倫理與對齊 / 98
6.1.3 用戶導向與交互質量 / 99
6.1.4 效率與可擴展性 / 100
6.2 主流評測基準與數據集 / 100
6.3 主流評估平臺解讀 / 102
6.4 當前評估體系的局限性 / 107
6.5 未來評估體系發展方向 / 108
本章小結 / 109

第7章大語言模型生態與開發實踐 / 110
7.1 模型生態與選型策略 / 110
7.1.1 閉源模型+API服務 / 110
7.1.2 開源模型+本地部署 / 111
7.1.3 開源模型+API服務 / 111
7.2 API 接口調用與應用集成 / 112
7.2.1 API範式與生態兼容性 / 113
7.2.2 DeepSeek API簡單使用 / 114
7.2.3 RAG應用：向量化與檢索增強 / 124
7.2.4 多模態API應用 / 131
7.3 開源模型本地部署 / 141
7.3.1 本地部署的挑戰與硬件考量 / 141
7.3.2 開源模型本地化部署：Ollama實踐 / 143
7.3.3 使用圖形化界面：Open WebUI / 145
本章小結 / 147

第8章百度大模型應用實踐與案例 / 149
8.1 百度大模型簡介 / 149
8.2 視覺大模型 / 151
8.2.1 目標檢測技術 / 151
8.2.2 視頻分析技術 / 155
8.2.3 視覺大模型關鍵技術 / 160
8.2.4 實訓案例——礦山運輸帶異物與人員入侵檢測 / 163
8.3 多模態信息抽取與對齊 / 167
8.3.1 多模態信息表示及融合 / 167
8.3.2 多模態信息抽取任務 / 170
8.3.3 多模態信息對齊 / 172
8.3.4 實訓案例——多模態數據標註及技能應用 / 174
8.4 大模型訓練與部署 / 178
8.4.1 模型訓練策略 / 179
8.4.2 核心訓練過程 / 182
8.4.3 模型部署與優化 / 185
8.4.4 實訓案例——電力場景工作人員安全排查—安全帽檢測 / 189
8.5 大模型的應用挑戰 / 193
8.5.1 模型規模與算力能耗巨大 / 193
8.5.2 模型自身帶來的問題 / 193
8.5.3 數據隱私安全與數據質量問題 / 194
8.6 大模型的發展趨勢 / 195