大語言模型基礎教程
張永濤 李璟
- 出版商: 清華大學
- 出版日期: 2025-12-01
- 售價: $359
- 語言: 簡體中文
- ISBN: 730270502X
- ISBN-13: 9787302705024
-
相關分類:
Large language model
下單後立即進貨 (約4週~6週)
相關主題
商品描述
作者簡介
目錄大綱
基 礎 篇
第1章 大語言模型的起源與發展 2
1.1 從自然語言處理到大語言模型 2
1.1.1 自然語言處理的基本概念 2
1.1.2 早期自然語言處理方法與技術 3
1.1.3 興起的大語言模型:革新與潛力 5
1.2 重要的裏程碑與發展階段 7
1.2.1 Word2Vec和GloVe:向量化的起點 7
1.2.2 從RNN到LSTM:序列模型的演進 11
1.2.3 Transformer和BERT:自註意力機制的崛起 14
1.2.4 GPT系列:大規模預訓練模型的突破 15
1.3 大語言模型的未來展望 18
1.3.1 從GPT—4到GPT—N:未來可能的發展 18
1.3.2 國內大語言模型的發展 21
1.3.3 多模態和跨語言的挑戰 23
1.3.4 對可解釋性、公平性和安全性的追求 25
第2章 大語言模型的核心原理與技術 27
2.1 深度學習與神經網絡 27
2.1.1 深度學習的基本原理 27
2.1.2 神經網絡的組成與工作方式 29
2.1.3 神經網絡的類型和適用場景 32
2.1.4 深度學習在大語言模型中的應用 34
2.2 詞向量與語義表示 36
2.2.1 詞向量 36
2.2.2 主要的詞向量模型 37
2.2.3 詞向量的實際應用場景 40
2.2.4 語義表示 42
2.3 Transformer與自註意力機制 45
2.3.1 Transformer的原理和架構 45
2.3.2 自註意力機制的理論和實踐 46
2.3.3 Transformer在大語言模型中的應用 49
第3章 訓練大語言模型的挑戰與解決方案 53
3.1 數據收集與處理 53
3.1.1 數據的來源和類型 53
3.1.2 數據清洗和預處理 55
3.1.3 數據質量對大語言模型訓練的影響 56
3.1.4 數據標註和增強 56
3.2 模型訓練與優化 59
3.2.1 訓練策略和技巧 59
3.2.2 優化算法的選擇和應用 61
3.2.3 模型優化的挑戰和解決方案 65
3.2.4 模型優化的前景與機遇 67
3.3 能源消耗與環境影響 68
3.3.1 訓練大語言模型的能源需求:挑戰與現實 68
3.3.2 對環境的潛在影響:碳排放與環保責任 68
3.3.3 低能耗訓練策略和技術:解決方案與展望 68
3.3.4 總結與前景展望 68
3.4 大語言模型在實時應用中的性能與響應優化 69
3.4.1 實時應用的需求分析 69
3.4.2 性能優化的核心技術 70
3.4.3 實時應用案例分析 73
3.4.4 技術方案的實施與未來前景 74
應 用 篇
第4章 大語言模型在各領域的應用 78
4.1 自然語言處理與機器翻譯 78
4.1.1 大語言模型在自然語言處理中的應用 78
4.1.2 大語言模型在機器翻譯中的應用 79
4.1.3 未來的挑戰 80
4.2 智能問答系統與聊天機器人 81
4.2.1 大語言模型在智能問答系統中的應用 81
4.2.2 大語言模型在聊天機器人中的應用 83
4.2.3 未來的機遇和挑戰 85
4.3 文本生成與創作輔助 86
4.3.1 大語言模型在文本生成中的應用 86
4.3.2 大語言模型在創作輔助中的應用 89
4.3.3 未來的機遇和挑戰 91
4.4 醫療與生命科學 93
4.4.1 大語言模型在醫學文獻解析中的應用 93
4.4.2 大語言模型在疾病診斷和提供治療建議中的應用 95
4.4.3 未來的機遇和挑戰 97
4.5 法律與合規 99
4.5.1 大語言模型在法律文本分析與合同審核中的應用 99
4.5.2 大語言模型在法律問答與合規性審核中的應用 101
4.5.3 未來的機遇和挑戰 102
4.6 教育與智能輔導 104
4.6.1 大語言模型在個性化學習與教材生成中的應用 104
4.6.2 大語言模型在自動化測評與輔導系統中的應用 105
4.6.3 未來的機遇和挑戰 107
4.7 金融分析與金融風險管理 109
4.7.1 大語言模型在金融文本解析與市場分析中的應用 109
4.7.2 大語言模型在風險管理與合規自動化中的應用 110
4.7.3 未來的機遇和挑戰 111
4.8 內容審核與輿情監控 113
4.8.1 大語言模型在社交媒體內容審核中的應用 113
4.8.2 大語言模型在輿情監控與虛假信息檢測中的應用 114
4.8.3 未來的機遇和挑戰 115
4.9 用戶體驗與交互設計 117
4.9.1 用戶體驗設計原則 117
4.9.2 交互設計的挑戰 118
4.9.3 改善用戶體驗的技術 119
4.9.4 用戶案例與設計實例 120
第5章 Prompt的使用與優化 122
5.1 Prompt工程的基本概念 122
5.1.1 Prompt的定義與作用 122
5.1.2 Prompt工程的發展與應用場景 123
5.2 Prompt設計與構建原則 124
5.2.1 簡潔明了的Prompt設計 124
5.2.2 問題與指令的具體性 124
5.2.3 避免歧義的技巧 124
5.2.4 引導模型回答的技巧 125
5.3 Prompt優化技術 125
5.3.1 Few-shot Prompting與Zero-shot Prompting 125
5.3.2 思維鏈 126
5.3.3 分層提示 127
5.3.4 多步交互與反饋疊代 128
5.4 特殊場景下的Prompt應用 129
5.4.1 用於數據抽取的Prompt設計 129
5.4.2 情感分析與文本分類中的Prompt 130
5.4.3 代碼生成與編程輔助 131
5.4.4 偏見控制與公平性優化 131
5.5 Prompt優化的實際案例分析 132
5.5.1 交互式Prompt優化案例 132
5.5.2 不同Prompt方法對生成結果的影響 133
5.6 Prompt工程的未來趨勢與前景 134
5.6.1 Prompt的自動化生成與優化 135
5.6.2 Prompt與多模態任務的結合 135
5.6.3 Prompt優化的支持工具與平臺 136
5.6.4 Prompt工程的前景與挑戰 136
第6章 大語言模型對社會與倫理的影響 138
6.1 AI對就業與經濟的影響 138
6.1.1 AI對就業市場的影響 138
6.1.2 AI在經濟發展中的角色 142
6.2 隱私與安全問題 145
6.2.1 AI和隱私的關系 145
6.2.2 大語言模型在數據安全中的角色 146
6.2.3 針對隱私和安全的策略和技術 148
6.3 倫理與道德挑戰 150
6.3.1 AI倫理的關鍵問題 150
6.3.2 大語言模型面臨的AI倫理和道德挑戰 152
6.3.3 解決倫理和道德挑戰的路徑 155
前 沿 篇
第7章 大語言模型的多模態融合 160
7.1 視覺與語言的融合:從理論到實踐 160
7.1.1 多模態學習的理論基礎 160
7.1.2 視覺和語言融合的應用案例 163
7.1.3 視覺和語言融合的未來趨勢 166
7.2 語音識別與語音合成 170
7.2.1 語音識別的技術原理和應用 170
7.2.2 語音合成的技術和應用 172
7.2.3 大語言模型在語音識別和語音合成中的作用 174
7.3 跨模態信息處理 175
7.3.1 跨模態學習的理論基礎 175
7.3.2 跨模態信息處理的應用案例 177
7.3.3 跨模態信息處理的未來趨勢 181
7.4 大語言模型與強化學習的結合 185
7.4.1 強化學習與大語言模型的結合優勢 185
7.4.2 應用案例 186
7.4.3 挑戰與前景 187
第8章 大語言模型的可解釋性與透明性 190
8.1 模型可解釋性的重要性 190
8.1.1 可解釋性的定義和重要性 190
8.1.2 大語言模型的可解釋性挑戰 191
8.1.3 提升大語言模型可解釋性的策略和方法 192
8.2 可解釋性方法與技術 196
8.2.1 常見的模型解釋技術 196
8.2.2 大語言模型的特殊解釋需求 198
8.2.3 解釋大語言模型的新技術和方法 201
8.3 提高模型透明性的挑戰與前景 204
8.3.1 模型透明性的定義和重要性 204
8.3.2 提高大語言模型透明性的挑戰 209
8.3.3 提高大語言模型透明性的策略和方法 215
8.4 大語言模型在監管合規中的可解釋性 217
8.4.1 金融合規 217
8.4.2 數據保護合規 218
8.5 行業應用中的大語言模型透明性需求與實例分析 220
8.5.1 透明性在金融業中的實例應用 220
8.5.2 醫療和公共政策中的透明性需求 221
第9章 大語言模型的安全性與魯棒性 223
9.1 對抗性攻擊與防禦 223
9.1.1 對抗性攻擊的基本概念 223
9.1.2 對抗性攻擊類型 224
9.1.3 對抗性防禦策略和技術 227
9.2 大語言模型異常檢測與過濾 230
9.2.1 大語言模型異常檢測的理論基礎 230
9.2.2 大語言模型在異常檢測和過濾中的作用 231
9.2.3 大語言模型異常檢測與過濾的未來發展 233
9.3 提升模型魯棒性的方法與技術 236
9.3.1 魯棒性的定義和重要性 236
9.3.2 提升大語言模型魯棒性的主要方法 237
9.3.3 魯棒性提升的挑戰和前景 240
第10章 未來的大語言模型發展趨勢 243
10.1 超大規模模型與算法優化 243
10.1.1 超大規模模型的優點和挑戰 243
10.1.2 算法優化的重要性和方法 245
10.1.3 面向未來的模型和算法發展 249
10.2 新型架構與技術的探索 253
10.2.1 當前流行的模型架構和技術 253
10.2.2 新型架構和技術的探索和實踐 256
10.2.3 新型架構和技術的發展前景 261
10.3 開放研究與全球合作 264
10.3.1 開放研究的重要性和挑戰 264
10.3.2 全球AI合作的現狀和重要性 266
10.3.3 推動開放研究和全球合作的策略和途徑 268
參考文獻 271







