大語言模型:技術實踐與場景應用
黃河燕 遲澤聞 柏宇
- 出版商: 電子工業
- 出版日期: 2026-01-01
- 售價: $528
- 語言: 簡體中文
- 頁數: 280
- ISBN: 7121516136
- ISBN-13: 9787121516139
-
相關分類:
Large language model
下單後立即進貨 (約4週~6週)
相關主題
商品描述
大語言模型作為人工 智能革命的核心驅動力, 正深刻重構自然語言處理 與多模態領域的技術範式 。本書系統構建了從理論 基石到產業實踐的全棧知 識體系,深入解析語言模 型演進脈絡與 Transformer核心架構, 剖析大規模訓練中的工程 挑戰與優化方案,闡釋跨 語言遷移能力的實現機制 ,並重點通過醫療、金融 、法律等領域的真實案例 ,揭示模型 化應用與 場景落地的完整路徑。全 書立足技術前沿,兼顧算 法深度與實踐創新,致力 為人工智能研究者、工程 師與技術決策者提供兼具 系統性與實用性的實踐指 南
目錄大綱
第1章 大語言模型概況
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 基本概念及問題描述
1.2.1 語言模型
1.2.2 Transformer架構
1.2.3 預訓練語言模型
1.2.4 僅編碼器架構
1.2.5 編碼器-解碼器架構
1.2.6 僅解碼器架構
1.2.7 微調與上下文學習
1.3 典型方法與代表性系統
1.3.1 統計語言模型
1.3.2 循環神經網絡語言模型
1.3.3 基於Transformer架構的語言模型
1.3.4 掩碼語言模型
1.3.5 自回歸語言模型
1.3.6 指令微調訓練
1.3.7 基於人類反饋的強化學習訓練
1.4 相關數據與評測指標
1.4.1 Pile數據集
1.4.2 ROOTS數據集
1.4.3 RedPajama和SlimPajama數據集
1.4.4 RefineWeb數據集
1.4.5 CLUECorpus數據集
1.4.6 WuDao數據集
1.4.7 性能評測
1.5 參考文獻
第2章 大語言模型的基礎理論
2.1 Transformer架構
2.2 詞表示
2.2.1 字節對編碼分詞
2.2.2 單字語言模型分詞
2.3 位置編碼
2.3.1 位置編碼
2.3.2 相對位置編碼
2.4 Transformer架構組成
2.4.1 編碼器與解碼器
2.4.2 多頭註意力機制
2.5 大語言模型訓練
2.6 語言模型應用
2.6.1 自然語言理解
2.6.2 上下文學習
2.6.3 多模態
2.6.4 智能體
2.7 參考文獻
第3章 大語言模型架構與訓練技術
3.1 大語言模型發展現狀
3.2 大語言模型架構
