大規模語言模型 (從理論到實踐第2版)
張奇 桂韜 鄭銳 黃萱菁
- 出版商: 電子工業
- 出版日期: 2025-04-01
- 售價: $828
- 貴賓價: 9.5 折 $787
- 語言: 簡體中文
- 頁數: 454
- ISBN: 7121500574
- ISBN-13: 9787121500572
-
相關分類:
Large language model
立即出貨
買這商品的人也買了...
-
機器學習模擬應用|將合成資料運用於AI (Practical Simulations for Machine Learning)$680$537 -
數據分析師手記 — 數據分析 72個核心問題精解$654$621 -
ChatGPT 指令大全與創新應用:GPT-4 搶先看、串接 API、客服機器人、AI英文家教,一鍵打造 AI智慧產品$680$530 -
$284ChatGPT 與 AIGC 生產力工具實踐智慧共生 -
$469概率機器學習 -
Notion 最強效應用:卡片盒筆記法 × GTD 時間管理 × 電子手帳 × 數位履歷 × Notion AI$499$394 -
$517製造業大模型的構建與實踐 -
工程師的思考法則:擁有科學邏輯的頭腦,像工程師一樣思考【暢銷經典版】$380$300 -
生成式 AI 賦能一本通 編程數據科學與專業寫作$588$559 -
$505大模型 RAG 應用開發:構建智能生成系統 -
生成式 AI 專案實踐指南:從模型挑選、上線、RAG 技術到 AI Agent 整合$650$507 -
$454用 Cursor 玩轉 AI 輔助編程 (不寫代碼也能做軟件開發) -
集成式機器學習算法理論與應用$594$564 -
$981機器學習從入門到入行:24個項目實踐 AI -
GitHub Copilot 讓你寫程式快 10 倍!AI 程式開發大解放$690$545 -
人人玩賺 AI 編程:從入門到變現一本通關 (Cursor + Claude)$474$450 -
AI Vision × LLM 電腦視覺應用聖經:OpenCV × YOLO × Ollama 解鎖多模態全攻略$880$695 -
生成式 AI x RAG x Hugging Face 提示工程打造數據採樣神技$980$774 -
$407人人皆可 Vibe 編程:玩轉氛圍編程 -
RAG × LangChain 整合應用:從問診機器人開始,打造可信任的 AI 系統 (iThome鐵人賽系列書)$600$468 -
$470零基礎 AI 編程:Cursor 助力 Vibe Coding 實踐 -
品質管制 (Gupta:Statistical Quality Control: Using Minitab, R, JMP, and Python)$650$637 -
$768智能供應鏈:數據科學理論與實戰 -
$365Vibe 編程:探索 AI 時代編程新範式 -
本地端 Ollama × LangChain × LangGraph × LangSmith 開發手冊:打造 RAG、Agent、SQL 應用$750$593
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
VIP 95折
深入淺出 SSD 測試 : 固態存儲測試流程 方法與工具$594$564 -
VIP 95折
MCP 開發從入門到實戰$515$489 -
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
VIP 95折
CUDA 並行編程與性能優化$714$678 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
VIP 95折
大模型驅動的具身智能 架構,設計與實現$534$507 -
VIP 95折
納米級CMOS VLSI電路(可制造性設計)$474$450 -
VIP 95折
Manus應用與AI Agent設計指南:從入門到精通$359$341 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
87折
$360芯片的較量 (日美半導體風雲) -
VIP 95折
Manus AI 智能體從入門到精通$294$279 -
87折
$981深度學習:基礎與概念 -
VIP 95折
GitHub Copilot 編程指南$594$564 -
79折
$425Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化 -
79折
$512C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
Verilog HDL計算機網絡典型電路算法設計與實現$354$336 -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
VIP 95折
CUDA 並行編程與性能優化$714$678 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
VIP 95折
大模型驅動的具身智能 架構,設計與實現$534$507 -
VIP 95折
納米級CMOS VLSI電路(可制造性設計)$474$450 -
VIP 95折
Manus應用與AI Agent設計指南:從入門到精通$359$341 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
87折
$360芯片的較量 (日美半導體風雲) -
VIP 95折
Manus AI 智能體從入門到精通$294$279 -
87折
$981深度學習:基礎與概念 -
VIP 95折
GitHub Copilot 編程指南$594$564 -
79折
$425Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化 -
79折
$512C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
Verilog HDL計算機網絡典型電路算法設計與實現$354$336 -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673 -
VIP 95折
深入淺出 Docker, 2/e$419$398 -
85折
$658Unity 特效制作:Shader Graph 案例精講
相關主題
商品描述
本書圍繞大語言模型構建的四個階段:預訓練、指令微調、獎勵建模和強化學習,詳述各階段所使用的算法、數據、難點及實踐經驗。在此基礎上,進一步探討了增強大語言模型能力、提升效率及如何將大語言模型落地應用的實踐經驗,涵蓋多模態、智能體等熱門方向,全面展現了大語言模型研究的最新進展。本書適合對深入研究大語言模型內在機制和實現方法感興趣的讀者閱讀,也可作為高年級本科生和研究生自然語言處理課程中相關部分的補充教材。
作者簡介
黃萱菁,覆旦大學計算機科學技術學院教授、博士生導師。主要從事自然語言處理、信息檢索和社會媒體分析研究。兼任中國中文信息學會常務理事、社會媒體專委會副主任,中國計算機學會自然語言處理專委會副主任、學術工作委員會委員、AACL執委。在高水平國際學術期刊和會議上發表了百餘篇論文,負責的多個科研項目受到國家自然科學基金、科技部、教育部、上海市科委的支持。入選2020年度人工智能全球女性、2020年度AI 2000人工智能全球最具影響力提名學者及福布斯中國2020科技女性榜。
目錄大綱
第1章 緒論
1.1 大語言模型的基本概念
1.2 大語言模型的發展歷程
1.3 大語言模型的構建流程
1.4 本書的內容安排
第2章 大語言模型基礎
2.1 Transformer結構
2.1.1 嵌入表示層
2.1.2 註意力層
2.1.3 前饋層
2.1.4 殘差連接與層歸一化
2.1.5 編碼器和解碼器結構
2.2 生成式預訓練語言模型GPT
2.2.1 自監督預訓練
2.2.2 有監督下遊任務微調
2.2.3 預訓練語言模型實踐
2.3 大語言模型的結構
2.3.1 LLaMA的模型結構
2.3.2 註意力機制優化
2.4 混合專家模型
2.4.1 稀疏混合專家模型
2.4.2 稠密混合專家模型
2.4.3 軟混合專家模型
2.5 實踐思考
第3章 大語言模型預訓練數據
3.1 數據來源
3.1.1 通用數據
3.1.2 領域數據
3.2 數據處理
3.2.1 質量過濾
3.2.2 冗餘去除
3.2.3 隱私消除
3.2.4 詞元切分
3.3 數據影響分析
3.3.1 數據規模
3.3.2 數據質量
3.3.3 數據多樣性
3.4 開源數據集
3.4.1 Pile
3.4.2 ROOTS
3.4.3 RefinedWeb
3.4.4 CulturaX
3.4.5 SlimPajama
3.5 實踐思考
第4章 分佈式訓練
4.1 分佈式訓練概述
4.2 分佈式訓練的並行策略
4.2.1 數據並行
4.2.2 模型並行
4.2.3 混合並行
4.2.4 計算設備內存優化
4.3 分佈式訓練的集群架構
4.3.1 高性能計算集群的典型硬件組成
4.3.2 參數服務器架構
4.3.3 去中心化架構
4.4 DeepSpeed實踐
4.4.1 基礎概念
4.4.2 LLaMA分佈式訓練實踐
4.5 實踐思考
第5章 指令微調
5.1 指令微調訓練
5.1.1 指令微調數據
5.1.2 指令微調數據構建方法
……
第6章 強化學習
第7章 多模態大語言模型
第8章 大模型智能體
第9章 檢索增強生成
第10章 大語言模型效率優化
第11章 大語言模型評估
第12章 大語言模型應用開發
參考文獻
索引
