大語言模型

趙鑫李軍毅周昆唐天一文繼榮

出版商: 高等教育
出版日期: 2024-12-01
定價: $594
售價: 7.9 折 $469
語言: 簡體中文
頁數: 376
ISBN: 7040634961
ISBN-13: 9787040634969
相關分類: Large language model

立即出貨

買這商品的人也買了...

~~$520~~ $410

你所不知道的 JS｜導讀，型別與文法 (You Don't Know JS: Up & Going)
~~$680~~ $537

資訊架構學, 4/e (Information Architecture: For the Web and Beyond, 4/e)
~~$880~~ $836

作業研究, 10/e (Hillier: Introduction to Operations Research, 10/e)
~~$560~~ $299

金魚都能懂的 CSS 選取器：金魚都能懂了你還怕學不會嗎（iT邦幫忙鐵人賽系列書）
~~$1,000~~ $750

依賴注入：原理、實作與設計模式 (Dependency Injection: Principles, Practices, Patterns, 2/e)
~~$1,000~~ $790

Java 最強入門邁向頂尖高手之路：王者歸來, 2/e (全彩版)
~~$420~~ $331

Python 零基礎入門班, 2/e (含 MTA Python 國際認證模擬試題)
~~$580~~ $493

攝影師之眼：數位攝影的思考、設計和構圖 (10週年數位修復珍藏版) (The Photographer’s Eye: Composition and Design for Better Digital Photos)
~~$680~~ $530

編寫程式的邏輯：如何用物件導向實作複雜的業務需求
~~$780~~ $616

最新世代平行運算 ─ 分散式系統主流框架實作指南
~~$680~~ $612

SolidWorks 2022 基礎範例應用
~~$400~~ $300

ChatGPT 提問課，做個懂 AI 的高效工作者
~~$1,080~~ $853

LLM 原理完整回顧 - 大型語言模型整體脈絡最詳細剖析
$Oracle PL\SQL 實例精解 (原書第6版)-cover$
~~$774~~ $735

Oracle PL\SQL 實例精解 (原書第6版)
~~$360~~ $306

重點整理、快速複習！國中資優理科王一本制霸
$407

C# 程序設計 : AIGC 高效編程 (慕課版第3版)
~~$1,080~~ $853

完整複習 NLP - 圍繞 LLM 打造自然語言處理應用
~~$474~~ $450

高效代碼：軟件編程實踐原則
~~$520~~ $494

公職考試 2026 試題大補帖【計算機概要】(110~114年試題)(測驗題型)[適用四等/關務、普考、地方特考]
~~$420~~ $331

顧客至上 2.0：從實體革命到數位戰場，打造品牌忠誠度的六大黃金法則
~~$500~~ $395

為什麼主管每天都在救火？：MIT麻省理工教授原創、亞當．格蘭特力薦，5大原則重新設計工作流程，打造不瞎忙的高效團隊
~~$400~~ $380

國營事業 2026 試題大補帖經濟部新進職員【儀電類】專業科目(109~114年試題)[適用台電、中油、台水考試]
~~$440~~ $418

國營事業 2026 試題大補帖經濟部新進職員【電機類】專業科目(109~114年試題)[適用台電、中油、台水、台糖考試]
~~$880~~ $695

ChatGPT 原理，從 PyTorch 中的 NLP 功能讓你一腳跨入自然語言 (好評熱銷版)
~~$800~~ $632

職安一點通｜職業衛生管理甲級檢定完勝攻略｜2026版

商品描述

本書展現了大語言模型技術的整體框架和路線圖，內容講解力求簡明、準確、實用，主要目的在於為相關行業或研究領域提供大模型技術的中文參考資料，推動我國相關人工智能技術的發展。全書共13章，內容涉及大模型的背景和基礎知識、資源、預訓練、微調與對齊、大模型使用以及模型評測等，同時還提供了相關的代碼示例與實驗工具包。本書可供具有深度學習基礎的讀者閱讀與使用，既可作為高等學校人工智能、大數據、計算機類等專業教材，也可作為相關研究與從業人員的參考用書。

作者簡介

文繼榮，中國人民大學信息學院院長、高瓴人工智能學院執行院長，國家特聘專家。長期從事人工智能和大數據領域的研究工作，研究方向包括信息檢索、數據挖掘、機器學習、大模型等。擔任中國人民政治協商會議北京市第十四屆委員會常務委員、中央統戰部黨外知識分子建言獻策專家組成員、第八屆教育部科學技術委員會委員、中國計算機學會常務理事等。曾任微軟亞洲研究院高級研究員和因特網搜索與挖掘組主任。

目錄大綱

第一部分背景與基礎知識
第1章引言
1.1 語言模型的發展歷程
1.2 大語言模型的能力特點
1.3 大語言模型關鍵技術概覽
1.4 大語言模型對科技發展的影響
1.5 本書的內容組織
第2章基礎介紹
2.1 大語言模型的構建過程
2.1.1 大規模預訓練
2.1.2 指令微調與人類對齊
2.2 擴展定律
2.2.1 KM擴展定律
2.2.2 Chinchilla擴展定律
2.2.3 關於擴展定律的討論
2.3 湧現能力
2.3.1 代表性的湧現能力
2.3.2 湧現能力與擴展定律的關系
2.4 GPT系列模型的技術演變
2.4.1 早期探索
2.4.2 規模擴展
2.4.3 能力增強
2.4.4 性能躍升
第3章大語言模型資源
3.1 公開可用的模型檢查點
3.1.1 公開可用的通用大語言模型檢查點
3.1.2 LLaMA變體系列
3.2 常用的預訓練數據集
3.2.1 網頁
3.2.2 書籍與論文
3.2.3 維基百科
3.2.4 代碼
3.2.5 混合型數據集
3.3 常用的微調數據集
3.3.1 指令微調數據集
3.3.2 人類對齊數據集
3.4 代碼庫資源
3.4.1 Hugging Face開源社區
3.4.2 DeepSpeed
3.4.3 Megatron-LM
3.4.4 本書配套資源說明
第二部分預訓練
第4章數據準備
4.1 數據來源
4.1.1 通用文本數據
4.1.2 專用文本數據
4.2 數據預處理
4.2.1 質量過濾
4.2.2 敏感內容過濾
4.2.3 數據去重
4.2.4 數據對預訓練效果的影響
4.2.5 數據預處理實踐
4.3 詞元化(分詞)
4.3.1 BPE分詞
4.3.2 WordPiece分詞
……
第三部分微調與對齊
第四部分使用與評測
參考文獻