大語言模型
趙鑫 李軍毅 周昆 唐天一 文繼榮
- 出版商: 高等教育
- 出版日期: 2024-12-01
- 定價: $594
- 售價: 7.9 折 $469
- 語言: 簡體中文
- 頁數: 376
- ISBN: 7040634961
- ISBN-13: 9787040634969
-
相關分類:
Large language model
立即出貨
買這商品的人也買了...
-
$1,359機器學習 : 貝葉斯和優化方法 (英文版)(Machine Learning: A Bayesian and Optimization Perspective) -
神經網絡設計 (Neural Network Design, 2/e)$594$564 -
機器學習:貝葉斯和優化方法, 2/e (Machine Learning : A Bayesian and Optimization Perspective, 2/e)$1,674$1,590 -
FLAG'S 創客‧自造者工作坊 -- 用 ESP32 × Arduino IDE 學 AI 機器 學習$1,599$1,359 -
LLM 走進你的電腦 - 自己動手開發大型語言模型應用$880$695 -
$356大模型導論 -
深度學習精粹與 PyTorch 實踐$1,368$1,299 -
$422大模型定製開發 -- 行業應用與解決方案 -
多 Agent 智慧體 - LangChain 大型 ReAct 系統開發$880$695 -
金融與財務機器學習$534$507 -
為你自己學 Python$600$474 -
$708基於大模型的 RAG 應用開發與優化 — 構建企業級 LLM 應用 -
$2,457Prompt Engineering for LLMs: The Art and Science of Building Large Language Model-Based Applications (Paperback) -
$505大模型 RAG 實戰:RAG 原理、應用與系統構建 -
開源閉源 LLM 應用 - 從微調到 RAG、Agent 完整開發實作$880$695 -
$469大模型 RAG 應用開發:構建智能生成系統 -
$560圖解算法和數據結構 -
無料 AI:ChatGPT + DeepSeek + Gemini + Perplexity + Copilot + Claude + NotebookLM + Coze + Felo + Dzine + ElevenLabs + Suno + Stable Audio + Runway + Sora + Gamma –「文字、筆記、搜尋、繪圖、動漫、視覺、語音、音效、音樂、影片、簡報」AI Agent – 創意無限$690$545 -
使用者體驗法則 |運用心理學原則設計更好的產品與服務, 2/e (Laws of UX: Using Psychology to Design Better Products & Services, 2/e)$580$458 -
自然語言處理:大模型理論與實踐$414$393 -
$1,306強化學習與隨機優化:序貫決策的通用框架
LLM 大語言模型 詳見活動內容 »
-
78折
零基礎玩轉 LLM 應用全攻略:Python × No-Code 實作 AI 開發超簡單(iThome鐵人賽系列書)$690$538 -
79折
大型語言模型應用實戰:從 Prompt Engineering 到 Agentic RAG 與 MCP$790$624 -
78折
大模型時代:從 ChatGPT 一枝獨秀到全面開戰的 AI 賽局$500$390 -
79折
業界實戰親授 - 大型語言模型微調、最佳化、佈署一次到位$980$774 -
79折
深度學習最佳入門與專題實戰:自然語言處理、大型語言模型與強化學習篇$880$695 -
79折
AIGC 大型語言模型 - 個人應用到企業實戰立刻上手$780$616 -
79折
讓 LLM 飛起來的工具使用 - AI Agent MCP 協議開發、標準、應用$790$624 -
79折
AI Agent 手刻首選 - 使用 LangChain 親手實作 LLM 大型商業專案$880$695 -
79折
LLMOps 打造穩定運行的大型語言模型系統 (LLMOps: Managing Large Language Models in Production)$620$489 -
79折
實用 DeepSeek 技術 - 開發真正可用的 LLM 應用程式$880$695 -
78折
AI 程式設計、深度學習與 LLM 入門到精通:PyTorch × GPT × Transformer × LLaMA 實作指南(iThome鐵人賽系列書)$650$507 -
79折
LLM 工程師開發手冊 (LLM Engineer's Handbook: Master the art of engineering large language models from concept to production)$1,250$987 -
79折
AI Agent 智能工作流:設計與自動化全實戰$760$600 -
79折
不再是 ChatBot - 最新 AI Agent 代理建構$880$695 -
79折
最新 AI 開發範式 - Agent 多重智慧體自動產生應用$680$537 -
79折
LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具$680$537 -
79折
LLM 提示工程技術|打造兼具藝術與科學的高效應用 (Prompt Engineering for LLMs: The Art and Science of Building Large Language Model-Based Applications)$620$489 -
79折
LLM 語意理解與生成技術完全開發 (Hands-On Large Language Models)$980$774 -
79折
LLM × 網路爬蟲終極實戰:n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent$980$774 -
79折
LangChain 學習手冊|使用 LangChain 與 LangGraph 建構 AI 與 LLM 應用程式 (Learning LangChain: Building AI and LLM Applications with LangChain and LangGraph)$680$537 -
79折
Node.js 與 LLM 原理與實務:AI 應用程式開發$780$616 -
79折
知道你的下一筆訂單 - 使用 LLM$980$774 -
79折
更少 GPU 卻更強 - LLM 輕量化壓縮及加速訓練$980$774 -
79折
AI Agent 自動化流程超 Easy -- 不寫程式 No Code 聰明完成樣樣事$750$592 -
VIP 95折
AI傳媒學:大模型助力傳媒行業應用與創新$588$558
商品描述
本書展現了大語言模型技術的整體框架和路線圖,內容講解力求簡明、準確、實用,主要目的在於為相關行業或研究領域提供大模型技術的中文參考資料,推動我國相關人工智能技術的發展。全書共13章,內容涉及大模型的背景和基礎知識、資源、預訓練、微調與對齊、大模型使用以及模型評測等,同時還提供了相關的代碼示例與實驗工具包。 本書可供具有深度學習基礎的讀者閱讀與使用,既可作為高等學校人工智能、大數據、計算機類等專業教材,也可作為相關研究與從業人員的參考用書。
作者簡介
文繼榮,中國人民大學信息學院院長、高瓴人工智能學院執行院長,國家特聘專家。長期從事人工智能和大數據領域的研究工作,研究方向包括信息檢索、數據挖掘、機器學習、大模型等。擔任中國人民政治協商會議北京市第十四屆委員會常務委員、中央統戰部黨外知識分子建言獻策專家組成員、第八屆教育部科學技術委員會委員、中國計算機學會常務理事等。曾任微軟亞洲研究院高級研究員和因特網搜索與挖掘組主任。
目錄大綱
第一部分 背景與基礎知識
第1章 引言
1.1 語言模型的發展歷程
1.2 大語言模型的能力特點
1.3 大語言模型關鍵技術概覽
1.4 大語言模型對科技發展的影響
1.5 本書的內容組織
第2章 基礎介紹
2.1 大語言模型的構建過程
2.1.1 大規模預訓練
2.1.2 指令微調與人類對齊
2.2 擴展定律
2.2.1 KM擴展定律
2.2.2 Chinchilla擴展定律
2.2.3 關於擴展定律的討論
2.3 湧現能力
2.3.1 代表性的湧現能力
2.3.2 湧現能力與擴展定律的關系
2.4 GPT系列模型的技術演變
2.4.1 早期探索
2.4.2 規模擴展
2.4.3 能力增強
2.4.4 性能躍升
第3章 大語言模型資源
3.1 公開可用的模型檢查點
3.1.1 公開可用的通用大語言模型檢查點
3.1.2 LLaMA變體系列
3.2 常用的預訓練數據集
3.2.1 網頁
3.2.2 書籍與論文
3.2.3 維基百科
3.2.4 代碼
3.2.5 混合型數據集
3.3 常用的微調數據集
3.3.1 指令微調數據集
3.3.2 人類對齊數據集
3.4 代碼庫資源
3.4.1 Hugging Face開源社區
3.4.2 DeepSpeed
3.4.3 Megatron-LM
3.4.4 本書配套資源說明
第二部分 預訓練
第4章 數據準備
4.1 數據來源
4.1.1 通用文本數據
4.1.2 專用文本數據
4.2 數據預處理
4.2.1 質量過濾
4.2.2 敏感內容過濾
4.2.3 數據去重
4.2.4 數據對預訓練效果的影響
4.2.5 數據預處理實踐
4.3 詞元化(分詞)
4.3.1 BPE分詞
4.3.2 WordPiece分詞
……
第三部分 微調與對齊
第四部分 使用與評測
參考文獻
