大模型核心原理與企業落地實踐
林學森、吳鋒、王勁濤、代聲馨
- 出版商: 清華大學
- 出版日期: 2025-05-01
- 定價: $594
- 售價: 8.5 折 $504
- 語言: 簡體中文
- 頁數: 252
- ISBN: 7302687943
- ISBN-13: 9787302687948
-
相關分類:
Large language model
立即出貨 (庫存 < 3)
買這商品的人也買了...
LLM 大語言模型 詳見活動內容 »
-
78折
零基礎玩轉 LLM 應用全攻略:Python × No-Code 實作 AI 開發超簡單(iThome鐵人賽系列書)$690$538 -
79折
大型語言模型應用實戰:從 Prompt Engineering 到 Agentic RAG 與 MCP$790$624 -
78折
大模型時代:從 ChatGPT 一枝獨秀到全面開戰的 AI 賽局$500$390 -
79折
業界實戰親授 - 大型語言模型微調、最佳化、佈署一次到位$980$774 -
79折
深度學習最佳入門與專題實戰:自然語言處理、大型語言模型與強化學習篇$880$695 -
79折
AIGC 大型語言模型 - 個人應用到企業實戰立刻上手$780$616 -
79折
讓 LLM 飛起來的工具使用 - AI Agent MCP 協議開發、標準、應用$790$624 -
79折
AI Agent 手刻首選 - 使用 LangChain 親手實作 LLM 大型商業專案$880$695 -
79折
LLMOps 打造穩定運行的大型語言模型系統 (LLMOps: Managing Large Language Models in Production)$620$489 -
79折
實用 DeepSeek 技術 - 開發真正可用的 LLM 應用程式$880$695 -
78折
AI 程式設計、深度學習與 LLM 入門到精通:PyTorch × GPT × Transformer × LLaMA 實作指南(iThome鐵人賽系列書)$650$507 -
79折
LLM 工程師開發手冊 (LLM Engineer's Handbook: Master the art of engineering large language models from concept to production)$1,250$987 -
79折
AI Agent 智能工作流:設計與自動化全實戰$760$600 -
79折
不再是 ChatBot - 最新 AI Agent 代理建構$880$695 -
79折
最新 AI 開發範式 - Agent 多重智慧體自動產生應用$680$537 -
79折
LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具$680$537 -
79折
LLM 提示工程技術|打造兼具藝術與科學的高效應用 (Prompt Engineering for LLMs: The Art and Science of Building Large Language Model-Based Applications)$620$489 -
79折
LLM 語意理解與生成技術完全開發 (Hands-On Large Language Models)$980$774 -
79折
LLM × 網路爬蟲終極實戰:n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent$980$774 -
79折
LangChain 學習手冊|使用 LangChain 與 LangGraph 建構 AI 與 LLM 應用程式 (Learning LangChain: Building AI and LLM Applications with LangChain and LangGraph)$680$537 -
79折
Node.js 與 LLM 原理與實務:AI 應用程式開發$780$616 -
79折
知道你的下一筆訂單 - 使用 LLM$980$774 -
79折
更少 GPU 卻更強 - LLM 輕量化壓縮及加速訓練$980$774 -
79折
AI Agent 自動化流程超 Easy -- 不寫程式 No Code 聰明完成樣樣事$750$592 -
VIP 95折
AI傳媒學:大模型助力傳媒行業應用與創新$588$558
商品描述
"全書分兩大篇。第 1 篇原理篇(第 1、2 章),嘗試引導讀者共同探索和揭秘研發領域大模型背後的核心原理,以使讀者“既知其然,又知其所以然”,並為後續章節的學習打下堅實的基礎。從概率、**化等基礎理論入手,進而深入淺出地闡述 Transformer、神經元等大模型的核心組成元素,以及評估方法、數據工程建設等通用能力的建設。針對技術細節,採用通俗易懂的行文風格,並輔以大量的圖表和數據,“零基礎”的讀者也可以高效地學習。第 2 篇應用實踐篇(第3 ~ 8章),是產業界**實踐成果的總結。選取代碼生成、代碼轉換、知識問答、推理加速、運維運營等研發大模型領域的高頻業務作為剖析對象,詳細展示作者在針對這些問題時的端到端思考,包括設計理念、關鍵技術瓶頸、解決方案及落地結果等。 無論你是初學者還是行業專家,都能在本書中找到寶貴的知識和實用的技巧,本書將幫助你在大模型技術的浪潮中乘風破浪。"
目錄大綱
目錄
CONTENTS
第1篇 原理篇
第1章 人工智能概述 002
1.1 人工智能的定義 002
1.2 人工智能發展簡史 003
1.2.1 史前文明,曙光初現(1956年之前) 004
1.2.2 初出茅廬,一戰成名(1956—1974年) 008
1.2.3 寒風凜冽,首次入冬(1974—1980年) 011
1.2.4 捲土重來,威震八方(1980—1987年) 012
1.2.5 失望彌漫,再度入冬(1987—1993年) 014
1.2.6 重出江湖,漸入佳境(1993年至今) 016
1.3 自然語言處理和大語言模型 018
1.3.1 自然語言處理 018
1.3.2 大語言模型 037
第2章 大模型的數學基礎 039
2.1 微分學 039
2.1.1 鏈式求導法則 039
2.1.2 對數函數求導 039
2.1.3 梯度和梯度下降算法 040
2.2 線性代數 041
2.2.1 向量 041
2.2.2 矩陣拼接 046
2.2.3 特徵值和特徵向量 053
2.2.4 幾何變換 054
2.3 概率論 056
2.3.1 概率分佈 056
2.3.2 先驗概率和後驗概率 058
2.3.3 最大似然估計 059
2.3.4 貝葉斯法則 060
2.4 統計學 061
2.4.1 數據的標準化和歸一化 061
2.4.2 標準差 062
2.4.3 偏差和方差 062
2.4.4 協方差和協方差矩陣 063
2.5 深度神經網絡基礎 064
2.5.1 神經元 064
2.5.2 激活函數 067
2.5.3 前向傳播和後向傳播算法 072
2.5.4 損失函數 077
2.6 Transformer機制詳解 084
2.6.1 Transformer簡介 084
2.6.2 分詞及向量化 085
2.6.3 位置編碼 086
2.6.4 自註意力和多頭註意力 087
2.6.5 殘差連接和層歸一化 089
2.6.6 Transformer小結 090
2.7 其他 093
2.7.1 訓練、驗證和測試數據集 093
2.7.2 過擬合和欠擬合 096
2.7.3 奧卡姆剃刀原則 097
2.7.4 信息熵 098
第2篇 應用實踐篇
第3章 大語言模型與檢索增強生成技術 102
3.1 檢索增強生成背景 102
3.2 檢索增強生成技術框架 102
3.2.1 信息檢索 104
3.2.2 提示工程 111
第4章 基於大語言模型的智能問答助手 114
4.1 文檔離線預處理與存儲 114
4.1.1 格式化 115
4.1.2 切割 115
4.1.3 向量化與存儲 119
4.2 聯網在線預處理與存儲 122
4.3 在線 QA 服務 123
4.3.1 用戶問題向量化 124
4.3.2 Prompt 組裝 124
4.3.3 問答召回 124
4.4 長記憶與多輪對話 125
4.5 歸因與可解釋性 128
4.6 評測 129
4.7 用戶反饋 131
4.8 待解決的系列問題 131
第5章 基於大語言模型的智能數據助手 134
5.1 數據標準化 135
5.2 工具 140
5.3 案例 143
第6章 基於大語言模型的鴻蒙代碼轉換探索 145
6.1 背景概述 145
6.2 問題剖析 145
6.3 探索破題 150
6.3.1 總體思路概述 151
6.3.2 基於“知識體系”的數據工程建設 152
6.3.3 針對被轉換對象“庖丁解牛” 155
6.3.4 提取典型問題模式,利用關鍵技術“各個擊破” 157
6.3.5 不斷優化“反饋迴路”,緩解工程復雜性 159
第7章 大語言模型的推理加速 161
7.1 引言 161
7.2 推理加速技術原理 165
7.2.1 推理計算與顯存分析 165
7.2.2 模型壓縮 169
7.2.3 計算加速 181
7.2.4 技術總覽 198
7.3 推理加速框架 199
7.3.1 vLLM 199
7.3.2 TGI 206
7.4 推理加速工程實踐 209
7.4.1 Llama3 在vLLM 框架上的推理 209
7.4.2 Llama3 在TGI框架上的推理 211
7.4.3 推理測試 212
第8章 大語言模型的運維與持續優化 223
8.1 運維背景 223
8.2 鏈路追蹤 224
8.3 數據管理與測試用例管理 236
8.3.1 Web 數據集管理 236
8.3.2 SDK 數據集管理 236
8.3.3 數據集版本管理 237
8.3.4 few-shot 動態管理 238
8.4 一站式評測 239
8.4.1 評測 239
8.4.2 單元測試 241
8.4.3 回歸測試 241
8.4.4 流量錄制回放測試 241
8.4.5 Agent/Tool 評測 242
8.4.6 RAG 評測 244
8.5 Prompt管理 246
8.6 監控告警 248
8.6.1 過濾器 248
8.6.2 監控 248
8.7 部署 249
8.7.1 框架 249
8.7.2 k8s 部署 250
參考文獻 253



