領域大模型構建指南
陳峰
- 出版商: 機械工業
- 出版日期: 2026-04-01
- 售價: $534
- 語言: 簡體中文
- 頁數: 268
- ISBN: 711180581X
- ISBN-13: 9787111805816
-
相關分類:
Large language model
下單後立即進貨 (約4週~6週)
相關主題
商品描述
這是一部系統講解如何將通用大模型高效改造為領域專家的實戰著作。全書以“基礎—RAG—模型訓練—企業實戰”為主線,完整覆蓋了RAG架構、持續預訓練(CPT)、監督微調(SFT)、偏好對齊(DPO)、分布式訓練、模型部署,以及訓練飛輪、左右腦架構、MCTS 推理系統等前沿企業級解決方案,得到了學術界和企業界多位專家的一致 。本書作者在滴普科技任職期間,深度參與了百麗時尚集團等大型企業的AI智能解決方案建設,在真實、覆雜的一線業務中積累了豐富經驗。本書正是這些經過實戰檢驗的方法與思考的系統化呈現,不僅教授技術操作, 致力於培養讀者的系統設計思維,幫助其完成從“工匠”到“建築師”的角色躍遷,將大模型的巨大潛能轉化為各領域不可替代的核心競爭力。全書共18章,分為四個部分: 部分( ~3章) 大模型技術基礎及實踐應用系統介紹大模型與領域模型的基本概念、技術原理及使用場景,講解開發環境的搭建方法,並通過聊天機器人實戰案例演示大模型在文本翻譯、信息提取、歸納總結等場景中的應用,為後續深入學習奠定堅實基礎。第二部分(第4~8章) RAG原理與實戰深入講解RAG的架構原理與實踐技巧,涵蓋內容索引、嵌入模型、向量數據庫、相關內容檢索、結果精排、多查詢檢索、多向量檢索等核心技術,並通過完整的RAG實戰項目串聯離線索引與在線服務的全流程,這個流程是當前企業應用中 、落地 快的技術路徑。第三部分(第9~13章) 模型訓練全書的理論核心與精華所在,建立了一套完整的模型 方法論。系統講解CPT、SFT、DPO三種層層遞進的訓練技術,以及數據集生成、分布式訓練、模型部署與量化等關鍵工程實踐,包含多個實戰項目,確保模型能從實驗室真正走向應用。第四部分( 4~18章) 企業大模型實戰引導讀者完成從“工匠”到“建築師”的角色躍遷。系統介紹企業大模型的構建藍圖與訓練飛輪方法論,深入講解左右腦架構的設計與實現,並通過引入MCTS等前沿技術構建 推理系統, 以單店和多店運營分析等真實業務場景進行完整的實戰演練。|
作者簡介
陳峰, AI技術專家,就職於滴普科技,深度參與百麗時尚集團等大型企業的 數據智能解決方案建設,在領域大模型的構建與落地方面積累了豐富的一線實戰經驗。致力於將通用大模型轉化為企業核心競爭力,在RAG架構、模型訓練、訓練飛輪、左右腦架構、MCTS 推理系統等方面有深入的研究與實踐。著有《ClickHouse性能之巔:從架構設計解讀性能之謎》等書,維護有微信公眾號“峰少的技術空間”。
目錄大綱
序一
序二
前言
第一部分 大模型技術基礎及實踐應用
第1章 大模型和領域模型基礎
1.1 大模型基礎
1.1.1 大模型的基本概念
1.1.2 大模型的使用場景
1.1.3 當前大模型面臨的幾個挑戰
1.2 領域模型基礎
1.2.1 領域模型概述
1.2.2 領域模型和通用大模型的關系
1.2.3 領域模型解決的問題
1.2.4 領域模型的兩大技術路線及其優勢
1.3 本章小結
第2章 搭建開發環境
2.1 開發環境概述
2.2 所需軟硬件介紹
2.2.1 PyTorch
2.2.2 英偉達顯卡與CUDA
2.2.3 Apple M系列芯片和MPS
2.3 在Windows下搭建開發環境
2.3.1 安裝Anaconda
2.3.2 創建虛擬環境
2.3.3 安裝PyTorch
2.3.4 安裝集成開發環境及依賴包
2.4 在macOS下搭建開發環境
2.4.1 安裝Homebrew
2.4.2 安裝Anaconda
2.4.3 配置開發環境
2.5 在Linux下搭建開發環境
2.5.1 Miniconda簡介
2.5.2 安裝Miniconda
2.5.3 配置開發環境
2.6 本章小結
第3章 快速上手:大模型在聊天機器人中的實踐
3.1 聊天機器人的需求
3.2 使用公網服務搭建聊天機器人
3.2.1 申請OpenAI API密鑰
……
第二部分 PAG原理與實戰
第三部分 模型訓練
第四部分 企業大模型實戰
