檢索增強生成:理論與實踐
王昊奮 王楠 羅雲 高雲帆
- 出版商: 電子工業
- 出版日期: 2026-02-01
- 售價: $648
- 語言: 簡體中文
- ISBN: 7121519526
- ISBN-13: 9787121519529
-
相關分類:
Large language model
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書深入解析了檢索增強生成技術,該技術通 過將大語言模型的內部知識與外部數據源有機結合 ,顯著拓展了模型的認知邊界,有效緩解了知識 新滯後與生成幻覺等問題。全書系統性地構建了從 理論根基到工程實踐的知識脈絡,不僅詳細剖析了 主流RAG技術的實現細節,梳理了從基礎範式到智 能體驅動的技術演進路徑,還構建了多維度的評估 體系,並對未來技術趨勢進行了前瞻性展望。在實 踐層面,本書依托主流開發框架與真實案例,提出 了適用於不同應用場景的優化策略,幫助讀者在醫 療、金融等具體領域中靈活運用RAG技術。本書不 僅為讀者全面梳理並呈現了當前RAG技術的系統化 知識體系, 為參與及 新一代RAG技術創新提 供了獨到的戰略視角與可操作的實踐路徑。全書內 容翔實,結構清晰,輔以豐富的圖表與開源代碼, 便於讀者自主實踐與深入理解。
目錄大綱
推薦序
前言
第1章 檢索增強生成概述
1.1 RAG提出的背景
1.1.1 大語言模型實際落地的挑戰
1.1.2 檢索增強的生成
1.1.3 RAG的應用場景
1.2 什麼是RAG
1.2.1 RAG的定義
1.2.2 RAG的發展歷程
1.2.3 RAG的基本工作流程
1.3 RAG與其他大語言模型優化技術的對比
1.3.1 提示工程
1.3.2 模型微調
1.3.3 樸素RAG的局限性
1.4 本章小結
第2章 RAG關鍵技術
2.1 數據準備
2.1.1 業界通用實現
2.1.2 較成熟的數據準備方案
2.2 數據索引
2.2.1 分塊優化
2.2.2 表格數據索引優化
2.2.3 結構化索引
2.2.4 檢索源與檢索粒度
2.3 語義檢索
2.3.1 檢索前處理
2.3.2 檢索
2.3.3 檢索後處理
2.4 大語言模型生成
2.4.1 生成前處理
2.4.2 生成
2.4.3 生成後處理
2.5 RAG流程編排
2.5.1 路由
2.5.2 檢索與生成的流程調度機制
2.5.3 融合
2.6 本章小結
第3章 RAG典型範式與優化思路
3.1 RAG的主要範式
3.1.1 RAG
3.1.2 模塊化RAG
3.1.3 三種RAG範式的對比
3.2 模塊化RAG的基礎流程模式
3.2.1 線性模式
3.2.2 條件模式
3.2.3 分支模式
3.2.4 循環模式
3.3 AgenticRAG:模塊化RAG的高階實現
3.3.1 為什麼需要AgenticRAG
3.3.2 預定義RAG工作流
3.3.3 動態RAG工作流
3.3.4 AgenticRAG的優勢
3.4 RAG系統的優化思路
3.4.1 增強組件
3.4.2 重組現有模塊
3.4.3 引入新模塊
3.5 本章小結
第4章 下遊任務與評測
4.1 下遊評測任務
4.1.1 知識密集型任務
4.1.2 深度研究任務
4.2 評測維度與基準
4.2.1 檢索階段
4.2.2 生成階段
4.2.3 評測基準與框架
4.3 RAG與長上下文
4.3.1 大海撈針實驗
4.3.2 RAG與大海撈針
4.3.3 嵌入模型與大海撈針
4.4 RAG評測的挑戰
4.5 本章小結
第5章 RAG實戰
5.1 常見開源RAG框架
5.1.1 LangChain與LangGraph
5.1.2 RAGFlow
5.1.3 LlamaIndex
5.1.4 Dify
5.2 使用RAGFlow搭建RAG系統
5.2.1 安裝
5.2.2 配置模型
5.2.3 構建知識庫
5.2.4 構建聊天系統
5.2.5 使用API訪問
5.2.6 小結
5.3 使用LangChain搭建RAG系統
5.3.1 安裝 LangChain
5.3.2 Runnable類的同步調用和異步調用
5.3.3 ChatModel
5.3.4 Message
5.3.5 PromptTemplate
5.3.6 Document、Embeddings、VectorStore和Retriever類
5.3.7 Graph、State和Node
5.3.8 Checkpoint和MemorySaver
5.3.9 搭建樸素RAG
5.4 效果評估
5.4.1 語義匹配和細顆粒度關鍵信息
5.4.2 評估指標
5.4.3 評估數據生成
5.5 優化檢索模塊:語義截斷與背景語義缺失
5.5.1 語義截斷與語義溢出
5.5.2 背景語義缺失
5.6 優化檢索模塊:嵌入模型
5.6.1 使用不同的嵌入模型
5.6.2 微調嵌入模型
5.7 優化檢索模塊:混合檢索
5.8 優化檢索模塊:添加重排序
5.8.1 交叉編碼重排序模型
5.8.2 多向量重排序模型
5.9 優化生成模塊
5.9.1 優化提示詞
5.9.2 選擇大語言模型
5.10 查詢預處理
5.10.1 查詢分解
5.10.2 查詢等價重寫
5.10.3 查詢泛化重寫
5.10.4 查詢路由
5.11 基於智能體的RAG
5.12 部署
5.12.1 使用騰訊雲向量數據庫替換本地數據庫
5.12.2 搭建API
5.12.3 使用容器和鏡像
5.12.4 前端
5.12.5 監控
5.12.6 部署到服務器
5.13 本章小結
第6章 RAG典型案例
6.1 典型工業流程設計
6.1.1 OpenAI
6.1.2 Cohere
6.1.3 Databricks
6.2 RAG在醫療健康領域的應用
6.2.1 醫學文獻知識助手概述
6.2.2 系統架構與核心功能設計
6.2.3 關鍵技術實現
6.2.4 小結
6.3 RAG在金融投資領域的應用
6.3.1 金融投資助手產生的背景
6.3.2 關鍵技術實現
6.3.3 小結
6.4 本章小結
第7章 挑戰與未來展望
7.1 RAG與圖結構的融合
7.1.1 知識組織
7.1.2 符號推理
7.1.3 任務規劃
7.1.4 工具使用與管理
7.2 多模態RAG
7.2.1 模態間語義對齊的覆雜性
7.2.2 計算覆雜性與系統性能
7.2.3 模態間權重動態平衡
7.2.4 模型可解釋性與透明度
7.2.5 數據標註與訓練的系統性挑戰
7.2.6 多模態數據協作
7.3 RAG與推理能力的結合
7.3.1 多步驟覆雜任務的挑戰
7.3.2 邏輯連貫性與知識整合
7.3.3 風險傳播與安全
7.3.4 實踐
