RAG 實踐權威指南:構建精準、高效大模型之道

寧星星

  • 出版商: 機械工業
  • 出版日期: 2025-06-01
  • 售價: $534
  • 貴賓價: 9.5$507
  • 語言: 簡體中文
  • 頁數: 256
  • ISBN: 7111781791
  • ISBN-13: 9787111781790
  • 相關分類: Large language model
  • 立即出貨 (庫存=1)

買這商品的人也買了...

相關主題

商品描述

本書由華大生命科學研究院 NLP專家撰寫,旨在帶你從零構建高效的企業級RAG系統。本書全面解析RAG原理與實戰,涵蓋架構與組件、高階技術與實踐、檢索與問答模塊優化策略、模型推理等核心技術,並深入講解三大落地優化技術,以及高階變體與能力增強措施。 本書共8章。第1章介紹RAG技術基礎,幫助讀者建立對RAG技術的全面認知。第2章介紹RAG系統的核心組件與實踐,幫助讀者掌握核心技術與基於Python庫的實踐。第3章介紹高階RAG技術與實踐的細節,幫助讀者掌握進階技術。第4章介紹檢索與問答模塊的優化, 講解優化策略。第5章介紹模型推理技術,加速RAG技術的落地。第6章介紹RAG系統在實際應用中的魯棒性、安全性和公平性優化技術,提升RAG系統的整體性能與可信度。第7章介紹RAG技術的高階變體,以充分挖掘RAG技術的應用潛力。第8章介紹實時知識 新與跨模態能力增強,展望RAG技術未來應用的方向。

作者簡介

寧星星:華大生命科學研究院(BGI)生物智能研究所 NLP算法工程師,目前從事RAG系統、Agent智能系統、生命科學垂直領域大模型等相關研發工作。擁有多年NLP算法相關開發經驗,擅長大模型、AIGC、智能問答等相關技術,並多次獲得全國性NLP與知識圖譜相關競賽獎項。著有《語義解析:自然語言生成SQL與知識圖譜問答實戰》一書。

目錄大綱

前言
第1章 RAG技術基礎
1.1 為什麼需要RAG技術
1.2 工作流程與核心技術解析
1.2.1 工作流程
1.2.2 核心技術
1.3 工作範式
1.4 價值與實際應用場景
1.5 計算資源與數據存儲需求
1.5.1 計算資源的需求
1.5.2 數據存儲的需求
1.6 面臨的主要挑戰
第2章 RAG系統的核心組件與實踐
2.1 向量數據庫
2.1.1 Elasticsearch
2.1.2 FAISS
2.1.3 Milvus
2.2 檢索系統
2.2.1 基於知識圖譜查詢
2.2.2 基於關系型數據庫查詢
2.2.3 基於向量數據庫查詢
2.3 生成系統
2.3.1 Transformer
2.3.2 GPT
2.4 RAG系統基準測試工具
2.4.1 評測數據集
2.4.2 常用的評測基準與步驟
2.5 基於常用Python庫的RAG實踐
2.5.1 基於Hugging Face Transformers庫
2.5.2 基於PyTorch和TensorFlow
2.5.3 基於LlamaIndex
2.5.4 基於LangChain
第3章 高階RAG技術與實踐
3.1 切片與向量化技術
3.1.1 切片
3.1.2 向量化
3.1.3 向量存儲與檢索
3.1.4 優化切片與向量化策略
3.1.5 實戰:從文本到向量
3.2 檢索技術
3.2.1 檢索流程及優化策略
3.2.2 關鍵詞檢索
3.2.3 語義檢索
3.2.4 密集段落檢索
3.2.5 混合檢索
3.2.6 重排序
3.3 高級檢索策略
3.3.1 假設性問題和假設性回答策略
3.3.2 擴大檢索語境
3.4 生成模型的選型與提示詞工程
3.5 檢索技術與生成技術的融合
3.5.1 RAG-Token模型
3.5.2 RAG-Sequence模型
第4章 檢索與問答模塊優化
4.1 數據預處理和管理優化
4.1.1 數據清洗
4.1.2 數據存儲和訪問優化
4.2 檢索模塊的優化
4.2.1 嵌入模型的訓練優化
4.2.2 文檔解析技術的優化
4.2.3 同義詞擴展
4.2.4 查詢重寫
4.3 問答模塊的優化
4.3.1 問答能力的優化
4.3.2 增強拒答能力
第5章 模型推理優化
5.1 推理加速技術
5.1.1 量化
5.1.2 剪枝
5.1.3 知識蒸餾
5.2 分布式推理
5.2.1 分布式推理技術
5.2.2 分布式推理算法
5.2.3 常見的分布式推理系統
5.2.4 分布式推理優化策略
5.3 邊緣計算優化
第6章 魯棒性、安全性和公平性優化
6.1 模型魯棒性優化
6.1.1 對抗訓練
6.1.2 模型正則化
6.1.3 隨機自我集成
6.1.4 防禦模塊
6.2 模型安全性優化
6.2.1 數據匿名化和加密
6.2.2 訪問控制
6.2.3 驗證查詢和輸出內容
6.2.4 保護向量數據庫
6.3 模型公平性優化
6.3.1 檢測模型偏見的方法
6.3.2 減少模型偏見的策略
第7章 RAG技術的高階變體
7.1 長上下文的困境突圍LongRAG
7.1.1 原理解析
7.1.2 源碼解析:LongRAG的深度剖析
7.2 知識圖譜的優勢融合GraphRAG
7.2.1 原理解析
7.2.2 源碼解析:GraphRAG的深度剖析
7.3 垂直領域的定向增強GeneRAG
7.3.1 原理解析
7.3.2 源碼解析:GeneRAG的深度剖析
第8章 實時知識更新與跨模態能力增強
8.1 實時知識更新
8.1.1 數據實時獲取的方法
8.1.2 知識庫動態更新
8.1.3 自動化數據管道
8.2 跨模態能力增強
8.2.1 多模態向量嵌入
8.2.2 多模態內容生成
附錄 相似度計算