RAG 再深入研究 - 向量資料庫智慧檢索及應用

梁楠 著

  • RAG 再深入研究 - 向量資料庫智慧檢索及應用-preview-1
  • RAG 再深入研究 - 向量資料庫智慧檢索及應用-preview-2
  • RAG 再深入研究 - 向量資料庫智慧檢索及應用-preview-3
  • RAG 再深入研究 - 向量資料庫智慧檢索及應用-preview-4
  • RAG 再深入研究 - 向量資料庫智慧檢索及應用-preview-5
  • RAG 再深入研究 - 向量資料庫智慧檢索及應用-preview-6
  • RAG 再深入研究 - 向量資料庫智慧檢索及應用-preview-7
  • RAG 再深入研究 - 向量資料庫智慧檢索及應用-preview-8
RAG 再深入研究 - 向量資料庫智慧檢索及應用-preview-1

買這商品的人也買了...

相關主題

商品描述

【書籍特點】

★解構高維資料儲存與「維度詛咒」問題

★比較向量資料庫與傳統關聯式資料庫設差異

★探索靜態與動態向量嵌入的生成與應用

★分析距離度量失效與高維相似度計算方法

★實作HNSW與LSH等近似最近鄰搜尋演算法

★評估Annoy與BallTree在不同檢索場景的效能

★解析FAISS向量索引類型與GPU加速技術

★建構Milvus系統並實現分散式與容器化部署

★支援中繼資料條件查詢與多維混合檢索

★結合語義嵌入技術進行語義搜尋系統開發

★完整實作自動駕駛場景的資料檢索系統

★導入預訓練模型與微調生成高品質語義向量

★實現RESTful API與雲端語義檢索服務整合

★全面覆蓋語義搜索性能調校與異常診斷模組

 

【內容簡介】

這是一本針對高維向量資料檢索技術所編寫的系統性實務指南,涵蓋從理論基礎、核心演算法到主流工具與應用部署的完整脈絡。內容不僅說明向量資料庫的設計必要性,也具體分析傳統資料庫在高維資料處理上的限制,進而引入HNSWLSHAnnoy等近似最近鄰搜尋演算法的實作方法。對於工程應用層面,書中詳細介紹FAISSMilvus兩大系統的架構設計、索引建構、GPU最佳化與容器化部署流程,並輔以自動駕駛、語義檢索等真實場景的完整案例。實作細節包括語義嵌入生成、向量預處理、多條件查詢與RESTful介面開發,對需要建構語義搜索或高效推薦引擎的開發者而言具有極高參考價值。本書適合AI開發者、搜尋系統工程師、推薦系統實作者及研究高維向量檢索的學術人員使用,是串接模型應用與資料系統的關鍵橋樑。

作者簡介

梁楠 博士

畢業於北京航空航太大學,高級職稱,長期從事模式識別、機器學習、統計理論的研究與應用,負責或參與科研項目多項,專注於人工智慧、大語言模型的應用與開發,對深度學習、資料分析與預測等有獨到見解。

目錄大綱

第一部分 理論基礎

1 為何需要向量資料庫

1.1 大語言模型的缺陷

1.1.1 高維向量表示中的資訊遺失問題

1.1.2 嵌入空間對語義相似度的誤差影響

1.2 高維資料儲存與檢索的技術瓶頸

1.2.1 高維資料的特性與儲存困難分析

1.2.2 高維空間中的「維度詛咒」問題簡介

1.2.3 高效檢索:索引結構與搜尋演算法簡介

1.3 傳統資料庫與向量資料庫的對比分析

1.3.1 傳統資料庫的設計原理與局限性

1.3.2 高維向量檢索在傳統資料庫中的實現困難

1.3.3 傳統資料庫與向量資料庫的性能對比分析

1.4 向量資料庫的優勢

1.5 本章小結

1.6 思考題

 

2 向量資料庫基礎

2.1 向量資料庫的核心概念與基本資料結構

2.1.1 向量資料庫的定義與發展背景

2.1.2 向量資料庫常見的資料結構:倒排索引、圖索引與分區技術

2.1.3 向量資料庫與傳統資料庫邏輯對比

2.2 特徵提取與向量表示:從資料到高維座標系

2.2.1 特徵提取的基本方法

2.2.2 嵌入向量生成

2.2.3 資料前置處理對向量品質的影響

2.3 高維空間特性與「維度詛咒」問題解析

2.3.1 高維空間中的稀疏性與資料分佈特性

2.3.2 距離度量的退化:歐幾里得距離與餘弦相似度

2.3.3 維度詛咒:降維與索引最佳化

2.4 本章小結

2.5 思考題

 

▌第二部分 核心技術與演算法原理

3 向量嵌入

3.1 靜態向量嵌入

3.1.1 傳統詞向量模型:Word2Vec GloVe

3.1.2 靜態嵌入的局限性:語義多義性與上下文缺失

3.1.3 靜態向量嵌入在特定領域的應用

3.2 動態向量嵌入

3.2.1 動態詞向量的生成:BERT GPT 的嵌入機制

3.2.2 動態嵌入的優勢:上下文敏感性與語義一致性

3.2.3 動態向量嵌入的即時生成與最佳化

3.3 均勻分佈與空間覆蓋率

3.3.1 高維向量分佈分析

3.3.2 嵌入向量的均勻性測量方法

3.3.3 空間覆蓋率對檢索性能的影響

3.4 嵌入向量最佳化

3.4.1 主成分分析與奇異值分解的降維應用

3.4.2 t-SNE UMAP 降維技術

3.4.3 降維對嵌入語義保留與性能的權衡分析

3.5 本章小結

3.6 思考題

 

4 向量相似性搜尋初步

4.1 基於暴力搜尋的向量相似性檢索

4.1.1 暴力搜尋的原理與實現

4.1.2 暴力搜尋最佳化

4.2 歐幾里得距離與餘弦相似度

4.2.1 距離與相似度的數學定義

4.2.2 不同相似度指標的適用場景分析

4.3 向量搜尋的精度與召回率

4.3.1 精度、召回率與F1 評分的計算方法

4.3.2 向量搜尋性能提升方案

4.4 本章小結

4.5 思考題

 

5 分層定位與局部敏感雜湊

5.1 HNSW 的核心原理:圖結構與分層搜尋路徑最佳化

5.1.1 基於圖結構的近鄰搜尋模型

5.1.2 分層搜尋路徑的建構與更新

5.1.3 HNSW 索引時間複雜度分析

5.2 局部敏感雜湊的設計與性能調優

5.2.1 雜湊函式的設計與向量分區原理

5.2.2 LSH 桶化與參數調優

5.2.3 LSH 的記憶體佔用與計算性能分析

5.3 HNSW LSH 的具體應用

5.3.1 HNSW 在推薦系統中的應用

5.3.2 LSH 在文字和影像檢索中的應用

5.3.3 HNSW LSH 的組合應用:多模態檢索實例

5.4 本章小結

5.5 思考題

 

6 LSH 搜尋最佳化

6.1 BallTree 演算法的工作原理

6.1.1 BallTree 的節點分割與索引建構

6.1.2 BallTree 查詢過程與複雜度分析

6.2 Annoy 搜尋演算法

6.2.1 Annoy 的索引結構設計與分區原理

6.2.2 Annoy 在大規模向量檢索中的性能最佳化

6.3 隨機投影在LSH 中的應用

6.3.1 隨機投影的數學基礎

6.3.2 隨機投影在高維資料降維與檢索中的實際應用

6.3.3 隨機投影在人物誌降維與檢索中的應用

6.4 本章小結

6.5 思考題

 

▌第三部分 工具與系統建構

7 相似性測量初步

7.1 從曼哈頓距離到切比雪夫距離

7.1.1 曼哈頓距離的幾何意義與公式推導

7.1.2 切比雪夫距離在棋盤模型中的應用

7.1.3 不同距離度量的適用場景分析

7.2 相似性測量的時間複雜度與最佳化

7.2.1 向量間距離計算的時間複雜度分析

7.2.2 減少距離計算的分區最佳化技術

7.2.3 並行化與硬體加速在相似性測量中的應用

7.2.4 廣告分發系統案例:基於相似性測量的高效推薦

7.3 本章小結

7.4 思考題

 

8 測量進階:點積相似度與雅卡爾相似係數

8.1 點積相似度測量

8.1.1 點積相似度測量實現

8.1.2 點積相似度在推薦系統中的應用案例

8.1.3 點積相似度在醫療領域的應用案例:患者治療方案匹配

8.2 雅卡爾相似係數在稀疏向量中的應用

8.2.1 稀疏向量的構造與稀疏性分析

8.2.2 雅卡爾相似係數案例分析

8.2.3 基於雅卡爾相似係數的犯罪嫌犯關係網絡分析

8.3 跨模態醫療資料相似性分析與智慧診斷系統

8.4 本章小結

8.5 思考題

 

9 中繼資料過濾與犯罪行為分析系統

9.1 中繼資料與向量檢索

9.1.1 中繼資料在混合檢索中的作用

9.1.2 中繼資料標籤的定義與標準化

9.1.3 智慧多條件推薦系統

9.2 多條件檢索實現

9.2.1 多維度條件組合檢索

9.2.2 基於中繼資料優先順序的排序演算法

9.2.3 基於中繼資料的酒店智慧化推薦案例分析

9.3 中繼資料索引的建構與最佳化

9.3.1 中繼資料索引建構

9.3.2 動態中繼資料的更新與重建

9.4 即時檢索與中繼資料快取

9.4.1 基於快取的高性能檢索架構

9.4.2 中繼資料快取失效與一致性管理

9.5 基於中繼資料的犯罪行為分析與即時預警系統

9.5.1 模組開發劃分

9.5.2 逐模組開發

9.5.3 犯罪分析與預警系統綜合測試

9.6 本章小結

9.7 思考題

 

10 FAISS 向量資料庫開發基礎

10.1 FAISS 庫的安裝與快速上手

10.1.1 FAISS 初步開發以及CPUGPU 的版本差異

10.1.2 載入資料與基本查詢範例

10.2 基於FAISS 的索引建構與參數調整

10.2.1 不同索引類型:FlatIVF HNSW

10.2.2 參數調整對搜尋精度與速度的影響

10.3 大規模向量搜尋的分片與分散式實現

10.3.1 資料分片與動態分片

10.3.2 基於分散式框架的FAISS 部署

10.4 FAISS 中的記憶體最佳化與GPU 加速

10.4.1 壓縮索引與量化技術

10.4.2 GPU 的並行處理

10.5 本章小結

10.6 思考題

 

11 Milvus 向量資料庫開發基礎

11.1 Milvus 的架構設計與功能模組解析

11.1.1 Milvus 的初步使用及叢集架構與元件通訊

11.1.2 資料分區與高可用設計

11.2 使用Milvus 進行向量插入、檢索與過濾

11.2.1 向量資料前置處理與批次插入

11.2.2 複雜查詢準則實現

11.3 Milvus 的索引類型與性能調優

11.3.1 索引類型的選擇與適用場景分析

11.3.2 並行最佳化與索引更新

11.4 Milvus 在企業級應用中的部署與擴充方案

11.4.1 基於容器化的高可用部署

11.4.2 動態擴充與監控整合方案

11.5 本章小結

11.6 思考題

 

▌第四部分 實戰與案例分析

12 基於FAISS 的自動駕駛泊車資料檢索系統

12.1 項目背景介紹

12.1.1 系統架構

12.1.2 應用流程

12.1.3 案例特色

12.2 模組劃分

12.3 模組化開發

12.3.1 資料前置處理模組

12.3.2 向量生成模組

12.3.3 索引建構與儲存模組

12.3.4 即時檢索模組

12.3.5 動態更新模組

12.3.6 系統監控與最佳化模組

12.4 系統綜合測試

12.5 API 介面開發與雲端部署

12.5.1 API 介面開發

12.5.2 雲端部署完整系統

12.6 本章小結

12.7 思考題

 

13 基於語義搜尋的向量資料庫開發實戰

13.1 語義嵌入生成與最佳化

13.1.1 使用預訓練模型生成語義向量嵌入

13.1.2 動態分詞與文字前置處理

13.1.3 領域微調技術

13.2 建構向量索引與語義檢索框架

13.2.1 選擇合適的向量索引類型

13.2.2 建構Milvus 向量索引

13.2.3 語義向量檢索與關鍵字過濾

13.2.4 結合中繼資料與篩選條件實現多維度語義搜尋

13.3 語義搜尋系統的性能調優

13.3.1 GPU 加速最佳化檢索

13.3.2 批次查詢與非同步IO 技術

13.3.3 實現基於分散式架構的語義搜尋系統

13.4 企業級語義搜尋應用整合與部署

13.4.1 建構語義搜尋RESTful 介面

13.4.2 使用Docker Kubernetes 實現語義搜尋系統的容器化

13.4.3 日誌監控與錯誤診斷模組

13.4.4 基於語義搜尋的文件檢索系統集成與部署

13.4.5 大型圖書館圖書檢索的測試案例

13.5 本章小結

13.6 思考題