RAG × LangChain 整合應用:從問診機器人開始,打造可信任的 AI 系統 (iThome鐵人賽系列書)
陳柏翰
買這商品的人也買了...
-
$880$695 -
$850$808 -
$380$296 -
$600$570 -
$654$621 -
$600$450 -
$780$616 -
$720$562 -
$700$525 -
$980$774 -
$820$648
相關主題
商品描述
從概念到實作,全方位掌握 RAG 與 LangChain
精準打造你的專屬 AI 系統!
本書改編自第16屆 iThome 鐵人賽生成式 AI 組優選系列文章《初探 LangChain 與 LLM:打造簡易問診機器人》,完整收錄生成式 AI、大型語言模型(LLM)與檢索增強生成(RAG)的核心觀念與技術細節。
書中首先帶領讀者認識生成式 AI 與 LLM 的重要觀念,深入探討模型常見的幻覺問題與即時知識更新的難點,並逐步引導讀者學習 RAG 架構如何有效克服這些挑戰。接著,以詳細且易懂的步驟說明環境建置方法,包括 Python、PyCharm、OpenAI API 及 MongoDB Atlas 的設定,確保讀者能快速架設並應用於實務專案。
此外,書中透過實際案例「智慧問診機器人」專案的完整演練,全面介紹 LangChain 框架的基礎到進階操作技巧,並深入說明如何評估與測試系統效能,運用 DeepEval 及 LLM as a Judge 等工具進行成效驗證,幫助讀者掌握 RAG 系統的實務與優化策略,快速提升實戰能力。
無論你是初次接觸生成式 AI 的新手,或希望深度實作 RAG 技術的進階讀者,本書將引導你扎實地掌握理論基礎與技術細節,輕鬆建立屬於自己的高效能智慧應用系統。
重點摘要
✦ 理論基礎
深入淺出 RAG 核心觀念
✦ 環境架設
從開發到部署一本搞定
✦ 實務專案
採用貼近生活的問診系統實戰演練
✦ 效能評估
開發同時也關注模型回答的表現
目標讀者
.對生成式 AI 有興趣的讀者
.具備基礎 Python 知識的讀者
.期望理解 RAG 系統的人士
.想要了解如何評估 RAG 表現的開發者
專業推薦
本書以教學導向的內容,帶領讀者認識生成式 AI、大型語言模型(LLM)與 RAG(檢索增強生成)的基本概念與架構,進而透過實際操作與範例,理解 LangChain 框架的開發實務,以及向量資料庫在知識檢索中的關鍵角色;並經由智慧問診機器人實作演練,讓讀者學習如何建構一個能實務運作的智慧化系統,同時介紹提升 RAG 系統準確度的建議作法。我誠摯推薦本書給每一位希望從基礎出發,穩健踏入 LLM 與 RAG 實作領域的讀者。相信本書不只會協助您建立知識架構,更會為後續的學習與應用打下良好的基礎。
──── 呂奇傑|輔仁大學資訊管理學系 特聘教授
作者簡介
陳柏翰
現職生成式 AI 及資料工程師,專長於Python程式語言、知識型問答系統(RAG,Retrieval-Augmented Generation),以及企業級 AI 應用的落地實作。擁有多年軟體開發、資料科學與機器學習專案經驗,長期投身於人工智慧產業應用與創新教學,並活躍於技術社群、學術研究與專業寫作領域。
目前就讀於輔仁大學資訊管理碩士在職專班,曾於網通產業、數位科技新創等不同型態企業服務,參與過多項結合 NLP 與資料工程的大型專案,涵蓋智慧客服、智能醫療諮詢、文件搜尋與自動化知識問答等應用場域。深諳 Python、Django、LangChain、OpenAI API、Docker、PostgreSQL、MongoDB 等主流技術,亦積極參與新一代 AI 工具在企業環境中的最佳實踐推廣。
除了專業領域的投入,也善於觀察生活、反思科技與人之間的關係。因此在書寫風格上,力求兼顧專業嚴謹與易讀親和,讓更多初學者、工程師與決策者都能從中找到啟發,真正落實「人人都能用 AI 提升數據力」的願景。
目錄大綱
Chapter 01 生成式 AI 與 RAG 的核心概念
1-1 生成式 AI(Generative AI)與大型語言模型(LLM)簡介
生成式 AI 簡介
大型語言模型簡介
LLMs 的應用與挑戰
生成式 AI 與 LLMs 的比較
LangChain:開發 LLM 應用的框架
向量(Embedding)技術
1-2 LLMs 的幻覺與知識更新問題
LLMs 產生幻覺的原因
幻覺在問答、法律、醫療等應用中的嚴重性
1-3 RAG的基本介紹
檢索增強生成(RAG)的原理與降低幻覺的方法
RAG 對 LLM靜態知識限制的補足與動態應用支持
RAG 的發展階段
LangChain 與 RAG 的整合應用
1-4 章節回顧
Chapter 02 環境架設與金鑰申請
2-1 開發環境架設( Python、PyCharm 以及虛擬環境)
2-2 OpenAI 金鑰申請
2-3 Mongo Atlas 服務申請
2-4 章節回顧
Chapter 03 LangChain 操作教學:從基礎到進階
3-1 LangChain 快速入門
LangChain 設定 OpenAI API Key 的方式
LangChain 中的 BaseChatModel 與 LLM 的串接
LangChain 中常見的 Message 類型與結構
LangChain 中的 PromptTemplate
LangChain 中的 VectorStore 與 InMemoryVectorStore
LangChain 中的 Document 與 Metadata
3-2 LangChain 進階功能實作
鍊式操作(Chain)進階應用
LangChain 內建的 RAG Chain 實作
Agent 概念與實務應用
LangChain 內建對話紀錄管理器
3-3 Mongo Atlas 資料及向量的寫入與查詢
使用 Mongo Atlas VectorStore 的寫入與查詢向量
3-4 章節回顧
Chapter 04 環境架設與金鑰申請
4-1 設計專案架構
4-2 資料及向量的寫入
4-3 設計查詢與對話模組
4-4 設計前台頁面
4-5 建立對話紀錄
4-6 建立問診紀錄區塊
4-7 使用 Fly.io 部署站台
4-8 章節回顧
Chapter 05 智慧問診機器人實作演練
5-1 LLM as a Judge 利用大型語言模型對回覆進行評分
為何我們需要「AI裁判」?
該如何撰寫讓 LLM 充當裁判的提示語(Prompt)?
LLM as a Judge 的主要應用場景
LLM as a Judge 的可靠性:它真的「公平」且「準確」嗎?
如何在實務中運用 LLM as a Judge?搭建你的自動評估流程
5-2 DeepEval 工具介紹
5-3 該如何準備 DeepEval 中的測試案例?
回顧基本的 RAG 流程
建立測試案例:使用 LLMTestCase 類別
執行測試的方式
5-4 常用檢索評估指標:文本精確度、文本召回率與文本關聯性
文本精確度(Context Precision)
文本召回率(Context Recall)
文本關聯性(Context Relevancy)
重點整理
5-5 常用生成評估指標:關聯性與忠實性
關聯性(Answer Relenvacy)
忠實性(Faithfulness)
重點整理
5-6 自定義測試 Prompt
5-7 章節回顧
6-1 Chunking 策略
常見的 Chunking 策略與實作範例
6-2 檢索策略(Retrieve Strategy)
6-3 重排序(Re-rank)
6-4 提示工程 Prompt Engineer
6-5 章節回顧
Chapter 07 RAG 在不同行業的應用與挑戰
7-1 企業知識庫 AI:如何運用 RAG 提升內部 FAQ 回答準確性?
7-2 法律 AI 助理:讓 AI 提供合規建議與文件檢索能力
7-3 醫療 AI 應用:如何確保 AI 在醫療領域提供可靠建議?
7-4 章節回顧