AI Agent開發:零基礎構建復合智能體
梁誌遠
商品描述
作者簡介
目錄大綱
目 錄
第 1 章 大模型與智能體技術基礎 1
1.1 智能體發展的技術背景 1
1.1.1 從專家系統到語言模型 1
1.1.2 感知?認知?執行 5
1.1.3 智能體的系統級結構模型 7
1.2 大模型的基本架構 9
1.2.1 Transformer結構剖析 10
1.2.2 編碼器與解碼器機制 13
1.2.3 註意力機制與多頭註意力 15
1.2.4 位置編碼與上下文建模 17
1.3 大模型能力邊界與應用接口 20
1.3.1 通用能力與推理能力 20
1.3.2 輸入長度限制與窗口控制 21
1.3.3 提示詞工程 23
1.3.4 多模態模型 26
1.4 構建語言智能體的基本流程 29
1.4.1 任務建模與輸入輸出結構定義 29
1.4.2 大模型API設計模式 32
1.4.3 基於上下文的行為規劃設計 33
1.5 本章小結 34
第 2 章 智能體系統的組成結構與運行機制 35
2.1 智能體核心模塊構成 35
2.1.1 感知模塊:輸入理解與解析 35
2.1.2 決策模塊:推理與規劃邏輯 37
2.1.3 行動模塊:工具執行與響應 38
2.1.4 記憶模塊:上下文與持久狀態 40
2.2 智能體生命周期管理 41
2.2.1 啟動與初始化過程 41
2.2.2 對話狀態追蹤機制 44
2.2.3 中斷恢復與持久化上下文機制 48
2.2.4 智能體註銷與資源釋放機制 52
2.3 與外部系統的集成方式 55
2.3.1 調用Web API與插件機制 56
2.3.2 與數據庫系統的讀寫操作 59
2.3.3 文件系統與代碼執行環境 62
2.3.4 UI輸入輸出的中間層接口 64
2.4 本章小結 67
第 3 章 大模型開發基礎 68
3.1 模型服務部署架構 68
3.1.1 OpenAI式SaaS調用方式 68
3.1.2 本地部署Qwen 3.0模型流程 72
3.1.3 模型微調與LoRA註入機制 74
3.1.4 GPU資源調度與推理優化 76
3.2 API調用設計模式 79
3.2.1 Chat Completion API設計 79
3.2.2 函數調用標準結構 82
3.2.3 批處理與流式傳輸機制 85
3.3 安全與內容控制機制 88
3.3.1 敏感詞過濾與紅線審查 88
3.3.2 輸出可信度評估機制 91
3.4 本章小結 94
第 4 章 LangChain框架與智能體構建流程 95
4.1 LangChain的核心組件 95
4.1.1 LLM接口抽象結構 95
4.1.2 Chains鏈式邏輯構造器 97
4.1.3 Tools與Agent集成機制 99
4.1.4 Memory記憶管理模塊 101
4.2 工具集成與函數調用機制 103
4.2.1 工具函數包裝規範 103
4.2.2 Tool執行環境與沙盒控制 104
4.2.3 多工具調用順序管理 106
4.3 LangChain Agent運行機制 108
4.3.1 ReAct智能體結構 108
4.3.2 自定義提示詞驅動智能體 109
4.3.3 工具鏈動態規劃邏輯 111
4.4 本章小結 113
第 5 章 LangGraph智能體編排與任務流管理 114
5.1 LangGraph概述 114
5.1.1 從LangChain到LangGraph 114
5.1.2 LangGraph在智能體體系中的定位 115
5.1.3 面向復雜任務的圖式化編排需求 118
5.2 LangGraph的核心概念與結構 119
5.2.1 節點與邊的定義 119
5.2.2 狀態與上下文存儲機制 121
5.2.3 任務依賴與執行路徑 122
5.3 LangGraph與LangChain的互補關系 123
5.3.1 鏈式調用與圖式編排的差異 123
5.3.2 與LangChain工具鏈的集成方式 123
5.3.3 在復雜Agent系統中的聯合使用 125
5.4 LangGraph工程化實戰 125
5.4.1 LangGraph安裝與運行環境準備 126
5.4.2 基於LangGraph的簡單任務流示例 127
5.4.3 面向科研助手的多步驟任務實現 129
5.4.4 結合外部工具與數據庫的集成案例 131
5.5 LangGraph與協議層的銜接 133
5.5.1 與MCP的接口映射 133
5.5.2 與A2A(多Agent通信協議)的結合 136
5.5.3 面向大規模Agent網絡的擴展性設計 138
5.6 本章小結 142
第 6 章 RAG機制:檢索增強智能體 143
6.1 RAG原理與系統架構 143
6.1.1 檢索-生成雙階段框架 143
6.1.2 向量數據庫的嵌入機制 145
6.1.3 文檔切片與Chunking策略 146
6.1.4 基於語義相關度的召回機制 148
6.2 文檔預處理與向量化 149
6.2.1 文本清洗與句元切分 149
6.2.2 Embedding模型選擇 151
6.2.3 Faiss/Weaviate/Chroma部署 154
6.3 基於LangChain的RAG實現 157
6.3.1 RetrievalQA鏈路構建 157
6.3.2 多段檢索與Top-K融合 161
6.3.3 文本與結構化數據混合檢索 164
6.4 本章小結 167
第 7 章 MCP協議:模型上下文通信標準 168
7.1 MCP協議基礎設計理念 168
7.1.1 模型上下文管理的核心難題 168
7.1.2 上下文段結構化表示 170
7.1.3 系統提示、記憶段、工具段定義 173
7.2 上下文標註與路由機制 176
7.2.1 metadata標簽語義結構 177
7.2.2 信息路由控制策略 178
7.2.3 模型分支路由與入口決策邏輯 181
7.3 上下文存儲與回調機制 183
7.3.1 持久化上下文日誌設計 184
7.3.2 提示詞緩存與快速回放機制 187
7.3.3 動態上下文合並策略 189
7.4 本章小結 192
第 8 章 單智能體系統構建實戰 193
8.1 單智能體結構設計 193
8.1.1 輸入輸出流封裝標準 193
8.1.2 智能體狀態管理機制 194
8.2 工具調用鏈設計與調試 197
8.2.1 工具註冊與執行框架 197
8.2.2 輸入參數解析與封裝 198
8.2.3 工具異常處理機制 201
8.3 記憶機制實現 204
8.3.1 短期Memory與長期Memory 204
8.3.2 LangChain中的Memory類詳解 205
8.3.3 上下文動態剪輯策略 208
8.4 本章小結 210
第 9 章 多智能體系統構建實戰 211
9.1 多智能體系統的基本結構 211
9.1.1 主控智能體與子任務智能體劃分 211
9.1.2 智能體職責分工建模 213
9.1.3 多智能體間的狀態共享機制 216
9.2 多智能體任務協調調度 218
9.2.1 任務分配策略:輪詢與權重 219
9.2.2 任務依賴鏈與優先級控制 222
9.2.3 子智能體並行執行管理 225
9.3 多智能體消息傳遞機制 227
9.3.1 智能體間的通信協議格式 228
9.3.2 上下文切換與隔離設計 230
9.3.3 狀態同步與鎖控制策略 232
9.4 本章小結 235
第 10 章 A2A協議:智能體之間的協作語言 236
10.1 A2A協議設計概述 236
10.1.1 什麼是A2A協議 236
10.1.2 消息格式與語義設計規範 238
10.1.3 智能體身份認證與能力聲明機制 242
10.1.4 A2A協議與MCP協議在Qwen 3.0原生支持下的開發流程 245
10.2 消息類型與調度規則 249
10.2.1 Request-Response機制詳解 249
10.2.2 廣播與訂閱模型設計 252
10.2.3 協商與競爭機制設計 254
10.3 本章小結 257
第 11 章 扣子低代碼平臺開發與智能體部署 258
11.1 扣子平臺結構與功能概覽 258
11.1.1 什麼是扣子 258
11.1.2 低代碼開發模式與傳統開發模式的區別 260
11.1.3 搭建一個AI助手智能體 261
11.2 基於扣子的智能體開發實戰 264
11.2.1 使用自然語言搭建智能體 264
11.2.2 開發一個AI翻譯應用 267
11.3 扣子平臺進階開發 272
11.3.1 扣子羅盤 272
11.3.2 扣子空間 275
11.3.3 扣子API與SDK開發進階 277
11.4 本章小結 279
第 12 章 智能體系統的部署、擴展與維護實戰 280
12.1 智能體系統部署策略 280
12.1.1 私有部署與雲端部署比較 280
12.1.2 Web服務化部署流程 282
12.1.3 部署環境中的安全加固措施 285
12.2 性能優化與可用性保障 289
12.2.1 API負載均衡與異步任務調度 289
12.2.2 緩存系統設計與多層級記憶 291
12.2.3 智能體失敗容錯機制 297
12.2.4 高並發場景的限流與降級策略 300
12.3 本章小結 303
第 13 章 項目案例:從零實現一個復合智能體系統 304
13.1 項目需求分析與功能規劃 304
13.1.1 項目目標與業務流程分析 304
13.1.2 多智能體協同模塊劃分 306
13.1.3 用戶交互界面設計要點 306
13.1.4 數據結構與模型接口定義 307
13.2 核心模塊的開發過程 310
13.2.1 用戶意圖識別與入口解析 310
13.2.2 工具調用鏈與異常回退機制 313
13.2.3 智能體子系統狀態管理與調度 315
13.2.4 RAG檢索子系統設計與集成 318
13.3 協議實現與部署流程 321
13.3.1 MCP上下文路由配置 321
13.3.2 A2A消息協議的模塊註入 323
13.3.3 LangChain核心邏輯集成 326
13.4 項目測試與性能評估 329
13.4.1 對話流程完整性測試流程 329
13.4.2 工具調用正確率測試 330
13.4.3 多用戶並發測試與系統壓測 334
13.4.4 模型幻覺率與用戶滿意度評估 337
13.5 本章小結 341