自進化智能體:動態記憶與持續運行的架構實踐
張益新 謝婷婷
- 出版商: 電子工業
- 出版日期: 2026-01-01
- 售價: $594
- 語言: 簡體中文
- 頁數: 254
- ISBN: 712151835X
- ISBN-13: 9787121518355
-
相關分類:
Reinforcement
下單後立即進貨 (約4週~6週)
相關主題
商品描述
人工智能正經歷從“被動應答”到“主動行動 ”的範式變革,智能體(Agent)作為實現這一跨越 的核心載體,已成為技術研究與產業應用的新焦點 。本書旨在為讀者提供一份穿越這一前沿領域的全 面導航圖。本書系統性地構建了智能體的完整知識 體系。它不僅深入剖析了智能體的七大核心架構組 件——感知、工具、推理規劃、記憶、反思、動作 系統及其協同機制,還前瞻性地探討了如何利用強 化學習優化智能體決策、如何構建科學的評估體系 以彌合“評估鴻溝”,並詳細闡述了自進化智能體 與持續運行智能體這兩大前沿方向,揭示了智能體 如何實現自我優化與長期自治。全書理論結合實踐 , 終通過“自動化求職智能體”這一完整案例, 將抽象理論落地為具體實現。
作者簡介
謝婷婷,資深算法研究員,倫敦瑪麗女王大學博士,曾任商湯科技研究員。 學術研究方向聚焦於少樣本學習與時序信息理解。 長期擔任CVPR、ECCV、ICCV、AAAI等會議審稿人,獲CVPR 2025、ECCV 2022傑出審稿人榮譽。 作為核心成員參與多個大模型研發項目,主導完成商湯大語言模型“商量”粵語版的開發與交付。 帶隊參加哈佛大學發起的NeurIPS 2025 CURE-Bench競賽,從全球322支參賽隊伍中脫穎而出,獲得亞軍。
目錄大綱
第1章 智能體基礎概念
1.1 背景與定義
1.1.1 背景
1.1.2 定義
1.1.3 智能體與傳統程序、模型、大語言模型、工作流
1.1.4 智能體的發展路線
1.2 智能體系統=大語言模型+工具+編排層
1.2.1 智能體系統的概念與架構
1.2.2 智能體系統的分類:從簡單反應到覆雜認知
1.3 什麼時候需要構建智能體
1.3.1 智能體適用的場景
1.3.2 智能體不適用的場景
1.4 總結
第2章 感知系統
2.1 感知表示的類型
2.1.1 單模態模型
2.1.2 跨模態模型
2.1.3 多模態模型
2.2 優化感知系統
2.2.1 模型級增強
2.2.2 系統級優化
2.2.3 外部反饋和控制
2.3 感知應用
2.4 總結
第3章 工具系統
3.1 智能體工具的價值定位與能力邊界
3.1.1 價值定位:認知增益空間
3.1.2 能力邊界:細節處理與戰略洞察
3.2 智能體工具發現:基於MCP的分類與擴展體系
3.2.1 MCP下的工具分類框架
3.2.2 MCP工具調用生態架構
3.2.3 工具選型策略與典型場景
3.3 智能體工具使用評估
3.3.1 挑戰:工具過度使用
3.3.2 解決思路:元認知與自我意識
3.3.3 工具調用時機判斷:從理論到實踐的關鍵挑戰
3.3.4 評估方法與基準
3.4 智能體工具鏈設計原則
3.4.1 模塊化設計原則
3.4.2 可擴展性設計
3.4.3 容錯與恢覆機制
3.4.4 安全性
3.5 總結
第4章 推理規劃決策系統
4.1 推理基礎
4.1.1 邏輯推理
4.1.2 概率推理
4.1.3 因果推理
4.2 規劃算法
4.2.1 增強智能體規劃能力的策略
4.2.2 多智能體框架與規劃智能體
4.2.3 智能體規劃實施流程
4.2.4 智能體規劃與強化學習的深度融合
4.3 決策策略
4.3.1 多目標決策
4.3.2 不確定性處理
4.3.3 實時決策優化
4.4 總結
第5章 記憶系統
5.1 智能體記憶概述
5.1.1 智能體記憶的演進
5.1.2 類比人類認知:記憶功能的啟示
5.2 智能體記憶的基礎架構與機制
5.2.1 智能體記憶的分類
5.2.2 實現記憶的關鍵技術
5.3 智能體記憶開源項目概覽
5.3.1 基礎框架:構建具備記憶能力的智能體的基石
5.3.2 專業化與創新記憶系統
5.3.3 新興記憶技術與實驗性框架
5.4 智能體記憶的應用
5.4.1 會話智能體的記憶增強
5.4.2 機器人認知與空間記憶
5.4.3 驅動個性化推薦系統
5.4.4 創造 可信和自適應的遊戲智能體
5.5 核心挑戰、風險與緩解策略
5.6 未來方向與新興研究前沿
5.6.1 向多模態與流式記憶的推進
5.6.2 開發全面共享和持續演進的記憶架構
5.6.3 自適應記憶管理機制
5.6.4 記憶驅動的通用智能演進
5.7 總結
第6章 反思系統
6.1 智能體反思機制的理論基礎
6.1.1 認知科學視角
6.1.2 元認知與自我監控
6.1.3 學習理論
6.2 智能體反思技術實現
6.2.1 反思框架
6.2.2 自我批評機制
6.2.3 疊代方法
6.2.4 記憶整合
6.3 智能體反思應用場景
6.3.1 覆雜問題解決
6.3.2 推理能力增強優化
6.3.3 規劃與決策優化
6.3.4 從錯誤中學習
6.4 智能體反思案例研究
6.4.1 ReAct
6.4.2 Reflexion
6.4.3 Self-Refine
6.5 智能體反思的未來展望
6.5.1 挑戰與限制
6.5.2 研究方向
6.5.3 倫理考量
6.6 總結
第7章 動作系統
7.1 智能體動作系統的理論基礎
7.1.1 哲學思辨:動作理論的啟示
7.1.2 計算建模:基於智能體的模型
7.1.3 認知架構:構建智能體動作系統的藍圖
7.2 動作的選擇與決策
7.2.1 動作選擇策略與方法
7.2.2 強化學習:塑造智能體動作與策略的關鍵
7.2.3 模仿學習:從模仿中習得動作系統運作方式
7.2.4 動作系統的層次結構
7.2.5 動作系統的核心組件
7.2.6 動作系統的工作流程
7.3 智能體動作系統類型及其表現
7.3.1 反應式動作系統與審議式動作系統
7.3.2 單智能體動作系統與多智能體交互
7.3.3 具身智能體的動作系統:與物理及虛擬環境的互動
7.3.4 不同領域的動作系統特點
7.4 前沿進展與未來展望
7.4.1 智能體動作系統的可解釋性與可信度
7.4.2 覆雜智能體動作系統建模與評估的挑戰
7.4.3 智能體動作系統的優化策略
7.4.4 智能體動作系統的安全機制
7.4.5 未來研究方向建議
7.5 總結
第8章 強化學習
8.1 基礎理論
8.1.1 馬爾可夫決策過程
8.1.2 獎勵機制設計
8.1.3 價值函數
8.2 從人類獎勵到智能體獎勵
8.3 強化學習中的獎勵機制
8.3.1 獎勵模型定義
8.3.2 外部獎
