商品描述
1. 易讀、面向初學者的智能體入門書。
2. 全彩圖展示十大智能體行業級落地案例,Agent Skills和Claude Cowork核心架構圖。
3. 撰寫原則:“理論為本,實踐為用”。
4. 輔助理解:用扣子制作你的第一個智能體。
5. 每章列舉可覆現案例:包括RAG客服智能體,多模態創意生成:文案與設計,自動化編程智能體,個性化教育智能體,多智能體對話系統:基於LangGraph 的遊戲NPC 智能體,實時決策智能體系統實戰:金融決策與交易,醫療健康智能體:輔助診斷與健康管理,法律智能體:輔助合規與法律服務等。
作者簡介
姚宇航,美國卡內基梅隆大學電子與計算機工程博士,師從Carlee Joe-Wong教授,榮獲A.G. Milnes最佳博士論文獎。現任Zoom研究工程師,專註於垂直智能體系統與可擴展AI基礎架構的研發工作。曾在微軟、亞馬遜及多家人工智能初創公司從事研究工作,在分布式學習框架、大規模模型優化與工程化部署方面積累了系統性的實踐經驗。其研究聚焦於聯邦圖學習與多智能體系統,致力於推動分布式學習理論向真實人工智能系統落地,是該領域中兼具理論創新與系統實現能力的代表性研究者之一。在 NeurIPS、KDD、EMNLP、AAAI 等國際人工智能會議發表論文三十余篇,並多次擔任 MLSys、NeurIPS 等會議程序委員會委員。
丁博生,南洋理工大學計算機科學專業博士,AI量化交易公司Calais創始成員、COO,新加坡社科大學客座教授。帶隊發布的海外中文開源大模型及預訓練—微調一體化框架 PandaLLM在學術與工程實踐層面均產生廣泛影響。研究方向為大語言模型與智能體系統,目前專註於探索前沿 AI算法與量化交易、金融系統的深度融合,致力於將大模型與智能體技術轉化為可落地、可規模化的金融應用。
目錄大綱
第1章 智能體發展脈絡
1.1 什麼是智能體:從規則系統到超級智能體
1.2 反應式智能體:決策簡單、響應快速
1.3 計劃式智能體:從BDI 模型到智能體自動規劃
1.4 單智能體:認知框架與大語言模型驅動的任務閉環
1.5 要不要訓練智能體
1.6 多智能體系統:從協作系統到智能生態
第2章 智能體系統架構
2.1 設計原則
2.1.1 用戶友好:降低門檻的第一原則
2.1.2 系統智能:真正理解意圖並完成任務
2.1.3 可擴展性:模塊化帶來的演進能力
2.1.4 高性價比:讓智能體系統真正可用
2.2 六層架構概述:輸入、意圖、規劃、執行、推理、反饋
2.3 智能體系統六層架構調用鏈
2.4 現有智能體框架分析
2.4.1 LangChain:大語言模型驅動的工具調用框架
2.4.2 AutoGen:多智能體協同的任務自動化框架
2.4.3 CrewAI:具備角色分工與團隊結構的智能體編排系統
2.4.4 LangGraph:圖結構驅動的多智能體任務編排引擎
2.4.5 智能體框架能力對比
第3章 智能體系統分層實現
3.1 用戶輸入與多模態交互
3.1.1 用戶輸入處理:文本、語音、圖像的統一接入
3.1.2 多輪上下文與用戶狀態維護
3.1.3 系統接入與設備交互
3.2 意圖識別與任務路由
3.2.1 意圖識別機制:提示工程vs 分類器vs 函數調用
3.2.2 智能體註冊與動態匹配機制
3.2.3 路由模塊實現
3.3 任務規劃與編排
3.3.1 單智能體任務與多智能體任務鏈的區別
3.3.2 自動規劃方法:基於大語言模型的任務分解與鏈路生成
3.3.3 實踐:利用LangGraph 和AutoGen 構建多智能體工作流
3.4 任務執行與工具調用
3.4.1 任務智能體:模型、工具與記憶的組合
3.4.2 工具調用機制:函數註冊、輸出格式、調用規範
3.4.3 系統級執行鏈:並行、條件、循環任務流控制
3.5 模型推理與路由選擇
3.5.1 多模型路由機制:按任務覆雜度自動分發
3.5.2 本地模型與雲端模型混合推理架構
3.5.3 成本優化與性能保障
3.6 記憶管理與反思反饋
3.6.1 記憶系統設計:短期記憶與長期記憶
3.6.2 反思機制:任務失敗回溯與自我修正
3.6.3 系統進化:基於用戶反饋與歷史行為的自學習機制
3.7 系統安全性與可信性保障
3.7.1 幻覺與錯誤響應的識別與抑制
3.7.2 指令攻擊與數據隱私防護機制
3.7.3 可控性與審計追蹤:構建“可信智能體系統”
第4章 扣子智能體構建平臺:功能、能力與典型應用
4.1 平臺定位與設計理念
4.2 扣子的核心功能模塊
4.2.1 智能體創建
4.2.2 知識庫
4.2.3 智能體技能:工具與插件系統
4.2.4 工作流
4.2.5 發布與生態集成
4.3 使用扣子能實現哪些類型的應用
4.3.1 知識型智能體
4.3.2 工具型智能體
4.3.3 創意型智能體
4.3.4 工作流型智能體
4.3.5 服務型智能體
4.4 上手扣子:一鍵創建你的第一個智能體
4.4.1 進入創建界面
4.4.2 輸入描述
4.4.3 編輯與增強智能體
4.4.4 發布
第5章 智能體核心模塊與實踐
5.1 大語言模型調用:從基礎到實踐
5.1.1 大語言模型的定義與作用
5.1.2 調用大語言模型的方式:API 調用、SDK 封裝和框架集成
5.1.3 基礎調用示例:提示工程與常見應用
5.2 工具調用與模型上下文協議
5.2.1 什麼是工具
5.2.2 模型上下文協議簡介
5.2.3 如何將工具掛載到智能體中
5.2.4 案例:調用搜索工具、數據庫及本地函數
5.3 Agent Skills:能力模塊化與執行層抽象
5.3.1 提出背景與設計動機
5.3.2 Agent Skills的定義
5.3.3 Agent Skills分層架構
5.3.4 Skill 聲明文件與能力感知
5.3.5 Agent Skills與Tool / MCP的關系
5.3.6 案例:基於Agent Skills 的自動化內容生成
5.4 智能體之間的協作模式
5.4.1 LangGraph中心化協作
5.4.2 A2A去中心化協作
5.4.3 對比與應用場景
5.4.4 未來展望
5.4.5 A2A實戰
.......
第10章 超級智能體系統實戰:拆解Super Agent
10.1 設計目標
10.2 系統架構
10.3 模型路由器
10.4 多模態與RAG Memory
10.5 案例演示:任務鏈條覆現
10.5.1 任務說明
10.5.2 執行流程
10.5.3 核心代碼示例
10.6 體系分析與啟示
10.6.1 Super Agent的運行流程
10.6.2 關鍵特征與可借鑒設計
10.6.3 系統風險與設計約束
10.6.4 系統優化與擴展建議
第11章 智能體系統的發展趨勢
11.1 面向未來的超級智能體平臺建設
11.1.1 從單智能體到平臺:智能體雲、AgentOS的可能性
11.1.2 構建超級智能體生態:能力市場、記憶共享、行為調度
11.1.3 智能體即服務:平臺化部署路徑與商業模型
11.2 自進化智能體:自動優化與自學習
11.3 多模態具身智能:跨界集成與人機交互
11.4 Agentic Web 和Agent Network Protocol
11.5 x402 支付協議與智能體支付系統:為智能經濟打造的互聯網原生支付協議
11.5.1 支付:智能體世界的基礎設施
11.5.2 x402 支付協議:為AI 時代重建支付層
11.5.3 協議哲學:開放、信任最小化、HTTP原生
11.5.4 技術結構與角色
11.5.5 核心創新:請求即支付
11.5.6 對智能體的意義
11.5.7 展望:從支付協議到智能體貨幣系統
11.6 下一代智能體生態
11.7 智能體賦能的超級個體
參考文獻
