從零構建AI Agent:大模型驅動的智能體設計與實戰

姚宇航,丁博生

  • 出版商: 電子工業
  • 出版日期: 2026-02-01
  • 售價: $414
  • 語言: 簡體中文
  • ISBN: 7121520656
  • ISBN-13: 9787121520655
  • 相關分類: AI Coding
  • 下單後立即進貨 (約4週~6週)

商品描述

1. 易讀、面向初學者的智能體入門書。

2. 全彩圖展示十大智能體行業級落地案例,Agent Skills和Claude Cowork核心架構圖。

3. 撰寫原則:“理論為本,實踐為用”。

4. 輔助理解:用扣子制作你的第一個智能體。

5. 每章列舉可覆現案例:包括RAG客服智能體,多模態創意生成:文案與設計,自動化編程智能體,個性化教育智能體,多智能體對話系統:基於LangGraph 的遊戲NPC 智能體,實時決策智能體系統實戰:金融決策與交易,醫療健康智能體:輔助診斷與健康管理,法律智能體:輔助合規與法律服務等。

作者簡介

姚宇航,美國卡內基梅隆大學電子與計算機工程博士,師從Carlee Joe-Wong教授,榮獲A.G. Milnes最佳博士論文獎。現任Zoom研究工程師,專註於垂直智能體系統與可擴展AI基礎架構的研發工作。曾在微軟、亞馬遜及多家人工智能初創公司從事研究工作,在分布式學習框架、大規模模型優化與工程化部署方面積累了系統性的實踐經驗。其研究聚焦於聯邦圖學習與多智能體系統,致力於推動分布式學習理論向真實人工智能系統落地,是該領域中兼具理論創新與系統實現能力的代表性研究者之一。在 NeurIPS、KDD、EMNLP、AAAI 等國際人工智能會議發表論文三十余篇,並多次擔任 MLSys、NeurIPS 等會議程序委員會委員。


丁博生,南洋理工大學計算機科學專業博士,AI量化交易公司Calais創始成員、COO,新加坡社科大學客座教授。帶隊發布的海外中文開源大模型及預訓練—微調一體化框架 PandaLLM在學術與工程實踐層面均產生廣泛影響。研究方向為大語言模型與智能體系統,目前專註於探索前沿 AI算法與量化交易、金融系統的深度融合,致力於將大模型與智能體技術轉化為可落地、可規模化的金融應用。

目錄大綱

第1章  智能體發展脈絡

1.1 什麼是智能體:從規則系統到超級智能體

1.2 反應式智能體:決策簡單、響應快速

1.3 計劃式智能體:從BDI 模型到智能體自動規劃

1.4 單智能體:認知框架與大語言模型驅動的任務閉環

1.5 要不要訓練智能體

1.6 多智能體系統:從協作系統到智能生態

第2章  智能體系統架構

2.1 設計原則

2.1.1 用戶友好:降低門檻的第一原則

2.1.2 系統智能:真正理解意圖並完成任務

2.1.3 可擴展性:模塊化帶來的演進能力

2.1.4 高性價比:讓智能體系統真正可用

2.2 六層架構概述:輸入、意圖、規劃、執行、推理、反饋

2.3 智能體系統六層架構調用鏈

2.4 現有智能體框架分析

2.4.1 LangChain:大語言模型驅動的工具調用框架

2.4.2 AutoGen:多智能體協同的任務自動化框架

2.4.3 CrewAI:具備角色分工與團隊結構的智能體編排系統

2.4.4 LangGraph:圖結構驅動的多智能體任務編排引擎

2.4.5 智能體框架能力對比

第3章  智能體系統分層實現

3.1 用戶輸入與多模態交互

3.1.1 用戶輸入處理:文本、語音、圖像的統一接入

3.1.2 多輪上下文與用戶狀態維護

3.1.3 系統接入與設備交互

3.2 意圖識別與任務路由

3.2.1 意圖識別機制:提示工程vs 分類器vs 函數調用

3.2.2 智能體註冊與動態匹配機制

3.2.3 路由模塊實現

3.3 任務規劃與編排

3.3.1 單智能體任務與多智能體任務鏈的區別

3.3.2 自動規劃方法:基於大語言模型的任務分解與鏈路生成

3.3.3 實踐:利用LangGraph 和AutoGen 構建多智能體工作流

3.4 任務執行與工具調用

3.4.1 任務智能體:模型、工具與記憶的組合

3.4.2 工具調用機制:函數註冊、輸出格式、調用規範

3.4.3 系統級執行鏈:並行、條件、循環任務流控制

3.5 模型推理與路由選擇

3.5.1 多模型路由機制:按任務覆雜度自動分發

3.5.2 本地模型與雲端模型混合推理架構

3.5.3 成本優化與性能保障

3.6 記憶管理與反思反饋

3.6.1 記憶系統設計:短期記憶與長期記憶

3.6.2 反思機制:任務失敗回溯與自我修正

3.6.3 系統進化:基於用戶反饋與歷史行為的自學習機制

3.7 系統安全性與可信性保障

3.7.1 幻覺與錯誤響應的識別與抑制

3.7.2 指令攻擊與數據隱私防護機制

3.7.3 可控性與審計追蹤:構建“可信智能體系統”

第4章  扣子智能體構建平臺:功能、能力與典型應用

4.1 平臺定位與設計理念

4.2 扣子的核心功能模塊

4.2.1 智能體創建

4.2.2 知識庫

4.2.3 智能體技能:工具與插件系統

4.2.4 工作流

4.2.5 發布與生態集成

4.3 使用扣子能實現哪些類型的應用

4.3.1 知識型智能體

4.3.2 工具型智能體

4.3.3 創意型智能體

4.3.4 工作流型智能體

4.3.5 服務型智能體

4.4 上手扣子:一鍵創建你的第一個智能體

4.4.1 進入創建界面

4.4.2 輸入描述

4.4.3 編輯與增強智能體

4.4.4 發布

第5章  智能體核心模塊與實踐

5.1 大語言模型調用:從基礎到實踐

5.1.1 大語言模型的定義與作用

5.1.2 調用大語言模型的方式:API 調用、SDK 封裝和框架集成

5.1.3 基礎調用示例:提示工程與常見應用

5.2 工具調用與模型上下文協議

5.2.1 什麼是工具

5.2.2 模型上下文協議簡介

5.2.3 如何將工具掛載到智能體中

5.2.4 案例:調用搜索工具、數據庫及本地函數

5.3 Agent Skills:能力模塊化與執行層抽象

5.3.1 提出背景與設計動機

5.3.2 Agent Skills的定義

5.3.3 Agent Skills分層架構

5.3.4 Skill 聲明文件與能力感知

5.3.5 Agent Skills與Tool / MCP的關系

5.3.6 案例:基於Agent Skills 的自動化內容生成

5.4 智能體之間的協作模式

5.4.1 LangGraph中心化協作

5.4.2 A2A去中心化協作

5.4.3 對比與應用場景

5.4.4 未來展望

5.4.5 A2A實戰

.......

第10章  超級智能體系統實戰:拆解Super Agent

10.1 設計目標

10.2 系統架構

10.3 模型路由器

10.4 多模態與RAG Memory

10.5 案例演示:任務鏈條覆現

10.5.1 任務說明

10.5.2 執行流程

10.5.3 核心代碼示例

10.6 體系分析與啟示

10.6.1 Super Agent的運行流程

10.6.2 關鍵特征與可借鑒設計

10.6.3 系統風險與設計約束

10.6.4 系統優化與擴展建議

第11章  智能體系統的發展趨勢

11.1 面向未來的超級智能體平臺建設

11.1.1 從單智能體到平臺:智能體雲、AgentOS的可能性

11.1.2 構建超級智能體生態:能力市場、記憶共享、行為調度

11.1.3 智能體即服務:平臺化部署路徑與商業模型

11.2 自進化智能體:自動優化與自學習

11.3 多模態具身智能:跨界集成與人機交互

11.4 Agentic Web 和Agent Network Protocol

11.5 x402 支付協議與智能體支付系統:為智能經濟打造的互聯網原生支付協議

11.5.1 支付:智能體世界的基礎設施

11.5.2 x402 支付協議:為AI 時代重建支付層

11.5.3 協議哲學:開放、信任最小化、HTTP原生

11.5.4 技術結構與角色

11.5.5 核心創新:請求即支付

11.5.6 對智能體的意義

11.5.7 展望:從支付協議到智能體貨幣系統

11.6 下一代智能體生態

11.7 智能體賦能的超級個體

參考文獻