智能體開發技術(Python+FastAPI版)

蝸牛學苑

  • 出版商: 人民郵電
  • 出版日期: 2026-01-01
  • 售價: $360
  • 語言: 簡體中文
  • ISBN: 7115685746
  • ISBN-13: 9787115685742
  • 相關分類: AI Coding
  • 尚未上市,歡迎預購

相關主題

商品描述

本書較為全面地講解AI智能體開發的關鍵技術,包括提示詞工程、Function Calling、MCP、RAG知識庫、語音識別、人臉識別、大模型應用等,同時結合蝸牛學苑的自研項目和教學案例,將所有技術融入項目中,以項目驅動的方式進行講解,以便讀者更好地理解AI智能體開發技術。本書第1章主要講解在Python中對接各類大模型,以及智能體開發所使用的Function Calling技術和MCP技術;第2章主要講解FastAPI開發框架;第3章主要講解基於網頁對話來實現AI問答功能;第4章主要講解每日新聞摘要功能的實現;第5章主要講解智能語音記分功能的實現;第6章主要講解智能考勤功能的實現;第7章主要講解AI智慧課堂功能的實現;第8章主要講解智能在線客服功能的實現。

本書可以作為高等院校計算機應用技術、軟件技術、人工智能技術應用等相關專業的教材,也可以作為AI智能體開發愛好者的自學用書。

作者簡介

鄧強,蝸牛學苑創始人,資深講師,獨立咨詢顧問,四川大學碩士,21年軟件研發及管理經驗,軟件架構師,精通各類軟件開發技術,目前專註於AI領域的課題研究。曾為中原銀行、南天佳信、深圳移動、大唐軟件、華夏基金、聯想集團等30余家企業提供研發咨詢及企業內訓服務。從事培訓事業以來教授學生數萬,遍布國內外各大IT公司。教學嚴謹,原理講解透徹。

目錄大綱

第 1章 大模型與智能體開發 1

本章引言 2

1.1 對接雲端大模型接口 2

1.1.1 準備PyCharm開發環境 2

1.1.2 對接通義千問 4

1.1.3 對接DeepSeek 7

1.1.4 對接OpenRouter平臺 8

1.2 本地部署大模型 11

1.2.1 安裝與配置Ollama 11

1.2.2 拉取並測試大模型 12

1.2.3 CherryStudio對接Ollama 13

1.2.4 調用Ollama API 14

1.3 AI智能體開發技術 17

1.3.1 Function Calling技術 17

1.3.2 MCP技術 19

1.3.3 使用Python調用Function

Calling 22

1.3.4 使用Python開發MCP服務 24

第 2章 FastAPI開發框架 26

本章引言 27

2.1 FastAPI快速使用 27

2.1.1 快速入門 27

2.1.2 URL及參數 30

2.1.3 RESTful接口 30

2.1.4 JSON請求體 31

2.1.5 會話管理 33

2.1.6 文件上傳 34

2.1.7 數據驗證 36

2.1.8 異步編程 36

2.2 Jinja2模板引擎 38

2.2.1 模板引擎的作用 38

2.2.2 Jinja2快速使用 40

2.2.3 Jinja2核心語法 41

2.2.4 過濾器 42

2.2.5 應用示例 43

2.3 SQLModel數據處理 44

2.3.1 利用PyMySQL操作數據庫 44

2.3.2 SQLModel核心操作 45

2.3.3 SQLModel覆雜查詢 47

2.4 FastAPI對接大模型 47

2.4.1 基於OpenAI庫對接 47

2.4.2 處理流式響應 48

2.4.3 前端JavaScript對接 49

第3章 AI問答 54

本章引言 55

3.1 功能與設計分析 55

3.1.1 核心功能列表 55

3.1.2 整體實現思路 55

3.2 前後端準備工作 58

3.2.1 前端界面實現 58

3.2.2 靜態目錄設置 60

3.2.3 FastAPI多模塊 60

3.3 文本問答功能 61

3.3.1 後端代碼實現 61

3.3.2 前端代碼實現 62

3.3.3 聯網搜索功能 64

3.3.4 開發MCP客戶端 66

3.3.5 函數調用增強 69

3.4 圖像識別與生成 71

3.4.1 圖像識別功能 71

3.4.2 圖像識別前端 72

3.4.3 圖像生成功能 75

第4章 每日新聞摘要 78

本章引言 79

4.1 功能與設計分析 79

4.1.1 核心功能列表 79

4.1.2 整體實現思路 80

4.2 基礎功能實現 81

4.2.1 前端界面布局 81

4.2.2 數據表結構 84

4.2.3 BeautifulSoup庫 84

4.2.4 爬取標題與超鏈接 86

4.2.5 獲取和摘要新聞 87

4.2.6 前端界面渲染 88

4.3 擴展功能實現 90

4.3.1 新聞分類瀏覽 90

4.3.2 按日期瀏覽新聞 91

4.3.3 定時更新新聞 92

第5章 智能語音記分 94

本章引言 95

5.1 語音識別與合成 95

5.1.1 本地錄音文件識別 95

5.1.2 本地實時語音識別 96

5.1.3 阿裏雲語音識別 97

5.1.4 WebSocket通信 99

5.1.5 JavaScript語音識別 102

5.1.6 語音合成與播放 106

5.2 Web版語音記分 109

5.2.1 功能與實現思路 109

5.2.2 前端界面實現 110

5.2.3 前端JavaScript代碼實現 112

5.2.4 後臺代碼實現 116

5.3 Python版語音記分 116

5.3.1 tkinter繪制界面 116

5.3.2 語音喚醒功能 118

5.3.3 完整功能代碼 120

第6章 智能考勤 124

本章引言 125

6.1 需求與設計分析 125

6.1.1 核心功能列表 125

6.1.2 整體實現思路 125

6.1.3 face_recognition的用法 126

6.2 OpenCV版本實現 128

6.2.1 利用OpenCV采集攝像頭

數據 128

6.2.2 人臉數據存儲與對比 128

6.2.3 設計智能考勤系統數據表 130

6.2.4 實現新增人臉數據功能 131

6.2.5 實現人臉考勤功能 135

6.2.6 實現Web端考勤數據查詢功能 137

6.3 Web端版本實現 140

6.3.1 前端采集攝像頭數據 140

6.3.2 基於WebSocket進行實時檢測 143

6.3.3 基於前端界面進行考勤 146

6.3.4 打卡成功並顯示考勤記錄 148

6.4 活體檢測防作弊 149

6.4.1 活體檢測概述 149

6.4.2 人臉68個關鍵特征點 150

6.4.3 指令動作檢測原理 152

6.4.4 活體檢測核心代碼 154

6.4.5 前端連續截圖測試 156

6.4.6 活體檢測與考勤 157

第7章 AI智慧課堂 161

本章引言 162

7.1 功能與設計分析 162

7.1.1 核心功能列表 162

7.1.2 整體實現思路 163

7.1.3 數據庫設計 164

7.2 主體功能開發 166

7.2.1 視頻文件預處理 166

7.2.2 生成課堂筆記 171

7.2.3 生成思維導圖 174

7.2.4 生成視頻關鍵幀 176

7.2.5 拓展知識引用 178

7.3 出題和考試功能 179

7.3.1 生成考題 179

7.3.2 前端渲染考題 181

7.3.3 提交試卷並評分 184

7.4 登錄與Token鑒權 187

7.4.1 Token處理機制 187

7.4.2 加密與解密處理 188

7.4.3 登錄與Token認證 189

7.4.4 前後端校驗處理 190

7.5 定時任務處理 191

第8章 智能在線客服 193

本章引言 194

8.1 功能與設計分析 194

8.1.1 RAG與向量數據庫 194

8.1.2 核心功能列表 197

8.1.3 整體實現思路 198

8.2 LlamaIndex框架應用 199

8.2.1 LlamaIndex概述 199

8.2.2 LlamaIndex核心操作 199

8.2.3 文檔分段與檢索 201

8.2.4 定義提示詞模板 203

8.2.5 處理流式響應 204

8.2.6 文檔分段策略 205

8.2.7 檢索結果重排序 209

8.3 向量數據庫 210

8.3.1 Chroma的核心操作 210

8.3.2 自行分段實現RAG 213

8.3.3 Chroma的其他操作 214

8.3.4 LlamaIndex整合Chroma 215

8.3.5 Qdrant的核心操作 217

8.3.6 LlamaIndex整合Qdrant 218

8.4 項目功能實現 219

8.4.1 Web前端實現 219

8.4.2 用戶端功能實現 221

8.4.3 文檔上傳並建立索引 222

8.4.4 文檔信息處理 224

8.4.5 文檔分段內容查看 226

8.5 擴展功能優化 227

8.5.1 聯網搜索並回覆 227

8.5.2 聯系方式自動通知 228

8.5.3 保存對話記錄 231

8.5.4 對接雲端知識庫 233

8.5.5 使用大模型進行分段 235