大學人工智能通識基礎

王克剛

  • 出版商: 電子工業
  • 出版日期: 2026-01-01
  • 售價: $354
  • 語言: 簡體中文
  • 頁數: 232
  • ISBN: 7121521601
  • ISBN-13: 9787121521607
  • 相關分類: DeepLearning
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本教材系統涵蓋人工智能的基本知識與核心技術應用,通過四大知識模塊構建從基礎理論到實踐應用的完整學習體系。模塊1梳理人工智能的發展歷程、理論基礎與社會影響,幫助學生建立整體性認知,培養技術理解能力與倫理意識。模塊2聚焦計算機視覺,解析圖像數學表示、卷積神經網絡(CNN)模型及生成式人工智能的基本原和實踐應用。模塊3深入自然語言處理,從文本表示演進到Transformer架構,結合GPT等預訓練模型,通過情感分析、文本生成項目實踐強化應用能力。模塊4闡述語音技術,包括語音信號處理、深度學習模型及生成式人工智能語音合成,結合智能家居等場景剖析人工智能實用價值與挑戰。本教材兼顧基本理論與前沿趨勢,註重批判性思維培養,以"構建人工智能通識認知,銜接技術原理與實踐應用”為核心目標,面向人工智能入門學習者,可作為高等院校人工智能通識課程的教材,也可供其他讀者學習使用。

目錄大綱

目 錄
模塊1 人工智能:從技術演進到社會重塑的探索之旅
第1章 人工智能的發展歷程與概念基礎 4
1.1 人工智能的概念界定與基本特征 4
1.1.1 人工智能的概念界定 4
1.1.2 人工智能的基本特征 6
1.2 全球人工智能發展的關鍵裏程碑 9
1.2.1 概念起源與學科確立(20世紀40年代—50年代) 9
1.2.2 早期發展與第一次人工智能熱潮(20世紀50年代—60年代) 10
1.2.3 第一次人工智能寒冬(20世紀70年代—80年代初) 11
1.2.4 專家系統與第二次人工智能熱潮(20世紀80年代) 12
1.2.5 第二次人工智能寒冬(20世紀80年代末—90年代初) 13
1.2.6 機器學習崛起與突破(20世紀90年代—21世紀) 13
1.2.7 深度學習革命與第三次AI熱潮(2010年至今) 13
1.3 中國人工智能的發展歷程 14
1.3.1 技術跟蹤期(20世紀80年代—2010年) 14
1.3.2 快速發展期(2011—2016年) 15
1.3.3 戰略引領期(2017年至今) 15
1.4 人工智能的理論學派 16
1.4.1 符號主義 16
1.4.2 聯結主義 17
1.4.3 行為主義 19
1.4.4 三大學派的融合趨勢 20
1.5 人工智能的技術體系 21
1.5.1 算法基礎層 22
1.5.2 模型框架層 23
1.5.3 技術棧層 25
1.6 人工智能的形態與體系分類 27
1.6.1 按能力範圍分類 27
1.6.2 按智能層級分類 28
1.6.3 按存在形態分類 29
第2章 人工智能的典型應用場景 31
2.1 感知智能應用:計算機視覺與智能語音 31
2.1.1 計算機視覺技術原理與應用 31
2.1.2 智能語音技術原理與應用 33
2.2 認知智能應用:自然語言處理與推薦系統 35
2.2.1 自然語言處理技術與應用 35
2.2.2 推薦系統技術與應用 37
2.3 決策智能應用:自動駕駛與AIGC 39
2.3.1 自動駕駛技術原理與應用 39
2.3.2 AIGC技術原理與應用 40
第3章 人工智能的未來發展趨勢 44
3.1 技術突破方向:從量子人工智能到多模態大模型 44
3.1.1 量子人工智能 44
3.1.2 多模態大模型 45
3.1.3 小模型 47
3.2 應用拓展路徑:從專用人工智能到通用人工智能 48
3.2.1 智能體 48
3.2.2 人工智能專家系統 50
3.2.3 人工智能與機器人融合 51
3.3 社會政策演進:從技術發展到生態構建 53
3.3.1 立法與監管完善 53
3.3.2 倫理與可持續發展受到重視 54
3.3.3 基礎建設與生態、開源創新活躍 54
3.4 人工智能的挑戰爭議與規範路徑 55
3.4.1 魯棒性與可靠性挑戰 55
3.4.2 可解釋性與透明度挑戰 56
3.4.3 數據質量與隱私挑戰 57
3.5 倫理與社會爭議:風險與反思 57
3.5.1 算法偏見與公平性爭議 57
3.5.2 就業影響與勞動力轉型 58
3.5.3 人機關系與人類主體性爭議 59
3.6 規範與治理路徑:從個體到系統 60
3.6.1 技術層面的規範路徑 60
3.6.2 行業層面的自律與標準 61
3.6.3 政策與法律層面的監管框架 61
模塊1習題 62
模塊2 人工智能如何看懂世界:從計算機視覺到生成式人工智能的演進與應用
第4章 計算機視覺基礎理論與應用 68
4.1 計算機視覺的定義與發展歷程 68
4.2 核心應用領域與技術價值 69
4.3 典型應用案例深度剖析 75
4.3.1 醫學影像輔助診斷系統 75
4.3.2 智能交通監控與管理系統 76
4.3.3 工業產品表面缺陷檢測系統 77
4.3.4 智能病蟲害監測系統 78
第5章 圖像表示與處理技術基礎 80
5.1 圖像的數學表示方法 80
5.2 圖像預處理關鍵技術 82
5.2.1 幾何變換 83
5.2.2 圖像增強 84
5.2.3 去噪 85
5.2.4 顏色空間轉換 87
5.2.5 形態學操作 87
5.3 卷積神經網絡(CNN)基本原理 88
5.3.1 CNN的數學原理 88
5.3.2 CNN的層級結構 91
5.3.3 經典CNN架構 91
5.3.4 三維卷積與轉置卷積 93
5.4 經典CNN架構的網絡結構 94
5.4.1 LeNet-5:CNN的奠基之作 94
5.4.2 AlexNet:深度學習革命的引爆點 94
5.4.3 Inception(GoogLeNet):多尺度特征融合 95
5.4.4 VGGNet:深度與簡潔的典範 96
5.4.5 ResNet:深度殘差學習 97
5.4.6 其他經典CNN架構 98
5.5 CNN訓練過程與優化策略 99
5.5.1 數據準備與預處理 99
5.5.2 模型初始化 99
5.5.3 損失函數 100
5.5.4 優化器 101
5.5.5 前向傳播 102
5.5.6 反向傳播 102
5.5.7 參數更新 103
5.5.8 模型評估與測試 103
第6章 圖像識別與目標檢測技術 104
6.1 圖像識別的技術路線與流程 104
6.1.1 傳統圖像識別技術路線 104
6.1.2 基於深度學習的圖像識別技術路線 106
6.1.3 圖像識別的基本流程 107
6.1.4 圖像識別的關鍵技術挑戰 107
6.2 目標檢測主流算法與架構 108
6.2.1 兩階段檢測器 108
6.2.2 單階段檢測器 109
6.2.3 基於Transformer的檢測器 110
6.2.4 主流算法對比與選型 111
6.3 性能評估指標與優化策略 111
6.3.1 綜合評價指標體系 112
6.3.2 模型層面優化策略 112
6.3.3 數據層面優化策略 112
6.3.4 工程化部署優化 113
6.3.5 系統級優化策略 113
第7章 生成式人工智能圖像生成技術 114
7.1 生成對抗網絡(GAN)的原理與架構 114
7.1.1 GAN的基本結構與工作原理 114
7.1.2 GAN的改進模型與技術突破 114
7.1.3 GAN的應用場景與局限性 115
7.2 擴散模型的原理與應用 116
7.2.1 擴散模型的基本原理 116
7.2.2 擴散模型的關鍵技術突破 116
7.2.3 擴散模型的應用場景 117
7.3 生成式人工智能的創新應用模式 118
7.3.1 多模態內容生成與創作 118
7.3.2 人機協同設計與創作 118
7.3.3 個性化與定制化服務 118
7.3.4 產業級應用與流程重構 119
7.4 計算機視覺技術的演進與未來展望 119
模塊2習題 121
模塊3 人工智能如何讀懂世界:從自然語言處理到生成式人工智能的深度解析
第8章 自然語言處理技術的演進 126
8.1 自然語言處理的定義與研究範疇 126
8.2 自然語言處理的發展歷程與技術突破 127
8.3 自然語言的應用場景與教育價值 128
第9章 文本表示與處理技術基礎 131
9.1 文本的離散表示 131
9.2 文本的分布式表示:詞向量 134
9.3 文本預處理的標準化流程 137
9.4 循環神經網絡(RNN)的結構與原理 141
9.5 長短期記憶網絡(LSTM)的門控機制 143
9.6 循環神經網絡的變體與應用場景 146
第10章 Transformer架構開啟序列建模新時代 149
10.1 Transformer架構的誕生背景與技術變革 149
10.2 Transformer的整體架構與自註意力機制 149
10.2.1 自註意力機制:信息關聯的“智能雷達” 151
10.2.2 多頭自註意力:多視角的“分組討論” 152
10.2.3 位置編碼:給詞語“貼坐標牌” 153
10.3 Transformer編碼器與解碼器 153
10.4 Transformer架構的應用與影響 155
10.4.1 NLP領域:從理解到生成的全面突破 155
10.4.2 計算機視覺:從卷積到自註意力的跨越 155
10.4.3 多模態任務:跨領域的“語義橋梁” 156
10.4.4 其他領域:生物、語音與推薦系統 156
10.5 動手理解Transformer架構 157
10.5.1 簡化模型實踐:用代碼感受核心流程 157
10.5.2 註意力可視化工具:直觀“看見”關註重點 158
10.5.3 Transformer架構的挑戰與未來:效率與創新 158
第11章 文本分類與情感分析:語言理解的實踐 160
11.1 文本分類的完整技術流程 160
11.2 情感分析的核心技術與實現方法 163
11.3 文本分類模型的評估與優化 167
11.3.1 文本分類模型的評估 167
11.3.2 文本分類模型的優化 169
第12章 生成式人工智能與預訓練模型:從理解到創作 172
12.1 預訓練模型的範式革命:從BERT到GPT 172
12.2 生成式文本創作的技術原理 174
12.3 AIGC在內容創作中的應用實踐 177
模塊3習題 183
模塊4 人工智能如何聽懂世界:從語音識別到生成式人工智能語音合成
第13章 語音識別基礎理論與技術演進 187
13.1 語音識別的定義與內涵 187
13.2 語音識別技術發展歷程 188
13.2.1 早期探索階段(20世紀50年代—80年代):孤立詞識別的初步突破 188
13.2.2 統計模型階段(20世紀80年代—21世紀10年代):GMM-HMM模型
的主導地位 189
13.2.3 深度學習階段(2011年至今):端到端模型的革命性突破 189
13.3 語音識別核心技術框架 190
第14章 語音信號處理技術基礎與深度學習技術應用 192
14.1 語音信號的基本特征 192
14.1.1 時域特征 192
14.1.2 頻域特征 193
14.1.3 時頻域特征 193
14.2 語音信號預處理關鍵技術 194
14.2.1 預加重 194
14.2.2 分幀 195
14.2.3 加窗 195
14.3 語音特征提取方法 196
14.4 面向語音處理的主流深度學習模型 197
14.5 模型訓練與優化技術 198
14.5.1 數據準備與增強 198
14.5.2 損失函數設計 199
14.5.3 優化算法與訓練策略 199
14.5.4 模型壓縮與優化 199
14.6 典型應用場景 200
第15章 語音合成技術基本原理與生成式人工智能語音合成 202
15.1 語音合成技術基本原理與分類 202
15.2 神經語音合成技術演進 203
15.3 主流神經語音合成系統架構解析 204
15.4 神經聲碼器技術 206
15.4.1 神經聲碼器WaveGlow 206
15.4.2 神經聲碼器MelGAN 207
15.5 生成式人工智能語音合成創新應用 207
15.5.1 零樣本音色復刻技術 207
15.5.2 多語言與跨語言語音合成 209
15.5.3 生成式人工智能語音合成技術的創新應用 211
第16章 語音識別與合成技術的挑戰與未來趨勢 213
16.1 當前核心技術挑戰 213
16.1.1 噪聲環境魯棒性不足 213
16.1.2 實時性與計算效率難以平衡 214
16.1.3 倫理與安全風險 215
16.2 未來技術發展方向 216
16.2.1 多模態語音交互 216
16.2.2 低資源語言與方言支持 216
16.2.3 可持續人工智能與邊緣計算 217
16.2.4 情感語音交互 217
16.3 教育與社會影響 217
16.3.1 教育變革:個性化學習助手與無障礙教育 218
16.3.2 文化傳承:方言保護與多語言傳播 218
16.3.3 內容創作革命:人人都是創作者 218
模塊4習題 219

最後瀏覽商品 (19)