計算機視覺——從理論到實踐(微課版)
魯鵬 周琬婷 朱新山
- 出版商: 人民郵電
- 出版日期: 2025-06-01
- 售價: $359
- 語言: 簡體中文
- ISBN: 7115667438
- ISBN-13: 9787115667434
-
相關分類:
影像辨識 Image-recognition、Computer Vision
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書深入探索計算機視覺的核心技術,圍繞五大關鍵任務展開介紹,即圖像分類、圖像分割、目標檢測、目標跟蹤及三維重建。
本書共9章,分為三篇,即基礎篇、識別篇和重建篇,系統性地引導讀者逐步深入了解計算機視覺的復雜內涵與應用實踐。基礎篇(第1~4章)著重介紹了構成計算機視覺的通用理論與算法,包括但不限於圖像濾波技術的基本原理、邊緣檢測的實現方法、尺度不變特征的提取策略及模型擬合的數學工具等,為後續章節的學習奠定必要的理論與技術基礎。識別篇(第5~7章)深入分析了機器解析圖像內容的高級能力,具體涉及圖像分割、圖像分類、目標檢測與跟蹤的經典算法及模型。重建篇(第8、9章)聚焦於如何從二維圖像數據中復原三維場景結構,詳細闡述了攝像機幾何原理、極幾何的應用、雙目立體視覺等關鍵技術的概念與算法,展現了從圖像像素到三維場景結構的轉換過程。
本書可作為人工智能、智能科學與技術等專業計算機視覺、機器視覺等課程的教材,也可供計算機視覺領域的專業人士(包括開發人員、科技人員和研究學者)參考使用。
作者簡介
魯鵬:
北京郵電大學人工智能學院副教授;2003年7月獲得華中科技大學圖像所碩士學位,2006年7月獲得中國科學院自動化所博士學位,2008年至2010年在北京大學人機交互與多媒體實驗室從事博士後研究工作;在北京郵電大學任教以來,長期從事本科生、研究生計算機視覺課程的教學工作,在B站上講授的計算機視覺相關課程的錄播視頻播放量超過100萬人次,同時,主講的計算機視覺在線慕課已在“學堂在線”上線;教學經驗豐富、成果顯著,出版《計算機視覺——從理論到實踐(微課版)》《計算機視覺基礎》等多部教材。
目錄大綱
【章名目錄】
第 1章 緒論 1
第 2章 線性濾波器 8
第3章 圖像邊緣提取與模型擬合 27
第4章 局部特征提取 56
第5章 圖像分割 81
第6章 圖像檢索與分類 94
第7章 目標檢測與跟蹤 117
第8章 攝像機幾何與標定 144
第9章 三維重建 175
【詳細目錄】
第 1章 緒論 1
1.1 計算機視覺概述 1
1.2 相關學科 2
1.3 發展歷程 3
1.4 應用領域 5
本章小結 7
習題 7
第 2章 線性濾波器 8
2.1 卷積 8
2.1.1 圖像表示與線性濾波 8
2.1.2 卷積的定義 10
2.1.3 卷積的性質 11
2.1.4 卷積示例 11
2.1.5 動手實踐:圖像銳化 13
2.2 圖像去噪 14
2.2.1 噪聲分析 14
2.2.2 中值濾波器 16
2.2.3 動手實踐:去除圖像中的椒鹽噪聲 18
2.2.4 高斯濾波 20
2.2.5 動手實踐:去除圖像中的高斯噪聲 24
本章小結 26
習題 26
第3章 圖像邊緣提取與模型擬合 27
3.1 圖像邊緣與圖像求導 27
3.1.1 邊緣的位置特點 27
3.1.2 圖像導數與梯度 29
3.1.3 高斯一階偏導核 30
3.1.4 動手實踐:圖像求導 33
3.2 邊緣檢測 35
3.2.1 Canny邊緣檢測器 35
3.2.2 動手實踐:車道線檢測 37
3.3 模型擬合 38
3.3.1 最小二乘擬合 38
3.3.2 魯棒擬合 41
3.3.3 RANSAC算法 42
3.3.4 動手實踐:RANSAC直線擬合 45
3.3.5 霍夫變換 47
3.4 動手實踐:硬幣定位 53
本章小結 55
習題 55
第4章 局部特征提取 56
4.1 圖像拼接問題與局部特征 56
4.2 Harris-Laplace檢測器 59
4.2.1 Harris角點檢測器 59
4.2.2 尺度不變理論 65
4.2.3 LoG算子 67
4.3 SIFT特征 72
4.3.1 DoG尺度空間 72
4.3.2 SIFT特征點檢測 74
4.3.3 SIFT特征描述子 75
4.4 動手實踐:圖像拼接 76
本章小結 80
習題 80
第5章 圖像分割 81
5.1 圖像分割概述 81
5.2 人類視覺分組與格式塔理論 82
5.3 基於像素聚類的圖像分割 83
5.3.1 基於K-means的圖像分割 83
5.3.2 基於均值漂移的圖像分割 85
5.3.3 動手實踐:圖像分割 89
本章小結 92
習題 93
第6章 圖像檢索與分類 94
6.1 圖像分類任務概述 94
6.1.1 圖像分類任務的難點 95
6.1.2 圖像分類任務的評價指標 98
6.1.3 數據驅動的圖像分類系統的基本範式 99
6.2 詞袋模型與圖像檢索 100
6.2.1 文本詞袋模型 100
6.2.2 TF-IDF加權 101
6.2.3 視覺詞袋模型 102
6.2.4 動手實踐:基於詞袋模型的圖像檢索 104
6.3 基於詞袋模型的圖像分類 107
6.3.1 線性分類模型 107
6.3.2 多類支持向量機損失 108
6.3.3 模型優化 109
6.3.4 欠擬合與過擬合 110
6.3.5 動手實踐:場景圖像分類 111
本章小結 116
習題 116
第7章 目標檢測與跟蹤 117
7.1 目標檢測任務概述 117
7.2 基於滑動窗口的目標檢測範式 118
7.3 基於AdaBoost的人臉檢測 121
7.3.1 人臉檢測任務概述 121
7.3.2 AdaBoost算法 121
7.3.3 構建弱分類器 122
7.3.4 級聯結構 125
7.3.5 動手實踐:人臉檢測 127
7.4 基於HOG特征的行人檢測 129
7.4.1 行人檢測任務概述 130
7.4.2 HOG特征 130
7.4.3 應用HOG特征實現行人檢測 131
7.4.4 動手實踐:行人檢測 132
7.5 基於光流的運動跟蹤 133
7.5.1 光流計算基本等式 134
7.5.2 Lucas-Kanade光流計算 136
7.5.3 動手實踐:車輛運動跟蹤 138
本章小結 142
習題 142
第8章 攝像機幾何與標定 144
8.1 針孔模型與透鏡 144
8.1.1 針孔攝像機 144
8.1.2 透鏡成像 148
8.2 攝像機幾何 151
8.2.1 齊次坐標 151
8.2.2 坐標系變換和剛體變換 153
8.2.3 一般攝像機的幾何模型 157
8.2.4 透視投影矩陣的性質 161
8.3 攝像機標定 161
8.3.1 投影矩陣估計 161
8.3.2 退化情況 163
8.4 徑向畸變的攝像機標定 164
8.4.1 徑向畸變模型 164
8.4.2 徑向畸變標定 165
8.5 動手實踐:攝像機標定 167
本章小結 173
習題 173
第9章 三維重建 175
9.1 三維重建基礎 175
9.1.1 三角化的概念 175
9.1.2 三角化的線性解法 177
9.1.3 三角化的非線性解法 178
9.2 極幾何與基礎矩陣 179
9.2.1 極幾何 179
9.2.2 本質矩陣與基礎矩陣 180
9.2.3 基礎矩陣估計 182
9.2.4 動手實踐:基礎矩陣估計 184
9.3 雙目立體視覺 190
9.3.1 基於平行視圖的雙目立體視覺 190
9.3.2 圖像校正 194
9.3.3 對應點搜索 197
9.3.4 動手實踐:雙目立體視覺定位 201
本章小結 208
習題 208
參考文獻 210