計算機視覺度量深入解析 (Computer Vision Metrics Survey, Taxonomy, and Analysis) 计算机视觉度量深入解析

[美]Scott Krig

買這商品的人也買了...

相關主題

商品描述

<內容簡介>

計算機視覺作為人工智能的一個重要分支,目前已經廣泛應用於智能駕駛、機器人、生物識別等眾多領域。本書對計算機視覺特徵描述子的性質進行了分類,並給出了計算機視覺處理流程的一般性框架。同時,本書也對目前較新的計算機視覺技術進行了介紹,這些技術包括3D深度感知方法、稀疏編碼、捲積神經網絡、深度學習等。
本書針對的讀者為從事計算機視覺的工程技術人員、研究人員等。讀者可根據不同的應用,利用本書提供的知識來選擇合適的特徵描述子。本書將按各種魯棒性屬性來理解各類計算機視覺的特徵描述子,讀者在閱讀本書時要具備一定的圖像處理的基礎知識。

<章節目錄>

第1章圖像的獲取和表示1
 1.1圖像傳感器技術1
 1.1.1傳感器材料2
 1.1.2傳感器光電二極管元件3
 1.1.3傳感器配置:馬賽克、Faveon和BSI 3
 1.1.4動態範圍和噪聲5
 1.1 .5傳感器處理5
 1.1.6去馬賽克6
 1.1.7壞像素的校正6
 1.1.8顏色和照明校正6
 1.1.9幾何校正7
 1.2攝像機和計算成像7
 1.2.1計算成像概述7
 1.2.2單像素的攝像頭計算8
 1.2.3二維可計算攝像機9
 1.2.4三維深度的攝像機系統10
 1.3三維深度處理21
 1.3.1方法概述21
 1.3.2深度感知和處理中存在的問題22
 1.3.3單目深度處理27
 1.4三維表示:體元、深度圖、網格和點雲31
 1.5總結32
第2章圖像預處理33
 2.1圖像處理概述33
 2.2圖像預處理要解決的問題34
 2.2.1計算機視覺的流程和圖像預處理34
 2.2.2圖像校正36
 2.2.3圖像增強36
 2.2.4為特徵提取準備圖像37
 2.3圖像處理方法分類41
 2.3.1點運算42
 2.3.2直線運算42
 2.3.3區域運算42
 2.3.4算法42
 2.3.5數據轉換43
 2.4色度學43
 2.4.1色彩管理系統概述44
 2.4.2光源、白點、黑點和中性軸44
 2.4.3設備色彩模型45
 2.4.4顏色空間與色彩感知45
 2.4.5色域映射與渲染目的46
 2.4.6色彩增強的實際考慮47
 2.4.7色彩的準確度與精度48
 2.5空間濾波48
 2.5.1捲積濾波與檢測48
 2.5. 2核濾波與形狀選擇50
 2.5.3點濾波51
 2.5.4噪聲與偽像濾波52
 2.5.5積分圖與盒式濾波器53
 2.6邊緣檢測器54
 2.6.1核集合: Sobel, Scharr, Prewitt, Roberts, Kirsch, Robinson和Frei-Chen 54
 2.6.2 Canny檢測器55
 2.7變換濾波、Fourier變換及其他56
 2.7.1 Fourier變換56
 2.7.2其他變換58
 2.8形態學與分割59
 2.8.1二值形態學59
 2.8.2灰度和彩色形態學61
 2.8.3形態學優化和改進61
 2.8.4歐氏距離映射61
 2.8.5超像素分割62
 2.8.6深度圖分割63
 2.8.7色彩分割64
 2.9閾值化64
 2.9.1全局閾值化65
 2.9.2局部閾值化68
 2.10總結69
第3章全局特徵和區域特徵70
 3.1視覺特徵的歷史概述70
 3.1.1核心思想:全局、區域和局部71
 3.1. 2紋理分析73
 3.1.3統計方法76
 3.2紋理區域度量77
 3.2.1邊緣度量77
 3.2.2互相關和自相關79
 3.2.3 Fourier頻譜、小波和基簽名79
 3.2.4共生矩陣和Haralick特徵80
 3.2.5 Laws紋理度量89
 3.2.6 LBP局部二值模式90
 3.2.7動態紋理91
 3.3統計區域度量91
 3.3.1圖像矩特徵92
 3.3.2點度量特徵92
 3.3.3全局直方圖94
 3.3. 4局部區域直方圖94
 3.3.5散點圖和3D直方圖95
 3.3.6多分辨率和多尺度直方圖97
 3.3.7徑向直方圖98
 3.3.8輪廓或邊緣直方圖99
 3.4基空間度量99
 3.4.1 Fourier描述101
 3.4.2 Walsh-Hadamard變換102
 3.4.3 HAAR變換103
 3.4.4斜變換103
 3.4.5 Zernike多項式103
 3.4.6導向濾波器104
 3.4.7 Karhunen-Loeve變換與Hotelling變換104
 3.4.8小波變換和Gabor濾波器105
 3.4.9 Hough變換與Radon變換106
 3.5總結108
第4章局部特徵設計、分類和學習109
 4.1局部特徵109
 4.1.1檢測器、興趣點、關鍵點、錨點、標註110
 4.1.2描述子、特徵描述、特徵提取110
 4.1.3稀疏局部模式方法111
 4.2局部特徵屬性111
 4.2.1選擇特徵描述子和興趣點111
 4.2.2特徵描述子和特徵匹配112
 4.2.3好特徵的標準112
 4.2.4可重複性,相對於困難的查找算容易113
 4.2.5判別性與非判別性114
 4.2.6相對和絕對位置114
 4.2.7匹配代價和一致性114
 4.3距離函數115
 4.3.1關於距離函數的早期研究成果115
 4.3.2歐氏或笛卡兒距離度量116
 4.3.3網格距離度量118
 4.3.4基於統計學的差異性度量119
 4.3.5二值或布爾距離度量120
 4.4描述子的表示121
 4.4.1坐標空間和復數空間121
 4.4.2笛卡兒坐標121
 4.4.3極坐標和對數極坐標121
 4.4.4徑向坐標122
 4.4. 5球面坐標122
 4.4.6 Gauge坐標122
 4.4.7多元空間和多模數據122
 4.4.8特徵金字塔123
 4.5描述子的密度123
 4.5.1丟棄興趣點和描述子124
 4.5.2稠密與稀疏特徵描述124
 4.6描述子形狀拓撲125
 4.6.1關聯性模板125
 4.6.2塊和形狀125
 4.6.3對像多邊形127
 4.7局部二值描述與點對模式128
 4.7.1 FREAK視網膜模式129
 4.7.2 Brisk模式130
 4.7.3 ORB和BRIEF模式131
 4.8描述子判別性131
 4.8.1譜的判別性132
 4.8.2區域、形狀和模式的判別性133
 4.8.3幾何判別因素133
 4.8.4通過特徵可視化來評價判別性134
 4.8.5精度與可跟蹤136
 4.8.6精度優化、子區域重疊、Gaussian權重和池化138
 4.8.7亞像素精度138
 4.9搜索策略與優化139
 4.9.1密集搜索139
 4.9.2網格搜索139
 4.9.3多尺度金字塔搜索140
 4.9.4尺度空間和圖像金字塔140
 4.9.5特徵金字塔142
 4.9.6稀疏預測搜索與跟蹤142
 4.9.7跟蹤區域限制搜尋143
 4.9.8分割限制搜索143
 4.9 .9深度或Z限制搜索143
 4.10計算機視覺、模型和結構144
 4.10.1特徵空間144
 4.10.2對像模型145
 4.10.3約束146
 4.10.4選擇檢測器和特徵146
 4.10.5訓練概述147
 4.10. 6特徵和對象的分類148
 4.10.7特徵學習、稀疏編碼和捲積網絡154
 4.11總結158
第5章特徵描述屬性的分類學159
 5.1特徵描述子系列160
 5.2計算機視覺分類學方面的早期研究成果161
 5.3魯棒性和精度161
 5.4通用的魯棒性分類學162
 5.4.1光照163
 5.4.2顏色準則163
 5.4.3不完全性164
 5.4.4分辨率和精度164
 5.4.5幾何失真165
 5.4. 6效率變量、費用和效益165
 5.4.7判別性和唯一性165
 5.5通用的視覺度量分類學166
 5.5.1特徵描述子族168
 5.5.2頻譜維度168
 5.5.3頻譜類型168
 5.5.4興趣點171
 5.5.5存儲格式171
 5.5.6數據類型172
 5.5.7描述子內存172
 5.5.8特徵形狀173
 5.5.9特徵模式173
 5.5.10特徵密度174
 5.5.11特徵搜索方法174
 5.5.12模式對採樣175
 5.5.13模式區域大小176
 5.5.14距離函數176
 5.6特徵度量評估177
 5.6.1效率變量、成本和效益177
 5.6.2圖像重建的效率度量178
 5.6.3特徵度量評估舉例178
 5.7總結180
第6章興趣點檢測與特徵描述子研究181
 6.1興趣點調整181
 6.2興趣點概念182
 6.3興趣點方法概述184
 6.3.1 Laplacian和Gaussian -Laplacian 185
 6.3.2 Moravac角點檢測器185
 6.3.3 Harris方法、Harris-Stephens、Shi-Tomasi以及Hessian類型的檢測器186
 6.3.4 Hessian矩陣檢測器和Hessian-Laplace 186
 6.3.5 Gaussian差187
 6.3.6顯著性區域187
 6.3.7 SUSAN、Trajkovic以及Hedly 187
 6.3.8 Fast、Faster以及AGHAST 188
 6.3.9局部曲率方法189
 6.3.10形態興趣區域189
 6.4特徵描述子介紹190
 6.4.1局部二值描述子190
 6.4.2 Census 197
 6.4.3 BRIEF 198
 6.4. 4 ORB 199
 6.4.5 BRISK 200
 6.4.6 FREAK 201
 6.5譜描述子202
 6.5.1 SIFT 202
 6.5.2 SIFT-PCA 206
 6.5.3 SIFT-GLOH 207
 6.5.4改進的SIF-SIFER 207
 6.5.5 SIFT CS-LBP改造208
 6.5.6 RootSIFT改造208
 6.5.7 CenSurE和STAR 209
 6.5.8相關模板210
 6.5.9 HAAR特徵212
 6.5.10使用類HAAR特徵的Viola Jones算法213
 6.5.11 SURF 214
 6.5.12其他SURF算法215
 6.5.13梯度直方圖及變種216
 6.5.14 PHOG和相關方法217
 6.5.15 Daisy和O-Daisy 218
 6.5.16 CARD 219
 6.5.17具有魯棒性的快速特徵匹配221
 6.5.18 RIFF和CHOG 222
 6.5.19鏈碼直方圖223
 6.5.20 D-NETS 224
 6.5.21局部梯度模式225
 6.5.22局部相位量化225
 6.6基空間描述子226
 6.6.1傅里葉描述子227
 6.6. 2用其他基函數來構建描述子228
 6.6.3稀疏編碼方法228
 6.7多邊形形狀描述229
 6.7.1 MSER方法229
 6.7.2針對斑點和多邊形的物體形狀度量230
 6.7.3形狀上下文233
 6.8 3D、4D 、體積以及多模態描述子234
 6.8.1 3D HOG 235
 6.8.2 HON 4D 235
 6.8.3 3D SIFT 236
 6.9總結237
第7章基準數據、內容、度量和分析238
 7.1什麼是基準數據?238
 7.2先前關於標註數據方面的研究:藝術與科學240
 7.2.1質量性能的一般度量240
 7.2.2算法性能的衡量241
 7.2.3 Rosin關於角點方面的研究工作242
 7.3構造基準數據的關鍵問題243
 7.3.1內容:採用、修改或創建243
 7.3.2可用的基準數據介紹243
 7.3.3使用數據擬合算法244
 7.3.4場景構成和標記245
 7.4定義目標和預期247
 7.4.1 Mikolajczyk和Schmid的方法學247
 7.4.2開放式評價系統248
 7.4.3極端情況和限制248
 7.4.4興趣點和特徵248
 7.5基準數據的魯棒性準則249
 7.5.1舉例說明魯棒性準則249
 7.5.2將魯棒性準則用於實際應用250
 7.6度量與基準數據的配對252
 7.6.1興趣點、特徵和基準數據的配對和優化252
 7.6.2一般的視覺分類學的例子253
 7.7合成的特徵字母表254
 7.7.1合成數據集的目標254
 7.7.2合成興趣點字母表256
 7.7.3將合成字母表疊加到真實圖像上258
 7.8總結260
第8章可視流程及優化261
 8.1階段、操作和資源261
 8.2計算資源預算263
 8.2.1計算單元、ALU和加速器265
 8.2.2能耗的使用266
 8.2.3內存的利用266
 8.2.4 I/O性能269
 8.3計算機視覺流程的實例270
 8.3.1汽車識別270
 8.3.2人臉檢測、情感識別以及年齡識別277
 8.3.3圖像分類285
 8.3.4增強現實289
 8.4可選的加速方案294
 8.4.1內存優化294
 8.4.2粗粒度並行296
 8.4.3細粒度數據並行297
 8.4.4高級指令集和加速器300
 8.5計算機視覺算法的優化與調整301
 8.5.1編譯器優化與手工優化301
 8.5.2特徵描述子改造、檢測器和距離函數302
 8.5.3 Boxlets與捲積加速303
 8.5.4數據類型優化,整型與浮點型303
 8.6優化資源304
 8.7總結304
附錄A合成特徵分析306
 A.1目標的背景與期望307
 A.2測試方法和結果309
 A.3合成字母基準圖像概述311
 A.4測試1:合成興趣點字母檢測313
 A.5測試2:合成角點字母檢測323
 A.6測試3:疊加到真實圖像上的合成字母檢測333
 A .7測試4:字母的旋轉不變性333
 A.8結果分析和不可重複性異常336
附錄B基準數據集概述339
附錄C成像和計算機視覺資源347
 C.1商業產品347
 C.2開放源碼348
 C .3組織、機構和標準350
 C.4在線資源351
附錄D擴展SDM準則353
譯後記370
參考文獻372