MATLAB圖像與視頻處理實用案例詳解 MATLAB图像与视频处理实用案例详解

劉衍琦, 詹福宇

  • 出版商: 電子工業
  • 出版日期: 2015-01-01
  • 定價: $414
  • 售價: 8.5$352
  • 語言: 簡體中文
  • 頁數: 290
  • 裝訂: 平裝
  • ISBN: 7121252260
  • ISBN-13: 9787121252266
  • 相關分類: Matlab

已絕版

買這商品的人也買了...

相關主題

商品描述

<內容簡介>

1.matlab技術論壇創始人及該論壇圖像版主聯合力作,業內眾多專家力薦;

2.針對讀者需求精選超值案例,以極大程度提高讀者的理論及親身實戰經驗;

3.每個案例的講解都是先基礎及思路,再實戰,*後輔以思路延伸;

4.吐血案例分享,即學即用:圖像去霧、圖像去噪、車牌定位識別、肺癌輔助診斷、答題卡/人臉二維碼/字符/數字驗證碼識別、交通汽車檢測跟蹤、simulink圖像/視頻處理、數字水印、圖像拼接……;

5.學無止境,探索無止境,交流無止境。matlab技術論壇提供本書在線交流服務,名家、專家及眾多matlab圖像與視頻處理愛好者等著你的加入。

《matlab圖像與視頻處理實用案例詳解》詳細講解了25個matlab圖像與視頻處理實用案例(含可運行程序),涉及霧霾去噪、答題卡自動閱捲、肺部圖像分割、小波數字水印、圖像檢索、人臉二維碼識別、車牌定位及識別、霍夫曼圖像壓縮、手寫數字識別、英文字符文本識別、眼前節組織提取、全景圖像拼接、小波圖像融合、基於語音識別的音頻信號模擬燈控、路面裂縫檢測識別、視頻運動估計追蹤、simulink圖像處理等多項重要技術,涵蓋了數字圖像處理中幾乎所有的基本模塊。

工欲善其事,必先利其器,《matlab圖像與視頻處理實用案例詳解》對每個數字圖像處理的知識點都提供了豐富生動的案例素材,並詳細講解了其matlab實驗的核心程序,通過對這些示例程序的閱讀理解和模擬運行,讀者可以更加深刻地理解圖像處理的內容,並且更加熟練地掌握matlab中各種函數在圖像處理領域中的用法。

<作者簡介>

劉衍琦,碩士,軟件研發工程師,MATLAB技術論壇圖像版主,畢業於大連理工大學數學科學學院計算幾何與圖形圖像實驗室。從本科學習階段開始接觸MATLAB,歷經MATLAB由6.X到8.X系列的發展,不斷地將MATLAB熟練地應用到科研學習和工作之中,並積極通過MATLAB技術論壇等平臺與國內外廣大會員朋友進行技術探討,將解決圖像處理開發所遇到的實際問題進行了經驗總結,積累了一定的圖像處理知識儲備。在MATLAB技術論壇發布多篇圖像處理相關教程,合作出版多本MATLAB書籍。

詹福宇,博士,飛行控制系統工程師,MATLAB技術論壇創始人,畢業於西北工業大學航空學院飛行器設計專業。精通多種計算機編程,尤其擅長MATLAB和C/C++,擁有近10年MATLAB開發使用經驗,熟悉Simulink基於模型設計流程。於2008年創建MATLAB技術論壇,安全運營、維護和管理該論壇 6年,編寫MATLAB/Simulink原創教程數百篇,解決會員MATLAB技術問題數萬個,積累了豐富的相關經驗。曾多次、多地組織MATLAB現場技術研討會,贏得了大家的積極好評。

<目錄>

第1章  基於直方圖優化的圖像去霧技術 1

1.1  案例背景  1

1.2  理論基礎  1

1.2.1  空域圖像增強  1

1.2.2  直方圖均衡化  1

1.3  程序實現  3

1.3.1  設計GUI界面  3

1.3.2  全局直方圖處理  4

1.3.3  局部直方圖處理  5

1.3.4  Retinex增強處理  7

1.4  延伸閱讀  10

1.5  參考文獻  11

第2章  基於形態學的權重自適應圖像去噪  12

2.1  案例背景  12

2.2  理論基礎  12

2.2.1  圖像去噪方法  12

2.2.2  數學形態學原理  13

2.2.3  權重自適應的多結構形態學去噪  14

2.3  程序實現  14

2.4  延伸閱讀  20

2.5  參考文獻  21

第3章  基於多尺度形態學提取眼前節組織  22

3.1  案例背景  22

3.2  理論基礎  22

3.3  程序實現  25

3.3.1  多尺度邊緣  25

3.3.2  主處理函數  26

3.3.3  形態學處理  28

3.4  延伸閱讀  29

3.5  參考文獻  30

第4章  基於Hough變化的答題卡識別  31

4.1  案例背景  31

4.2  理論基礎  31

4.2.1  圖像二值化  31

4.2.2  傾斜校正  32

4.2.3  圖像分割  35

4.3  程序實現  37

4.4  延伸閱讀  47

4.5  參考文獻  47

第5章  基於閾值分割的車牌定位識別  48

5.1  案例背景  48

5.2  理論基礎  48

5.2.1  車牌圖像處理  49

5.2.2  車牌定位原理  52

5.2.3  車牌字符處理  52

5.2.4  字符識別  54

5.3  程序實現  55

5.4  延伸閱讀  63

5.5  參考文獻  63

第6章  基於分水嶺分割進行肺癌診斷  64

6.1  案例背景  64

6.2  理論基礎  64

6.2.1  模擬浸水的過程  64

6.2.2  模擬降水的過程  65

6.2.3  過度分割問題  65

6.2.4  標記分水嶺分割算法  65

6.3  程序實現  66

6.4  延伸閱讀  71

6.5  參考文獻  71

第7章  基於主成分分析的人臉二維碼識別  72

7.1  案例背景  72

7.2  理論基礎  72

7.2.1  QR編碼簡介  72

7.2.2  QR編碼譯碼  74

7.2.3  主成分分析方法  76

7.3  程序實現  77

7.3.1  人臉建庫  77

7.3.2  人臉識別  78

7.3.3  人臉二維碼  79

7.4  延伸閱讀  83

7.5  參考文獻  84

第8章  基於知識庫的手寫體數字識別  85

8.1  案例背景  85

8.2  理論基礎  85

8.2.1  算法流程  85

8.2.2  特徵提取  85

8.2.3  模式識別  86

8.3  程序實現  87

8.3.1  圖像處理  87

8.3.2  特徵提取  88

8.3.3  模式識別  91

8.4  延伸閱讀  91

8.4.1  識別器選擇  91

8.4.2  提高識別率  92

8.5  參考文獻  92

第9章  基於特徵匹配的英文印刷字符識別  93

9.1  案例背景  93

9.2  理論基礎  93

9.2.1  圖像預處理  93

9.2.2  圖像識別技術  94

9.3  程序實現  96

9.4  延伸閱讀  101

9.5  參考文獻  101

第10章  基於不變矩的數字驗證碼識別  102

10.1  案例背景  102

10.2  理論基礎  102

10.3  程序實現  103

10.3.1  設計GUI界面  103

10.3.2  加載驗證碼圖像  103

10.3.3  驗證碼圖像去噪  104

10.3.4  驗證碼數字定位  106

10.3.5  驗證碼歸一化  108

10.3.6  驗證碼數字識別  109

10.3.7  手動確認並入庫  111

10.3.8  重新生成模板庫  112

10.4  延伸閱讀  115

10.5  參考文獻  115

第11章  基於小波技術進行圖像融合  116

11.1  案例背景  116

11.2  理論基礎  116

11.3  程序實現  118

11.3.1  GUI設計  118

11.3.2  圖像加載  119

11.3.3  小波融合  120

11.4  延伸閱讀  123

11.5  參考文獻  123

第12章  基於塊匹配的全景圖像拼接  124

12.1  案例背景  124

12.2  理論基礎  124

12.2.1  圖像匹配  125

12.2.2  圖像融合  127

12.3  程序實現  127

12.3.1  設計GUI  127

12.3.2  加載圖片  128

12.3.3  圖像匹配  129

12.3.4  圖像拼接  133

12.4  延伸閱讀  137

12.5  參考文獻  138

第13章  基於霍夫曼圖像壓縮重建  139

13.1  案例背景  139

13.2  理論基礎  139

13.2.1  霍夫曼編碼的步驟  139

13.2.2  霍夫曼編碼的特點  140

13.3  程序實現  141

13.3.1  設計GUI  141

13.3.2  壓縮重構  142

13.3.3  效果對比  147

13.4  延伸閱讀  149

13.5  參考文獻  149

第14章  基於主成分分析的圖像壓縮和重建  150

14.1  案例背景  150

14.2  理論基礎  150

14.2.1  主成分降維分析原理  150

14.2.2  由得分矩陣重建樣本  151

14.2.3  主成分分析數據壓縮比  151

14.2.4  基於主成分分析的圖像壓縮  152

14.3  程序實現  152

14.3.1  主成分分析源代碼  152

14.3.2  圖像和樣本間轉換  153

14.3.3  基於主成分分析的圖像壓縮  154

14.4  延伸閱讀  157

14.5  參考文獻  157

第15章  基於小波的圖像壓縮技術  158

15.1  案例背景  158

15.2  理論基礎  158

15.3  程序實現  161

15.4  延伸閱讀  167

15.5  參考文獻  168

第16章  基於Hu不變矩的圖像檢索技術  169

16.1  案例背景  169

16.2  理論基礎  169

16.3  程序實現  170

16.3.1  圖像預處理  170

16.3.2  計算不變矩  171

16.3.3  圖像檢索  172

16.3.4  結果分析  174

16.4  延伸閱讀  177

16.5  參考文獻  178

第17章  基於Harris的角點特徵檢測  179

17.1  案例背景  179

17.2  理論基礎  179

17.2.1  Harris基本原理  179

17.2.2  Harris算法流程  181

17.2.3  Harris角點性質  181

17.3  程序實現  182

17.3.1  Harris算法代碼  182

17.3.2  角點檢測實例  184

17.4  延伸閱讀  184

17.5  參考文獻  185

第18章  基於GUI搭建通用視頻處理工具  186

18.1  案例背景  186

18.2  理論基礎  186

18.3  程序實現  187

18.3.1  GUI設計  187

18.3.2  GUI實現  188

18.4  延伸閱讀  195

18.5  參考文獻  195

第19章  基於語音識別的信號燈圖像模擬控制技術  196

19.1  案例背景  196

19.2  理論基礎  196

19.3  程序實現  197

19.4  延伸閱讀  207

19.5  參考文獻  207

第20章  基於幀間差法進行視頻目標檢測  208

20.1  案例背景  208

20.2  理論基礎  208

20.2.1  幀間差分法  208

20.2.2  背景差分法  209

20.2.3  光流法  210

20.3  程序實現  211

20.4  延伸閱讀  218

20.5  參考文獻  218

第21章  路面裂縫檢測識別系統設計  219

21.1  案例背景  219

21.2  理論基礎  219

21.2.1  圖像灰度化  220

21.2.2  圖像濾波  221

21.2.3  圖像增強  223

21.2.4  圖像二值化  224

21.3  程序實現  226

21.4  延伸閱讀  236

21.5  參考文獻  236

第22章  基於K-means聚類算法的圖像區域分割  237

22.1  案例背景  237

22.2  理論基礎  237

22.2.1  K-means聚類算法原理  237

22.2.2  K-means聚類算法的要點  238

22.2.3  K-means聚類算法缺點  238

22.2.4  基於K-means圖像分割  239

22.3  程序實現  239

22.3.1  樣本之間距離  239

22.3.2  提取特徵向量  240

22.3.3  圖像聚類分割  241

22.4  延伸閱讀  243

22.5  參考文獻  243

第23章  基於光流場的交通汽車檢測跟蹤  244

23.1  案例背景  244

23.2  理論基礎  244

23.2.1  光流法檢測運動原理  244

23.2.2  光流的主要計算方法  245

23.2.3  梯度光流場約束方程  246

23.2.4  Horn-Schunck光流算法  247

23.3  程序實現  248

23.3.1  計算視覺系統工具箱簡介  248

23.3.2  基於光流場檢測汽車運動  250

23.3.3  搭建Simulink運動檢測模型  253

23.4  延伸閱讀  255

23.5  參考文獻  256

第24章  基於Simulink進行圖像和視頻處理  257

24.1  案例背景  257

24.2  模塊介紹  257

24.2.1  分析和增強模塊庫(Analysis & Enhancement)  258

24.2.2  轉化模塊庫(Conversions)  258

24.2.3  濾波模塊庫(Filtering)  259

24.2.4  幾何變換模塊庫(Gemetric Transformations)  259

24.2.5  形態學操作模塊庫(Morphological Operations)  260

24.2.6  輸入模塊庫(Sources)  260

24.2.7  輸出模塊庫(Sinks)  260

24.2.8  統計模塊庫(Statistics)  261

24.2.9  文本和圖形模塊庫(Text & Graphic)  261

24.2.10  變換模塊庫(Transforms)  262

24.2.11  其他工具模塊庫(Utilities)  262

24.3  模擬案例  262

24.3.1  搭建組織模型  262

24.3.2  模擬執行模型  264

24.3.3  代碼自動生成  265

24.4  延伸閱讀  270

24.5  參考文獻  271

第25章  基於小波變換的數字水印技術  272

25.1  案例背景  272

25.2  理論基礎  272

25.2.1  數字水印技術原理  273

25.2.2  典型的數字水印算法  274

25.2.3  數字水印攻擊和評價  276

25.2.4  基於小波的水印技術  277

25.3  程序實現  279

25.3.1  準備載體和水印圖像  279

25.3.2  小波數字水印的嵌入  280

25.3.3  小波數字水印的提取  283

25.3.4  小波水印的攻擊試驗  286

25.4  延伸閱讀  289

25.5  參考文獻  290

    二值圖像是指圖像數值矩陣中只保留0、1數值來代表黑、白兩種顏色。在實際的印刷體圖像處理實驗中,選擇合適的閾值是進行圖像二值變換的關鍵步驟,二值化能分割字符與背景,突出字符日標。對於印刷體圖像而言,其二值變換的輸出必須具備良好的保形性,不會改變有用的形狀信息,不會產生額外的孔洞等噪聲。其中,二值化的閾值選取有很多方法,主要分為二類:全局閾值法、局部閾值法和動態閾值法,本案例結合印刷體字符圖像的特點,採用全局閾值來進行二值化處理。

    印刷體圖像可能在掃描或者傳輸過程中受到噪聲乾擾,為了提高識別模塊的準確率,通常採用用平滑濾波的方法進行去噪,如中值濾波、均值濾波。在本案例中,通過對字符圖像的特徵分析,採用在二值化圖像的形態學變換濾波來進行去噪處理,保留有用的字符區域圖像,消除雜點、標點符號等乾擾內容。

    在經掃描得到的印刷體圖像中,不同位置的字符類型或尺寸可能也存在較大差異,為了提高字符識別的效率,需要將字符統一尺寸得到標準字符圖像,這就是字符的標準化過程。為了將原來各不相同的字符統一尺寸,可以在實驗過程中先統一高度,然後根據原始字符寬高比例來調整字符的寬度,得到標準字符。

    此外,輸入的印刷體字符圖像可能需要進行傾斜校正,使得同屬一行的字符也都處於同一水平位置,這樣既有利於字符的分割,也可以提高字符識別的準確率。傾斜校正的思想為主要根據圖像左右兩邊的黑色像素做積分投影所得到的平均高度來進行,字符組成的圖像其左右兩邊的字符像素高度一般處於水平位置附近,如果兩邊字符像素經積分投影得到的平均位置有較大差異,則說明圖像存在傾斜,需要進行校正。

    9.2.2圖像識別技術。

    字符識別是印刷字符圖像識別的核心步驟,主要包括以下內容:首先,識別模塊學習、存儲將要判別的字符特徵,將這些特徵匯總成識別系統的先驗知識;然後,選擇合適的判別準則來基於先驗知識對輸入的字符進行研判;最後,存儲字符的識別結果並輸出。在實驗過程中,字符的特徵具有不同的來源,如空間域的點陣位置信息,在頻域空間、小波空間等領域也都有各自的特徵,而且不同的特徵在識別字符時具有各自的特點及優勢。根據字符識別模塊所選擇特徵類型的不同,可以將其分為不同的識別技術。一般情況下,根據所採用的技術策略,字符識別技術可以分為如下三類:統計特徵字符識別技術、結構特徵字符識別技術和基於機器學習的識別技術。