深度學習在數字圖像處理中的應用
馬龍華,陸哲明,崔家林 等
- 出版商: 電子工業
- 出版日期: 2022-06-01
- 定價: $534
- 售價: 7.9 折 $422
- 語言: 簡體中文
- 頁數: 304
- ISBN: 7121437082
- ISBN-13: 9787121437083
-
相關分類:
DeepLearning、影像辨識 Image-recognition
立即出貨 (庫存 < 3)
買這商品的人也買了...
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
深度學習憑借其在識別應用領域中超高的預測準確率,在圖像處理領域獲得了極大關註,這勢必將提升現有圖像處理系統的性能並開創新的應用領域。利用捲積神經網絡等深層神經網絡的解決方案,可以逐漸取代基於算法可解釋的傳統圖像處理工作。盡管圖像預處理、後期處理和信號處理仍在大量採用現有方法,但在圖像分類應用中,深度學習變得愈加重要。在該背景下,本書系統介紹了深度學習在數字圖像處理各個研究分支的應用,包括圖像增強、圖像復原、圖像檢索、圖像壓縮、圖像分割、目標檢測、動作識別和圖像配準等。每一部分都對傳統方法做了概述,並穿插介紹本書作者的研究成果,反映了深度學習在數字圖像處理各個研究分支的發展現狀。本書可作為高等院校具有一定電腦基礎的人工智能、自動化、信號與信息處理、電子信息工程、電腦科學與技術、通信工程等專業的研究生或高年級本科生的教材或參考書,也可作為科研院所相關專業的科技工作者的參考書。
目錄大綱
第1章數字圖像處理概述 1
1.1 數字圖像的基本概念 1
1.1.1 數字圖像 1
1.1.2 獲取靜態數字圖像的方式 7
1.1.3 色彩及色彩模型 10
1.2 數字圖像的獲取與描述 15
1.2.1 圖像數字化 15
1.2.2 圖像灰度直方圖 17
1.2.3 圖像處理算法的形式 20
1.2.4 圖像的數據結構與特徵 21
1.3 數字圖像處理的研究內容和應用領域 25
1.3.1 數字圖像處理的基本流程 25
1.3.2 數字圖像處理的研究分支 26
1.3.3 傳統數字圖像處理常用的理論工具 30
1.3.4 數字圖像處理的應用領域 30
參考文獻 32
第2章深度學習概述 33
2.1 深度學習的概念 33
2.1.1 深度學習的歷史背景 33
2.1.2 深度學習的基本思想 33
2.1.3 深度學習的本質和優勢 34
2.2 國內外研究現狀 35
2.2.1 深度學習在語音識別領域的研究現狀 35
2.2.2 深度學習在圖像識別領域的研究現狀 37
2.2.3 深度學習在自然語言處理領域的研究現狀 40
2.3 深度學習典型模型結構和訓練算法 41
2.3.1 感知機 42
2.3.2 前饋神經網絡之多層感知機 43
2.3.3 前饋神經網絡之捲積神經網絡 45
2.3.4 反饋深度網絡 48
2.3.5 雙向深度網絡 50
2.3.6 深度學習訓練算法 55
2.4 深度學習的優點和已有的應用 57
2.4.1 深度學習的優點 57
2.4.2 深度學習已有的典型應用 57
2.5 深度學習存在的問題及未來研究方向 60
2.5.1 深度學習目前存在的問題 60
2.5.2 深度學習未來研究方向 61
參考文獻 62
第3章基於深度學習的圖像增強與圖像恢復 66
3.1 圖像去噪 66
3.1.1 傳統圖像去噪方法概述 66
3.1.2 基於DnCNN的圖像去噪 69
3.1.3 基於CBDNet的圖像去噪 72
3.2 圖像去霧 74
3.2.1 傳統圖像去霧方法概述 74
3.2.2 基於DehazeNet的圖像去霧 77
3.2.3 基於EPDN的圖像去霧 79
3.2.4 基於PMS-Net的圖像去霧 80
3.3 圖像去模糊 82
3.3.1 傳統圖像去模糊方法概述 82
3.3.2 基於ResBlock的圖像去模糊 85
3.3.3 基於DAVANet的圖像去模糊 86
3.4 圖像增強 91
3.4.1 傳統圖像增強方法概述 91
3.4.2 基於Deep Bilateral Learning的圖像增強 94
3.4.3 基於Deep Photo Enhancer的圖像增強 96
3.4.4 基於Deep Illumination Estimation的圖像增強 97
參考文獻 99
第4章基於深度學習的圖像檢索 105
4.1 圖像檢索的研究背景和研究現狀 105
4.1.1 圖像檢索的研究背景 105
4.1.2 為什麼要引入深度學習 106
4.1.3 圖像檢索的研究現狀 106
4.2 圖像特徵和相似性度量 108
4.2.1 原始數據層特徵 108
4.2.2 物理層特徵 109
4.2.3 語義層特徵 110
4.2.4 圖像相似性度量 110
4.3 基於內容的圖像檢索 111
4.3.1 基於顏色特徵的圖像檢索 111
4.3.2 基於紋理特徵的圖像檢索 113
4.3.3 基於形狀特徵的圖像檢索 114
4.3.4 基於多特徵的圖像檢索 115
4.3.5 基於視覺詞袋的圖像檢索 119
4.4 基於註意力機制和捲積神經網絡的圖像檢索 122
4.4.1 註意力機制簡介 122
4.4.2 圖像檢索中的註意力機制 123
4.4.3 基於註意力機制和捲積神經網絡模型的圖像檢索 124
4.4.4 實驗結果 127
4.5 基於深度信念網絡的人臉圖像檢索 130
4.5.1 局部二值模式 130
4.5.2 DBN訓練模型 130
4.5.3 融合LBP算子與DBN網絡模型的圖像檢索 131
4.5.4 實驗結果 131
參考文獻 132
第5章基於深度學習的圖像壓縮 136
5.1 圖像壓縮概述 136
5.1.1 圖像壓縮的目的和意義 136
5.1.2 傳統圖像壓縮的方法分類和簡介 137
5.1.3 為什麼要引入深度學習 139
5.1.4 基於深度學習的圖像壓縮技術現狀 139
5.2 基於矢量量化的圖像壓縮方法 140
5.2.1 基於矢量量化的圖像壓縮概述 140
5.2.2 基於邊緣分類和範數排序的K-means算法的碼書設計 142
5.2.3 基於特徵分類和分組初始化的改進K-means算法的碼書設計 146
5.3 基於深度學習的圖像壓縮方法 151
5.3.1 基於捲積神經網絡的圖像壓縮方法概述 151
5.3.2 基於循環神經網絡的圖像壓縮方法概述 153
5.3.3 基於生成對抗網絡的圖像壓縮方法概述 154
5.3.4 結合捲積神經網絡和傳統方法的圖像壓縮 155
5.3.5 實驗結果與分析 159
參考文獻 161
第6章基於深度學習的圖像分割 167
6.1 圖像分割概述 167
6.1.1 圖像分割的目的和意義 167
6.1.2 傳統圖像分割方法分類 168
6.1.3 典型傳統圖像分割方法簡介 170
6.1.4 為什麼引入深度學習 175
6.2 複雜背景下毛坯輪轂圖像分割及圓心精確定位 176
6.2.1 引言 176
6.2.2 基於超像素能量譜的輪轂分割 177
6.2.3 精確圓擬合算法 178
6.2.4 圓擬合結果分析 179
6.3 基於深度學習的圖像分割概述 181
6.3.1 研究現狀 181
6.3.2 幾種典型實現方案 182
6.3.3 基於全捲積神經網絡的圖像分割實驗結果 185
6.4 基於深度生成對抗網絡的超聲圖像分割 186
6.4.1 引言 186
6.4.2 相關工作 187
6.4.3 基於深度生成對抗網絡的臂叢分割 188
6.4.4 實驗 190
參考文獻 193
第7章基於深度學習的人臉檢測與行人檢測 198
7.1 基於深度學習的人臉檢測 198
7.1.1 人臉檢測概述 198
7.1.2 基於深度學習的人臉檢測算法分類和數據集 200
7.1.3 多任務級聯捲積網絡的加速 203
7.1.4 實驗結果 209
7.2 行人檢測概述 212
7.2.1 行人檢測基本框架 212
7.2.2 基於傳統機器學習的方法 212
7.2.3 基於深度學習的方法 213
7.2.4 行人檢測評判標準 216
7.3 基於ViBe結合HOG+SVM的快速行人檢測與跟蹤 216
7.3.1 引言 216
7.3.2 ViBe算法 217
7.3.3 基於HOG+SVM的行人檢測 218
7.3.4 基於ViBe結合HOG+SVM方案 220
7.3.5 實驗結果與分析 222
參考文獻 227
第8章基於深度學習的動作識別 232
8.1 人體動作識別技術概述 232
8.1.1 引言 232
8.1.2 國內外研究現狀 233
8.1.3 研究難點 236
8.2 動作識別相關技術 237
8.2.1 圖捲積網絡 237
8.2.2 用於骨骼動作識別的空時圖捲積網絡 239
8.2.3 用於視頻動作識別的雙流捲積網絡 240
8.2.4 動作識別相關數據集 241
8.3 人體姿態估計 244
8.3.1 人體姿態估計的分類 244
8.3.2 OpenPose算法 245
8.3.3 AlphaPose算法 248
8.3.4 實驗結果比較分析 251
8.4 基於圖捲積網絡的骨骼序列動作識別算法 253
8.4.1 引言 253
8.4.2 註意力機制和共現特徵學習 253
8.4.3 基於圖捲積網絡的多任務框架 254
8.4.4 實驗結果及分析 257
8.5 一種替代光流的視頻動作識別算法 261
8.5.1 基於光流估計的雙流捲積網絡 261
8.5.2 時間軌跡濾波器 262
8.5.3 隨機跨幀融合 264
8.5.4 實驗結果及分析 265
參考文獻 266
第9章基於深度學習的醫學圖像配準 270
9.1 醫學圖像配準概述 270
9.1.1 基本概念 270
9.1.2 基本變換 270
9.1.3 方法分類 272
9.1.4 典型配準方法 272
9.1.5 評估方法 273
9.2 基於分形沙漏網絡由MV-DR合成kV-DRR 274
9.2.1 引言 274
9.2.2 分形沙漏網絡 274
9.2.3 實驗 276
9.3 基於公共表徵學習和幾何約束的多模態醫學圖像配準 278
9.3.1 引言 278
9.3.2 方法 279
9.3.3 實驗及算法比較 280
9.4 基於信息瓶頸條件生成對抗網絡的MV-DR和kV-DRR配準 281
9.4.1 引言 281
9.4.2 材料和方法 282
9.4.3 結果 287
參考文獻 290
