基於深度學習的圖像處理與實踐
王卓、劉德民
- 出版商: 清華大學
- 出版日期: 2024-07-01
- 定價: $594
- 售價: 7.9 折 $469
- 語言: 簡體中文
- 頁數: 355
- ISBN: 7302664668
- ISBN-13: 9787302664666
-
相關分類:
DeepLearning、影像辨識 Image-recognition
立即出貨
買這商品的人也買了...
-
$796深度學習 -
$607深度學習之人臉圖像處理:核心算法與案例實戰 -
$568金融中的機器學習 -
$512智能風控實踐指南:從模型、特徵到決策 -
CPU 眼裡的 C/C++$534$507 -
RPA 開發:UiPath 入門與實戰$594$564 -
PyTorch 自動駕駛視覺感知算法實戰$714$678 -
$407計算機視覺核心技術演算法與開發實戰 -
$281RPA 機器人與商務應用 -
台灣之光物件辨識 - 最新 YOLO 原理精讀+實戰$800$632 -
$611數據驅動的進化優化 -
PyTorch 深度學習與電腦視覺實踐$474$450 -
深度學習之模型優化:核心算法與案例實踐$534$507 -
$327圖解演算法:從基礎知識到實際應用的演算法入門書 -
$658Python 深度學習實戰 -
$505人人可懂的模式識別(原書第2版) -
$371群體智能算法的理論基礎 -
$331機器學習全解(R語言版) -
$706決策演算法 -
$509中文版MATLAB 圖形與圖像處理從入門到精通(實戰案例版) -
算法分析導論, 2/e$539$512 -
$331大模型時代的人工智能基礎與實踐 — 基於 OmniForce 的應用開發教程 -
$331分佈式機器學習模式 -
$356AI 圖像生成核心技術與實戰 -
$512基於 Python 的金融分析與風險管理 (暢享版)(基礎捲)
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
《基於深度學習的圖像處理與實踐》循序漸進、深入淺出地講解了基於深度學習的圖像處理的核心知識,並通過具體實例演示了開發深度學習圖像處理程序的方法和流程。全書共 14 章,分別講解了圖像識別技術基礎,scikit-image數字圖像處理,OpenCV 圖像視覺處理,dlib機器學習和圖像處理,face_recognition人臉識別,採樣、變換和捲積處理,圖像增強,圖像特徵提取,圖像分割,目標檢測,圖像分類,國內常用的第三方人臉識別平臺,鬥轉星移換圖系統,智能OCR文本檢測識別系統等內容。本書語言簡潔而不失技術深度,內容全面。 《基於深度學習的圖像處理與實踐》適用於已經瞭解了Python語言基礎語法,想進一步學習機器學習、深度學習、電腦視覺與圖像處理技術的讀者,還可以作為大專院校相關專業的師生用書和培訓機構的專業性教材。
目錄大綱
目錄
第1章 圖像識別技術基礎 1
1.1 圖像識別概述 2
1.1.1 什麼是圖像識別 2
1.1.2 圖像識別的發展階段 2
1.1.3 圖像識別的應用 3
1.2 圖像識別的過程 4
1.3 圖像識別技術 4
1.3.1 人工智能 5
1.3.2 機器學習 5
1.3.3 深度學習 6
1.3.4 基於神經網絡的圖像識別 6
1.3.5 基於非線性降維的圖像識別 7
第2章 scikit-image數字圖像處理 9
2.1 scikit-image基礎 10
2.1.1 安裝scikit-image 10
2.1.2 scikit-image中的模塊 10
2.2 顯示圖像 11
2.2.1 使用skimage讀入並顯示外部圖像 11
2.2.2 讀取並顯示外部灰度圖像 12
2.2.3 讀取並顯示內置星空圖片 13
2.2.4 讀取並保存內置星空圖片 14
2.3 常見的圖像操作 14
2.3.1 對內置圖片進行二值化操作 15
2.3.2 對內置圖片進行裁剪處理 16
2.3.3 將RGB圖轉換為灰度圖 17
2.3.4 使用skimage實現繪制圖片功能 18
2.3.5 使用subplot()函數繪制多視圖窗口 19
2.3.6 改變指定圖片的大小 21
2.3.7 使用函數rescale()縮放圖片 22
2.3.8 使用函數rotate()旋轉圖片 22
第3章 OpenCV圖像視覺處理 25
3.1 OpenCV基礎 26
3.1.1 OpenCV和OpenCV-Python介紹 26
3.1.2 安裝OpenCV-Python 26
3.2 OpenCV-Python圖像操作 27
3.2.1 讀取並顯示圖像 27
3.2.2 保存圖像 29
3.2.3 在Matplotlib中顯示圖像 30
3.2.4 繪圖 31
3.2.5 將鼠標作為畫筆 34
3.2.6 調色板程序 36
3.2.7 基本的屬性操作 37
3.3 OpenCV-Python視頻操作 40
3.3.1 讀取視頻 40
3.3.2 播放視頻 41
3.3.3 保存視頻 42
3.3.4 改變顏色空間 43
3.3.5 視頻的背景分離 45
第4章 dlib機器學習和圖像處理 49
4.1 dlib介紹 50
4.2 dlib基本的人臉檢測 50
4.2.1 人臉檢測 50
4.2.2 使用命令行進行人臉識別 52
4.2.3 檢測人臉關鍵點 54
4.2.4 基於CNN的人臉檢測器 56
4.2.5 在攝像頭中識別人臉 58
4.2.6 人臉識別驗證 59
4.2.7 全局優化 60
4.2.8 人臉聚類 62
4.2.9 抖動採樣和增強 64
4.2.10 人臉和姿勢採集 65
4.2.11 物體追蹤 66
4.3 SVM分類算法 67
4.3.1 二進制SVM分類器 68
4.3.2 Ranking SVM算法 69
4.3.3 Struct SVM多分類器 72
4.4 自訓練模型 75
4.4.1 訓練自己的模型 75
4.4.2 自製對象檢測器 78
第5章 face_recognition人臉識別 83
5.1 安裝face_recognition 84
5.2 實現基本的人臉檢測 84
5.2.1 輸出顯示指定人像人臉特徵 84
5.2.2 在指定照片中識別標記出人臉 86
5.2.3 識別出照片中的所有人臉 88
5.2.4 判斷照片中是否包含某個人 91
5.2.5 識別出照片中的人是誰 92
5.2.6 攝像頭實時識別 93
5.3 深入face_recognition人臉檢測 98
5.3.1 檢測用戶眼睛的狀態 99
5.3.2 模糊處理人臉 101
5.3.3 檢測兩個人臉是否匹配 102
5.3.4 識別視頻中的人臉 103
5.3.5 網頁版人臉識別器 106
第6章 採樣、變換和捲積處理 109
6.1 採樣 110
6.1.1 最近鄰插值採樣 110
6.1.2 雙線性插值 112
6.1.3 雙立方插值 116
6.1.4 Lanczos插值 118
6.2 離散傅裏葉變換 119
6.2.1 為什麼使用DFT 119
6.2.2 用庫NumPy實現DFT 120
6.2.3 用庫SciPy實現DFT 121
6.2.4 用快速傅裏葉變換算法計算DFT 122
6.3 捲積 124
6.3.1 為什麼需要捲積圖像 124
6.3.2 使用庫SciPy中的函數
convolve2d()進行捲積 124
6.3.3 使用庫SciPy中的函數ndimage.convolve()進行捲積 126
6.4 頻域濾波 128
6.4.1 什麼是濾波器 128
6.4.2 高通濾波器 128
6.4.3 低通濾波器 130
6.4.4 DoG 帶通濾波器 130
6.4.5 帶阻濾波器 132
第7章 圖像增強 135
7.1 對比度增強 136
7.1.1 直方圖均衡化 136
7.1.2 自適應直方圖均衡化 138
7.1.3 對比度拉伸 140
7.1.4 非線性對比度增強 142
7.2 銳化 144
7.2.1 銳化濾波 145
7.2.2 高頻強調濾波 148
7.2.3 基於梯度的銳化 152
7.3 減少噪聲 156
7.3.1 均值濾波器 156
7.3.2 中值濾波器 158
7.3.3 高斯濾波器 158
7.3.4 雙邊濾波器 159
7.3.5 小波降噪 160
7.4 色彩平衡 161
7.4.1 白平衡 161
7.4.2 顏色校正 163
7.4.3 調整色調和飽和度 164
7.5 超分辨率 165
7.6 去除運動模糊 167
7.6.1 邊緣 167
7.6.2 逆濾波 169
7.6.3 統計方法 170
7.6.4 盲去捲積 171
第8章 圖像特徵提取 173
8.1 圖像特徵提取方法 174
8.2 顏色特徵 174
8.2.1 顏色直方圖 174
8.2.2 其他顏色特徵提取方法 176
8.3 紋理特徵 178
8.3.1 灰度共生矩陣 178
8.3.2 方向梯度直方圖 180
8.3.3 尺度不變特徵變換 181
8.3.4 小波變換 182
8.4 形狀特徵 184
8.4.1 邊界描述子 184
8.4.2 預處理後的輪廓特徵 188
8.4.3 模型擬合方法 190
8.4.4 形狀上的變換 193
8.5 基於LoG、DoG和DoH的斑點檢測器 196
8.5.1 LoG濾波器 197
8.5.2 DoG濾波器 198
8.5.3 DoH算法 200
第9章 圖像分割 203
9.1 圖像分割的重要性 204
9.2 基於閾值的分割 204
9.2.1 灰度閾值分割 205
9.2.2 彩色閾值分割 206
9.3 基於邊緣的分割 207
9.3.1 Canny邊緣檢測 207
9.3.2 邊緣連接方法 208
9.4 基於區域的分割 209
9.4.1 區域生長算法 209
9.4.2 圖割算法 212
9.4.3 基於聚類的分割算法 213
9.5 基於圖論的分割 215
9.5.1 圖割算法 215
9.5.2 最小生成樹算法 215
9.6 基於深度學習的分割 217
9.6.1 FCN 217
9.6.2 U-Net 219
9.6.3 DeepLab 220
9.6.4 Mask R-CNN 220
第10章 目標檢測 223
10.1 目標檢測概述 224
10.1.1 目標檢測的步驟 224
10.1.2 目標檢測的方法 224
10.2 YOLO v5 225
10.2.1 YOLO v5的改進 225
10.2.2 基於YOLO v5的訓練、驗證和預測 226
10.3 語義分割 242
10.3.1 什麼是語義分割 242
10.3.2 DeepLab語義分割 244
10.4 SSD目標檢測 245
10.4.1 攝像頭目標檢測 246
10.4.2 基於圖像的目標檢測 247
第11章 圖像分類 249
11.1 圖像分類介紹 250
11.2 基於特徵提取和機器學習的圖像分類 250
11.2.1 圖像分類的基本流程 250
11.2.2 基於scikit-learn機器學習的圖像分類 251
11.2.3 分類算法 254
11.2.4 聚類算法 257
11.3 基於捲積神經網絡的圖像分類 259
11.3.1 捲積神經網絡的基本結構 259
11.3.2 第一個捲積神經網絡程序 262
11.3.3 使用捲積神經網絡進行圖像分類 267
11.4 基於遷移學習的圖像分類 279
11.4.1 遷移學習介紹 279
11.4.2 基於遷移學習的圖片分類器 280
11.5 基於循環神經網絡的圖像分類 284
11.5.1 循環神經網絡介紹 284
11.5.2 實戰演練 285
11.6 基於捲積循環神經網絡的圖像分類 286
11.6.1 捲積循環神經網絡介紹 286
11.6.2 CRNN圖像識別器 287
第12章 國內常用的第三方人臉識別平臺 291
12.1 百度AI開放平臺 292
12.1.1 百度AI開放平臺介紹 292
12.1.2 使用百度AI之前的準備工作 292
12.1.3 基於百度AI平臺的人臉識別 296
12.2 科大訊飛AI開放平臺 301
12.2.1 科大訊飛AI開放平臺介紹 301
12.2.2 申請試用 301
12.2.3 基於科大訊飛AI的人臉識別 302
第13章 鬥轉星移換圖系統 311
13.1 背景介紹 312
13.1.1 CycleGAN的作用 312
13.1.2 CycleGAN的原理 312
13.2 系統模塊架構 313
13.3 設置數據集 313
13.4 訓練數據 315
13.4.1 加載圖像 315
13.4.2 輔助功能 316
13.4.3 生成對抗網絡模型 319
13.4.4 訓練CycleGAN模型 322
13.5 圖像轉換 326
13.6 調試運行 328
第14章 智能OCR文本檢測識別系統 333
14.1 OCR系統介紹 334
14.1.1 OCR的基本原理和方式 334
14.1.2 深度學習對OCR的影響 335
14.1.3 與OCR相關的深度學習技術 335
14.2 OCR項目介紹 336
14.3 準備模型 337
14.3.1 文本檢測模型 337
14.3.2 文本識別模型 337
14.4 創建工程 337
14.4.1 工程配置 338
14.4.2 配置應用程序 338
14.4.3 導入模型 338
14.5 具體實現 339
14.5.1 頁面佈局 339
14.5.2 實現主Activity 339
14.5.3 圖像操作 343
14.5.4 運行OCR模型 347
14.6 調試運行 354



