深度學習與電腦視覺實戰

彭小紅,張良均

  • 出版商: 人民郵電
  • 出版日期: 2022-11-01
  • 定價: $299
  • 售價: 8.5$254
  • 語言: 簡體中文
  • 頁數: 213
  • ISBN: 7115602549
  • ISBN-13: 9787115602541
  • 相關分類: DeepLearningComputer Vision
  • 立即出貨 (庫存 < 3)

  • 深度學習與電腦視覺實戰-preview-1
  • 深度學習與電腦視覺實戰-preview-2
深度學習與電腦視覺實戰-preview-1

買這商品的人也買了...

商品描述

本書以深度學習在電腦視覺領域的常用技術與案例相結合的方式,深入淺出地介紹電腦視覺的常見任務及實現技術。全書共7章,內容包含概述、圖像處理基本操作、深度學習視覺基礎任務、基於FaceNet的人臉識別實戰、基於 Faster R-CNN 的目標檢測實戰、基於 U-Net 的城市道路場景分割實戰、基於SRGAN 的圖像超分辨率技術實戰等。本書大部分章包含操作實踐代碼和課後習題,希望能夠幫助讀者在電腦視覺基礎任務中應用算法,鞏固所學內容。

本書可以作為高校人工智能相關專業教材,也可以作為從事電腦視覺技術研究的從業者和科技人員的參考用書。對於有一定基礎和經驗的讀者,本書也能幫助他們查漏補缺,深入理解和掌握相關原理及方法,提升解決實際問題的能力。

作者簡介

彭小红,女,广东海洋大学数学与计算机学院教授,院长,硕士生导师,国家级一流专业建设点(计算机科学与技术)负责人、广东省“计算机科学与技术专业”教学团队负责人、广东省“计算机科学与技术专业综合改革试点”负责人、广东省一流课程“计算机组成与结构”负责人、南粤优秀教师。 研究方向:智能系统及其智能信息处理、智能水下机器人。先后主持广东省科技计划、南方海洋科学与工程广东省实验室(湛江)、广东省高校创新强校工程等课题10余项,发表学术论文30余篇(其中SCI/EI收录16篇),译著1部;以第一完成人获得专利6项、计算机软件著作权22项,获湛江市科学技术进步奖二等奖1项、三等奖2项。 主讲本科专业课程:《计算机组成与结构》、《计算机接口技术》、《微机原理及接口》、《汇编语言与接口技术》、《生产实习》,研究生课程:《计算机体系结构》、《人工智能导论》;近五年,主持省部级以上协同育人、质量工程、教学改革项目9项,广东省研究生教育创新计划项目1项,发表教改论文8篇;获得广东海洋大学教学成果特等奖和一等奖、广东海洋大学教学质量优秀奖。指导学生参加学科竞赛获国家级和省部级奖励26项,荣获得互联网+大学生创新创业大赛、挑战杯大赛、中国软件杯、中国计算机设计大赛优秀指导教师称号。

张良均 资深大数据专家,广东泰迪智能科技股份有限公司董事长,国家科技部入库技术专家,教育部全国专业学位水平评估专家,工信部教育与考试中心入库专家,中国工业与应用数学学会理事,广东省工业与应用数学学会副理事长,广东省高等职业教育教学指导委员会委员,华南师范大学、中南财经政法大学等40余所高校校外硕导或兼职教授,泰迪杯全国数据挖掘挑战赛发起人。 曾在国内外重要学术刊物上发表学术论文10余篇,主导编写图书专著60余部,其中获普通高等教育“十一五”规划教材一部,“十三五”职业教育国家规划教材一部;参与标准建设4项,主持国家级课题1项、省部级课题4项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有信访、电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景,并荣获中国产学研合作促进奖、中国南方电网公司发明专利一等奖、广东省农业技术推广二等奖、广州市荔湾区科学技术进步奖。

目錄大綱

第 1章 概述 1

1.1 電腦視覺與深度學習 1

1.1.1 電腦視覺 2

1.1.2 深度學習 3

1.2 深度學習的電腦視覺應用 4

1.2.1 人臉識別 5

1.2.2 圖像分類 5

1.2.3 目標檢測 6

1.2.4 圖像分割 6

1.2.5 姿態估計 7

1.2.6 場景識別 7

1.2.7 目標跟蹤 8

1.2.8 動作識別 8

1.2.9 黑白照片自動著色 9

1.2.10 圖像風格轉移 9

1.3 相關Python庫 10

1.3.1 深度學習框架 10

1.3.2 圖像處理庫 12

小結 13

課後習題 13

第 2章 圖像處理基本操作 15

2.1 讀寫圖像 15

2.1.1 常用圖像類型 16

2.1.2 讀取圖像 17

2.1.3 顯示圖像 18

2.1.4 保存圖像 20

2.2 圖像顏色空間 20

2.2.1 常用顏色空間簡介 20

2.2.2 顏色空間轉換 22

2.3 圖像幾何變換 24

2.3.1 圖像平移 24

2.3.2 圖像縮放 25

2.3.3 圖像旋轉 32

2.3.4 圖像仿射 34

2.4 圖像增強 38

2.4.1 灰度級修正 39

2.4.2 圖像平滑 47

2.4.3 圖像銳化 51

小結 56

課後習題 57

第3章 深度學習視覺基礎任務 59

3.1 深度神經網絡 59

3.2 捲積神經網絡 61

3.2.1 捲積層 63

3.2.2 池化層 64

3.2.3 全連接層 64

3.2.4 捲積神經網絡訓練過程 65

3.3 圖像分類 67

3.3.1 圖像分類簡介 67

3.3.2 圖像分類經典算法 68

3.3.3 訓練圖像分類網絡 83

3.4 目標檢測 86

3.4.1 目標檢測簡介 86

3.4.2 目標檢測經典算法 88

3.4.3 訓練目標檢測網絡 104

3.5 圖像分割 111

3.5.1 圖像分割簡介 111

3.5.2 圖像分割經典算法 113

3.5.3 訓練圖像分割網絡 127

3.6 圖像生成 132

3.6.1 圖像生成簡介 133

3.6.2 圖像生成經典算法 134

3.6.3 訓練圖像生成器網絡 144

小結 149

課後習題 149

第4章 基於FaceNet的人臉識別實戰 152

4.1 背景與目標 152

4.1.1 背景 152

4.1.2 目標 154

4.1.3 項目工程結構 154

4.2 流程與步驟 155

4.2.1 人臉檢測 156

4.2.2 人臉對齊 160

4.2.3 人臉特徵提取 161

4.2.4 人臉特徵匹配 164

4.3 結果分析 165

小結 167

課後習題 168

第5章 基於Faster R-CNN的目標檢測實戰 170

5.1 背景與目標 170

5.1.1 背景 170

5.1.2 目標 171

5.1.3 項目工程結構 171

5.2 流程與步驟 172

5.2.1 數據準備 172

5.2.2 定義Faster R-CNN配置信息類 174

5.2.3 生成先驗錨框 174

5.2.4 定義損失函數 176

5.2.5 訓練網絡 180

5.3 結果分析 181

小結 183

課後習題 184

第6章 基於U-Net的城市道路場景分割實戰 186

6.1 背景與目標 186

6.1.1 背景 186

6.1.2 目標 187

6.1.3 項目工程結構 188

6.2 流程與步驟 188

6.2.1 數據準備 189

6.2.2 搭建U-Net 191

6.2.3 定義損失函數 194

6.2.4 訓練網絡 195

6.3 結果分析 197

小結 199

課後習題 199

第7章 基於SRGAN的圖像超分辨率技術實戰 201

7.1 背景與目標 201

7.1.1 背景 201

7.1.2 目標 203

7.1.3 項目工程結構 203

7.2 流程與步驟 204

7.2.1 數據準備 204

7.2.2 搭建SRGAN 206

7.2.3 定義SRGAN損失函數 209

7.2.4 訓練網絡 210

7.3 結果分析 211

小結 213

課後習題 213