計算機視覺(Python版)
王安誌 周勛 歐衛華 齊松
- 出版商: 清華大學
- 出版日期: 2026-05-01
- 售價: $354
- 語言: 簡體中文
- ISBN: 7302713707
- ISBN-13: 9787302713708
-
相關分類:
Computer Vision
下單後立即進貨 (約4週~6週)
相關主題
商品描述
"《計算機視覺(Python版)》系統介紹了深度學習時代下計算機視覺的基礎、工具、核心技術及其應用。全書分為3部分,共9章,內容包括計算機視覺基礎,計算機視覺的常用庫與工具包,深度學習基礎,計算機視覺的4大研究領域(分類、識別、檢測和分割)。本書對每一大類研究領域均進行了深入的闡述,講解了真實應用場景下的主流方法,給出了具體案例的設計和實現。 每章均包括知識點小結、習題和參考文獻。 聚焦計算機視覺的前沿技術,從實際問題出發,以應用為背景,以案例驅動,在案例分解中逐步融入理論與技術,幫助讀者既知道是什麼,明白為什麼,還知道怎麼做,進而舉一反三,融會貫通,循序漸進地掌握計算機視覺的理論、工具和技術,能運用其分析具體的計算機視覺任務,並設計和實現相應的解決方案。 可作為計算機、人工智能、電子信息、機器人工程、數字媒體等專業的本科生或研究生教材,也可以作為相關領域從業人員的自學參考書。 "
目錄大綱
目錄
第1篇基礎篇
第1章計算機視覺基礎
1.1計算機視覺簡介
1.2計算機視覺的處理對象
1.3計算機視覺的一般處理過程
1.4計算機視覺的相近研究領域
1.5計算機視覺的典型應用
小結
習題
參考文獻
第2章計算機視覺的常用庫與工具包
2.1OpenCV
2.1.1OpenCV基本操作
2.1.2OpenCV基本變換
2.1.3OpenCV高級操作
2.2Mahotas
2.2.1Mahotas基本操作
2.2.2色彩空間變換
2.2.3閾值化操作
2.2.4Mahotas知識拓展
2.3PyTorch
2.3.1PyTorch簡介
2.3.2PyTorch基本操作
2.3.3PyTorch實例
2.4PyTorch Lightning
2.5Torchvision
2.5.1torchvision.datasets
2.5.2torchvision.transforms
2.5.3torchvision.models
2.5.4torchvision.utils
2.6OpenMMLab 系列庫
2.6.1OpenMMLab Computer Vision
2.6.2OpenMMLab Detection
2.6.3OpenMMLab Semantic Segmentation
2.7Fastai
2.8TensorFlow
2.8.1TensorFlow基本操作
2.8.2TensorFlow實例
2.9其他優秀的深度學習框架
小結
習題
參考文獻
第3章深度學習基礎
3.1深度學習簡介
3.2卷積神經網絡
3.2.1卷積算子
3.2.2池化操作
3.2.3歸一化和正則化
3.2.4激活函數
3.2.5損失函數
3.2.6經典CNN
3.3生成式對抗網絡
3.3.1GAN架構
3.3.2GAN的訓練策略
3.3.3經典GAN
3.3.4GAN案例
3.4視覺註意力網絡
3.4.1線性嵌入層
3.4.2Transformer編碼器
3.5多層感知機
3.5.1多層感知機的原理
3.5.2純MLP神經網絡
3.6擴散模型
3.6.1去噪概率擴散模型
3.6.2基於分數的生成模型
3.6.3基於隨機微分方程的擴散模型
3.7圖神經網絡
3.7.1基於譜域的圖卷積神經網絡
3.7.2基於空域的圖卷積神經網絡
3.7.3GraphSAGE
3.7.4圖註意力網絡
3.8神經架構搜索
3.8.1搜索空間
3.8.2搜索策略
3.8.3性能評估策略
小結
習題
參考文獻
第2篇分類與識別篇
第4章視覺分類
4.1圖像分類
4.1.1圖像分類的操作過程
4.1.2圖像分類的常用數據集
4.1.3圖像分類的評價指標
4.1.4圖像分類的損失函數
4.1.5圖像分類方法
4.1.6基於深度學習的圖像分類方法
4.1.7圖像分類實例
4.2視頻分類
4.2.1視頻分類的操作過程
4.2.2視頻分類的常用數據集
4.2.3視頻分類方法
4.3細粒度分類
4.3.1細粒度分類的常用數據集
4.3.2細粒度分類方法
4.4視覺分類的實際應用
4.4.1醫學圖像分類
4.4.2農作物病害分類
小結
習題
參考文獻
第5章視覺識別
5.1圖像識別
5.1.1圖像識別的原理及過程
5.1.2圖像識別的應用
5.1.3圖像識別實例
5.2視頻識別
5.2.1視頻識別的原理及過程
5.2.2視頻識別的主要方法
5.3細粒度識別
5.3.1細粒度圖像識別的主要方法
5.3.2細粒度圖像識別的應用
5.4長尾識別
5.4.1長尾識別的主要方法
5.4.2長尾識別的應用
5.5光學字符識別
5.5.1OCR的基本處理流程
5.5.2基於OCR技術的車牌識別
5.6人臉識別
5.6.1人臉識別的技術原理
5.6.2人臉識別的常用數據集
5.6.3人臉識別的常用評價指標
5.6.4人臉識別的應用
小結
習題
參考文獻
第3篇檢測與分割篇
第6章目標檢測
6.1通用目標檢測
6.1.1Twostage目標檢測算法
6.1.2Onestage目標檢測算法
6.1.3基於錨框的目標檢測
6.1.4無錨框的目標檢測
6.1.5少樣本目標檢測
6.2微小目標檢測
6.3交通工具檢測
6.4其他目標檢測實例
小結
習題
參考文獻
第7章圖像分割
7.1語義分割
7.1.1語義分割的分類
7.1.2語義分割的實例
7.1.3語義分割的常用數據集
7.2實例分割
7.2.1實例分割的分類
7.2.2實例分割的實例
7.2.3實例分割的常用數據集
7.3全景分割
7.3.1全景分割的分類
7.3.2全景分割的實例
7.3.3全景分割的常用數據集
7.4醫學圖像分割
7.4.1結直腸息肉分割
7.4.2MRI腦瘤分割
7.4.3醫學圖像分割的常用數據集
7.5視頻目標分割
7.5.1視頻目標分割的分類
7.5.2視頻目標分割算法
7.5.3視頻目標分割的常用數據集
小結
習題
參考文獻
第8章顯著性目標檢測
8.1面向RGB圖像的顯著性檢測
8.1.1面向RGB顯著性檢測的主要方法
8.1.2多尺度特征提取
8.1.3基於註意力機制的特征增強
8.1.4邊緣信息引導的特征細化
8.1.5顯著性目標檢測與分割常用的評價指標
8.2面向RGBD圖像的顯著性檢測
8.2.1基於單分支結構的面向RGBD圖像的顯著性檢測
8.2.2基於雙分支結構的面向RGBD圖像的顯著性檢測
8.2.3基於三分支結構的面向RGBD圖像的顯著性檢測
8.3視頻顯著性檢測
8.4面向光場圖像的顯著性檢測
8.5聯合顯著性檢測
8.6面向遙感圖像的顯著性檢測
8.6.1兩階段的面向遙感圖像的顯著性檢測
8.6.2單階段的面向遙感圖像的顯著性檢測
8.6.3面臨的挑戰
小結
習題
參考文獻
第9章偽裝目標檢測
9.1偽裝技術
9.2偽裝目標檢測概述
9.2.1偽裝目標檢測的發展歷程
9.2.2偽裝目標檢測的應用
9.2.3偽裝目標檢測的常用數據集
9.3偽裝目標檢測網絡的組成
9.3.1偽裝目標檢測網絡的基本架構
9.3.2偽裝目標檢測網絡的損失函數
9.4基於CNN的偽裝目標檢測方法實例
小結
習題
參考文獻







