電腦視覺 — 飛槳深度學習實戰

深度學習技術及應用國家工程研究中心百度技術培訓中心組編羅曉燕白浩傑黨青青杜宇寧張寶昌編著

預覽內頁

出版商: 清華大學
出版日期: 2023-04-01
定價: $419
售價: 8.5 折 $356
語言: 簡體中文
ISBN: 7302623767
ISBN-13: 9787302623762
相關分類: Computer Vision

立即出貨 (庫存 < 4)

買這商品的人也買了...

~~$880~~ $695

TinyML｜TensorFlow Lite 機器學習 : 應用 Arduino 與低耗電微控制器 (Tinyml: Machine Learning with Tensorflow Lite on Arduino and Ultra-Low-Power Microcontrollers)
~~$550~~ $429

突破困境：資安開源工具應用（iT邦幫忙鐵人賽系列書）
~~$580~~ $458

AI 手機 APP、智慧硬體專案實作｜使用 TensorFlow Lite (iOS/Android/RPi適用) (Intelligent Mobile Projects with TensorFlow: Build 10+ Artificial Intelligence apps using TensorFlow Mobile and Lite for iOS, Android, and Raspberry Pi)
~~$880~~ $695

深度學習實務應用｜雲端、行動與邊緣裝置 (Practical Deep Learning for Cloud, Mobile and Edge)
$659

深入理解電腦視覺：關鍵算法解析與深度神經網絡設計
$706

深入理解電腦視覺：在邊緣端構建高效的目標檢測應用
$551

自動駕駛：感知原理與實踐
$510

多模態大模型：技術原理與實戰
$469

LangChain 入門指南：構建高可復用、可擴展的 LLM 應用程序
~~$599~~ $569

企業級 DevOps 應用實戰基於 GitLab CI/CD 和雲端原生技術
$403

機器人技術基礎與應用實踐－基於模組化的機器人創意設計與實現
~~$680~~ $537

LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具
~~$690~~ $545

輕量又漂亮的 Python Web 框架 - Streamlit AI 時代非學不可
~~$888~~ $844

Streamlit 實戰指南 : 使用 Python 創建交互式數據應用
~~$880~~ $695

問 ChatGPT 也不會的 Python 量化交易聖經 - 從分析到真實交易一本全會
~~$480~~ $360

AI 超神筆記術：NotebookLM 高效資料整理與分析 250技
~~$714~~ $678

深度剖析 DeepSeek 大模型 : 原理開發與優化部署
~~$650~~ $507

生成式 AI 專案實踐指南：從模型挑選、上線、RAG 技術到 AI Agent 整合
~~$690~~ $545

GitHub Copilot 讓你寫程式快 10 倍！AI 程式開發大解放
$517

GitHub Copilot 編程指南
$594

MCP 原理與實戰：高效 AI Agent 智能體開發
~~$600~~ $450

不用自己寫！用 GitHub Copilot 搞定 LLM 應用開發
~~$750~~ $593

本地端 Ollama × LangChain × LangGraph × LangSmith 開發手冊：打造 RAG、Agent、SQL 應用
$469

AI Agent開發：零基礎構建復合智能體
$474

AI Agent 智能體與 MCP 開發實踐：基於 Qwen3 大模型

中文年末書展｜繁簡參展書2書75折詳見活動內容 »

75折
~~$780~~ $585

為你寫的 Vue Components：從原子到系統，一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)
75折
~~$960~~ $720

BDD in Action, 2/e (中文版)
75折
~~$750~~ $563

看不見的戰場：社群、AI 與企業資安危機
79折
~~$390~~ $308

AI 精準提問 × 高效應用：DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定
7折
~~$420~~ $294

超實用！Word．Excel．PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)
75折
~~$550~~ $412

裂縫碎光：資安數位生存戰
85折
~~$640~~ $544

日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集
79折
~~$630~~ $498

Google BI 解決方案：Looker Studio × AI 數據驅動行銷實作，完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini
79折
~~$599~~ $473

超有料 Plus！職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化！
75折
~~$690~~ $518

從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)
75折
~~$640~~ $480

Windows 11 制霸攻略：圖解 AI 與 Copilot 應用，輕鬆搞懂新手必學的 Windows 技巧
75折
~~$480~~ $360

精準駕馭 Word！論文寫作絕非難事 (好評回饋版)
~~$699~~ $629

Sam Yang 的插畫藝術：用 Procreate / PS 畫出最強男友視角 x 女孩美好日常
79折
~~$599~~ $473

AI 加持！Google Sheets 超級工作流
78折
~~$780~~ $608

想要 SSR? 快使用 Nuxt 吧!：Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化（iThome鐵人賽系列書）
75折
~~$500~~ $375

超實用！業務．總管．人資的辦公室 WORD 365 省時高手必備 50招 (第二版)
7折
~~$680~~ $476

Node-RED + YOLO + ESP32-CAM：AIoT 智慧物聯網與邊緣 AI 專題實戰
79折
~~$599~~ $473

「生成式⇄AI」：52 個零程式互動體驗，打造新世代人工智慧素養
7折
~~$720~~ $504

Windows APT Warfare：惡意程式前線戰術指南, 3/e
75折
~~$850~~ $637

我輩程式人：回顧從 Ada 到 AI 這條程式路，程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)
75折
~~$600~~ $450

不用自己寫！用 GitHub Copilot 搞定 LLM 應用開發
79折
~~$780~~ $616

Tensorflow 接班王者：Google JAX 深度學習又快又強大 (好評回饋版)
79折
~~$700~~ $553

GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)
79折
~~$460~~ $363

技術士技能檢定電腦軟體應用丙級術科解題教本｜Office 2021
75折
~~$560~~ $420

Notion 與 Notion AI 全能實戰手冊：生活、學習與職場的智慧策略 (暢銷回饋版)

商品描述

本書在介紹深度學習、百度飛槳等相關知識的基礎上，著重介紹了圖像分類、目標檢測、語義分割、人體關鍵點檢測、圖像生成、視頻分類、圖像文本檢測和識別、圖像識別等電腦視覺任務的實現原理及深度學習模型框架，並通過具體案例來詳細介紹各任務的實現細節。全書分為理論篇和實戰篇。理論篇（第1～4章）梳理了電腦視覺技術的發展歷程、主要任務、行業應用系統，同時簡要介紹了深度學習開發框架、飛槳（PaddlePaddle）開發平臺，以及深度學習的基礎知識與網絡模型架構。實戰篇（第5～12章）結合電腦視覺的各個任務要求與技術發展，對其中經典的深度學習算法模型進行介紹。全書提供了實例代碼，詳解了在飛槳開發框架下各任務的模型實現過程。本書適合作為高等院校人工智能、電腦視覺專業高年級本科生、研究生的教材，同時可作為電腦視覺相關任務實踐教程，也可以作為科研工作者的參考書籍。

目錄大綱

目錄

理論篇

第1章電腦視覺概述

1.1電腦視覺技術的發展

1.2電腦視覺任務概述

1.2.1電腦視覺經典任務

1.2.2電腦視覺常見任務

1.3電腦視覺處理應用系統

1.3.1電腦視覺行業產業鏈

1.3.2電腦視覺行業應用系統

1.4電腦視覺處理常用工具

1.4.1OpenCV簡介

1.4.2OpenCVPython

1.4.3OpenCV的基礎模塊

1.4.4其他CV常用工具

1.5本章小結

參考文獻

第2章深度學習開發框架

2.1常見的深度學習開發框架

2.1.1TensorFlow深度學習開發框架

2.1.2PyTorch深度學習開發框架

2.1.3PaddlePaddle深度學習開發框架

2.2飛槳基礎

2.2.1開發環境

2.2.2開發套件

2.2.3工具組件

2.2.4開發平臺

2.3本章小結

參考文獻

第3章深度學習算法基礎

3.1機器學習

3.2神經網絡的基本組成

3.2.1神經元

3.2.2神經網絡的結構

3.3神經網絡的計算

3.3.1激活函數

3.3.2正向傳播

3.3.3反向傳播

3.3.4優化算法

3.4捲積神經網絡的基本組成

3.4.1捲積層

3.4.2池化層

3.4.3ReLU激活函數

3.4.4全連接層

3.5深度學習模型的訓練技巧

3.5.1歸一化

3.5.2丟棄法

3.5.3權重衰減

3.5.4參數初始化

3.6本章小結

參考文獻

第4章深度學習網絡模型

4.1深度學習網絡架構

4.2代表性的網絡模型

4.2.1捲積神經網絡模型

4.2.2循環神經網絡模型

4.2.3Transformer網絡模型

4.2.4復雜MLP網絡模型

4.3網絡搭建案例

4.3.1環境準備

4.3.2數據準備

4.3.3模型構建

4.3.4模型訓練與驗證

4.3.5模型可視化

4.4本章小結

參考文獻

實戰篇

第5章圖像分類算法原理與實戰

5.1圖像分類任務的基本介紹

5.1.1圖像分類技術的發展

5.1.2圖像分類的評價指標

5.2基於殘差的網絡

5.2.1ResNet模型

5.2.2DenseNet模型

5.2.3DPN模型

5.3基於Transformer的網絡

5.3.1ViT模型

5.3.2SwinTransformer模型

5.4輕量化的網絡

5.4.1MobileNet模型

5.4.2PPLCNet模型

5.5飛槳實現圖像分類案例

5.5.1環境安裝與配置

5.5.2數據準備

5.5.3模型構建

5.5.4模型訓練

5.5.5模型預測

5.6本章小結

參考文獻

第6章目標檢測算法原理與實戰

6.1目標檢測任務基本介紹

6.1.1目標檢測技術的發展

6.1.2目標檢測的評價指標

6.2Faster RCNN基本解析

6.2.1RCNN系列

6.2.2Faster RCNN整體架構

6.2.3Faster RCNN主要特點

6.3SSD基本解析

6.3.1SSD基本架構

6.3.2SSD主要特點

6.4YOLOv3基本解析

6.4.1YOLO系列

6.4.2YOLOv3主要特點

6.5FCOS基本解析

6.5.1FCOS基本架構

6.5.2FCOS主要特點

6.5.3損失函數的設計

6.5.4FCOS的優缺點

6.6DETR基本解析

6.6.1DETR基本結構

6.6.2DETR主要特點

6.7飛槳實現目標檢測案例

6.7.1環境準備

6.7.2數據讀取與增強

6.7.3模型構建

6.7.4模型訓練

6.7.5模型測試與可視化

6.8本章小結

參考文獻

第7章語義分割算法原理與實戰

7.1語義分割任務的基本介紹

7.1.1語義分割的發展

7.1.2語義分割的評價指標

7.2深度學習語義分割基礎網絡

7.2.1FCN模型

7.2.2SegNet模型

7.2.3UNet模型

7.3語義分割網絡的系列改進

7.3.1空洞可分離捲積： DeepLabv3+

7.3.2低層細節信息保留： RefineNet

7.3.3全局語義特徵聚合： OCRNet

7.4飛槳實現語義分割案例

7.4.1環境準備

7.4.2數據準備與預處理

7.4.3模型構建

7.4.4模型訓練

7.4.5模型驗證與評估

7.5本章小結

參考文獻

第8章人體關鍵點檢測原理與實戰

8.1人體關鍵點檢測任務的基本介紹

8.1.1人體關鍵點檢測的發展

8.1.2人體關鍵點檢測的評價指標

8.2人體關鍵點檢測的經典方法

8.2.1模板匹配

8.2.2貝葉斯估計

8.3多尺度人體姿態檢測方法

8.3.1Hourglass模型架構

8.3.2一階Hourglass模塊

8.3.3多階Hourglass網絡

8.4高分辨率人體姿態估計方法

8.4.1HRNet模型

8.4.2HigherHRNet 模型

8.5人體姿態識別OpenPose

8.5.1捲積姿態機CPM

8.5.2OpenPose架構

8.6飛槳實現人體關鍵點檢測案例

8.6.1環境準備

8.6.2數據集準備

8.6.3模塊導入

8.6.4數據集定義

8.6.5模型構建

8.6.6損失函數定義

8.6.7模型訓練

8.6.8模型預測

8.7本章小結

參考文獻

第9章圖像生成算法原理與實戰

9.1圖像生成任務的基本介紹

9.1.1圖像生成應用與發展

9.1.2圖像生成的評價指標

9.2基於圖像生成的圖像轉換： Pix2Pix

9.3基於圖像生成的風格遷移： CycleGAN

9.3.1CycleGAN的網絡結構

9.3.2CycleGAN的循環訓練流程

9.4基於圖像生成算法的圖像屬性控制： StyleGAN

9.4.1StyleGANv1的網絡結構與訓練技巧

9.4.2StyleGANv1對隱空間耦合度的量化

9.4.3StyleGANv2的改進

9.5飛槳實現圖像生成案例

9.5.1環境準備

9.5.2數據讀取與預處理

9.5.3模型構建

9.5.4模型訓練

9.5.5模型驗證與評估

9.5.6模型測試

9.6本章小結

參考文獻

第10章視頻分類原理與實戰

10.1視頻分類任務的基本介紹

10.1.1視頻分類的應用與發展

10.1.2視頻分類任務的評價指標

10.2基於時序劃分的雙流網絡

10.2.1TSN模型

10.2.2SlowFast模型

10.3基於時序移位的類3D網絡： TSM

10.3.1類3D思想

10.3.2網絡設計

10.4基於自註意力機制的網絡

10.4.1Nonlocal模型

10.4.2TimeSformer模型

10.5飛槳實現視頻分類案例

10.5.1環境準備

10.5.2數據讀取與預處理

10.5.3模型構建

10.5.4模型訓練

10.5.5模型驗證與評估

10.5.6模型測試

10.6本章小結

參考文獻

第11章圖像文本檢測和識別原理與實戰

11.1圖像文本檢測和識別任務的基本介紹

11.1.1OCR任務的應用與發展

11.1.2OCR任務的評價指標

11.2文本檢測算法

11.2.1小尺度文本檢測算法： CTPN

11.2.2場景文本檢測算法： EAST

11.2.3任意形狀文本檢測器： SAST

11.2.4二值化檢測模型： DBNet

11.3文本識別算法

11.3.1基於捲積循環神經網絡的識別模型： CRNN

11.3.2基於空間註意力殘差網絡的識別模型： STARNet

11.3.3具有自動校正功能的魯棒識別模型： RARE

11.3.4基於語義推理網絡的識別模型： SRN

11.4端到端ORC方法

11.4.1FOTS模型

11.4.2PGNet模型

11.5飛槳實現OCR案例

11.5.1環境準備

11.5.2數據讀取與預處理

11.5.3模型構建

11.5.4CTC Loss

11.5.5訓練配置

11.5.6模型訓練

11.5.7驗證前準備

11.5.8開始驗證

11.6本章小結

參考文獻

第12章圖像識別原理與實戰

12.1圖像識別系統任務流程基本概述

12.1.1圖像識別任務基本介紹

12.1.2百度飛槳圖像識別系統簡介

12.2目標檢測模塊

12.3特徵學習模塊

12.3.1度量學習算法原理及主要內容

12.3.2深度度量學習常見算法框架

12.3.3百度飛槳中深度度量學習應用

12.4特徵檢索系統

12.4.1特徵檢索系統介紹

12.4.2特徵檢索原理介紹

12.5飛槳實現圖像識別應用案例

12.5.1環境配置

12.5.2已知類別的圖像識別

12.5.3商品識別與檢索

12.5.4基於新的索引庫的圖像識別

12.6本章小結

參考文獻

電腦視覺 — 飛槳深度學習實戰

深度學習技術及應用國家工程研究中心百度技術培訓中心組編羅曉燕白浩傑黨青青杜宇寧張寶昌編著

買這商品的人也買了...

中文年末書展｜繁簡參展書2書75折詳見活動內容 »

相關主題

商品描述

目錄大綱

類似商品

最後瀏覽商品 (1)

電腦視覺 — 飛槳深度學習實戰

深度學習技術及應用國家工程研究中心 百度技術培訓中心 組編 羅曉燕 白浩傑 黨青青 杜宇寧 張寶昌 編著

買這商品的人也買了...

中文年末書展｜繁簡參展書2書75折 詳見活動內容 »

相關主題

商品描述

目錄大綱

類似商品

最後瀏覽商品 (1)

深度學習技術及應用國家工程研究中心百度技術培訓中心組編羅曉燕白浩傑黨青青杜宇寧張寶昌編著

中文年末書展｜繁簡參展書2書75折詳見活動內容 »