深度學習圖像搜索與識別
潘攀
- 出版商: 電子工業
- 出版日期: 2021-03-01
- 定價: $654
- 售價: 7.9 折 $517
- 語言: 簡體中文
- 頁數: 228
- 裝訂: 平裝
- ISBN: 7121407493
- ISBN-13: 9787121407499
-
相關分類:
影像辨識 Image-recognition
立即出貨(限量) (庫存=3)
買這商品的人也買了...
-
$250機器學習線性代數基礎 (Python 語言描述) -
Python 非同步設計|使用 Asyncio (Using Asyncio in Python )$480$379 -
$403PyTorch 生成對抗網絡編程 -
$403機器學習中的概率統計:Python 語言描述 -
寫給程式設計師的深度學習|使用 fastai 和 PyTorch (Deep Learning for Coders with fastai and PyTorch)$980$774 -
深度強化式學習 (Deep Reinforcement Learning in Action)$1,000$790 -
$505深入淺出 Embedding:原理解析與應用實踐 -
$469神經網絡與深度學習案例與實踐 -
$458BERT 基礎教程:Transformer 大模型實戰 -
線性代數 (原書第10版)$594$564 -
$422Scikit-learn機器學習高級進階 -
Real Python 人氣站長教你動手寫程式 - 不說教也能心領神會的引導式實作課 (Python Basics: A Practical Introduction to Python 3, 4/e)$750$592 -
$469精通 Transformer : 從零開始構建最先進的 NLP 模型 -
$359深度學習在自然語言處理中的應用 : 從詞表徵到 ChatGPT -
$374情感分析進階 -
$407自然語言處理遷移學習實戰 -
$422擴散模型:生成式 AI 模型的理論、應用與代碼實踐 -
$422從零開始大模型開發與微調:基於 PyTorch 與 ChatGLM -
$556大規模語言模型:從理論到實踐 -
6G 智能超錶面 (RIS) 技術初探$528$502 -
$421ChatGLM3 大模型本地化部署、應用開發與微調 -
$500進化深度學習 -
$426大模型應用開發 : 動手做 AI Agent -
$662深度學習高手筆記 捲2:經典應用 -
$1,019知識定義的6G網絡通感算資源智能調度
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
圖像搜索和識別是電腦視覺領域一個非常重要且基礎的題目。本書對構成圖像搜索和識別系統的各個算法基礎模塊一一做了介紹,並在最後一章以拍立淘為例說明瞭各個模塊是怎樣一起工作的。針對每個算法模塊,本書不僅深入淺出地解釋了算法的工作原理,還對算法背後的演進機理和不同方法的特點進行了說明,在第2至第8章最後均提供了經典算法的PyTorch代碼和相關參考資料。本書既適合圖像搜索和識別領域的初學者,也適合在某個單一任務方面有經驗但是想擴充知識面的讀者。
作者簡介
潘攀,花名啟磐。
阿裡巴巴集團資深算法專家,達摩院視覺理解&互動視覺負責人,負責電商領域的視覺技術研發。
拍立淘以圖搜圖的負責人和創始人之一,為拍立淘、淘寶直播&短視頻、虛擬主播、閒魚等業務提供核心技術。
博士畢業於美國伊利諾伊大學芝加哥分校,研究領域包括深度學習和計算機視覺等。
曾先後在美國三菱研究院和北京富士通研發中心從事視覺技術研發工作。
已發表20餘篇論文,擁有10餘授權專利,並獲得WebVision分類,COCO檢測,DAVIS分割等國際計算機視覺競賽冠軍。
目錄大綱
1概述1
1.1圖像搜索與識別概述1
1.2圖像搜索與識別技術的發展和應用3
1.3深度學習與圖像搜索和識別4
1.4本書結構6
2深度捲積神經網絡8
2.1概述8
2.1.1深度學習背景8
2.1.2深度捲積神經網絡9
2.2 CNN基礎操作11
2.2.1捲積操作11
2.2.2池化操作12
2.2.3全連接層13
2.2.4激活層14
2.2.5批歸一化層14
2.2.6小結16
2.3常見的CNN模型結構16
2.3.1網絡結構超參數17
2.3.2單分支網絡結構19
2.3.3多分支網絡結構24
2.3.4小結38
2.4常見目標損失函數38
2.5本章總結40
2.6參考資料40
3圖像分類43
3.1概述43
3.2單標記分類44
3.2.1常用數據集及評價指標44
3.2.2損失函數45
3.2.3提升分類精度的實用技巧47
3 .2.4基於搜索的圖像分類50
3.3細粒度圖像分類51
3.3.1概述51
3.3.2基於部件對齊的細粒度分類方法52
3.3.3基於高階特徵池化的細粒度分類方法55
3.3.4小結56
3.4多標記圖像分類56
3.4.1概述56
3.4.2 baseline:一階方法58
3.4.3標記關係建模59
3.4.4小結60
3.5代碼實踐61
3.6本章總結63
3.7參考資料63
4目標檢測66
4.1概述66
4.2兩階段目標檢測算法68
4.2.1候選框生成69
4.2.2特徵抽取71
4.2.3訓練策略73
4 .2.4小結76
4.3單階段目標檢測算法76
4.3.1 YOLO算法76
4.3.2 SSD算法78
4.3.3 RetinaNet算法81
4.3.4無錨點框檢測算法83
4.3.5小結87
4.4代碼實踐88
4.5本章總結91
4.6參考資料92
5圖像分割95
5.1概述95
5.2語義分割96
5.2.1概述96
5.2.2全捲積神經網絡97
5.2.3空洞捲積99
5.2.4 U-Net結構100
5.2.5條件隨機場關係建模101
5.2.6 Look Wider to See Better 103
5.2.7 Atrous Spatial Pyramid Pooling算法104
5.2.8 Context Encoding for Semantic Segmentation 104
5.2.9多卡同步批歸一化107
5.2.10小結107
5.3實例分割108
5.3.1概述108
5.3.2 FCIS 109
5.3.3 Mask R-CNN 111
5.3.4 Hybrid Task Cascade框架113
5.3.5小結115
5.4代碼實踐115
5. 5本章總結120
5.6參考資料120
6特徵學習124
6.1概述124
6.2基於分類識別的特徵訓練126
6.2.1 Sigmoid函數127
6.2.2 Softmax函數128
6.2.3 Weighted Softmax函數129
6.2.4 Large-Margin Softmax函數130
6.2.5 ArcFace函數132
6.2.6小結133
6.3基於度量學習的特徵訓練134
6.3.1 Contrastive損失函數135
6.3.2 Triplet損失函數137
6.3.3三元組損失函數在行人再識別中的應用139
6.3.4 Quadruplet損失函數140
6.3.5 Listwise Learning 141
6.3.6組合損失函數142
6.3.7小結142
6.4代碼實踐143
6.5本章總結143
6. 6參考資料144
7向量檢索147
7.1概述147
7.2局部敏感哈希算法149
7.2.1預處理150
7.2.2搜索151
7.2.3小結152
7.3乘積量化系列算法152
7.3.1 PQ算法153
7.3.2 IVFPQ算法155
7.3.3 OPQ算法156
7.3.4小結157
7.4圖搜索算法157
7.4.1 NSW算法158
7. 4.2 Kgraph算法161
7.4.3 HNSW算法163
7.4.4圖搜索算法實驗對比165
7.4.5小結165
7.5代碼實踐166
7.6本章總結167
7.7參考資料168
8圖文理解171
8.1概述171
8.2圖文識別172
8.2.1概述172
8.2.2數據集和評測標準174
8.2.3特徵融合方法176
8.2.4小結182
8.3圖文搜索182
8.3.1概述182
8.3.2數據集和評測標準184
8.3.3 Dual Attention Networks 185
8.3.4 Bottom-Up Attention 187
8.3.5圖文搜索的損失函數189
8.3.6小結190
8.4代碼實踐191
8.5本章總結194
8.6參考資料194
9阿裡巴巴圖像搜索識別系統197
9.1概述197
9.2背景介紹198
9.3圖像搜索架構200
9.3.1類目預測模塊200
9.3.2目標檢測和特徵聯合學習201
9. 3.3圖像索引和檢索205
9.4實驗和結果分析207
9.5本章總結210
9.6參考資料211
