多模態深度學習實戰:方法、框架與實踐
趙輝 李海星 李瑤
- 出版商: 遼寧人民
- 出版日期: 2025-10-01
- 售價: $534
- 語言: 簡體中文
- 頁數: 219
- ISBN: 7205116147
- ISBN-13: 9787205116149
-
相關分類:
DeepLearning
下單後立即進貨 (約4週~6週)
商品描述
本書是 自然科學基金支持項目,圍繞多模 態深度學習展開,系統地介紹了核心方法、主流框 架及實踐應用。全書分為五篇,覆蓋基礎理論、自 然語言處理、計算機視覺、圖學習及綜合應用,重 點解析自然語言處理、計算機視覺、圖深度學習與 多模態深度學習的發展脈絡;以Transformer為核 心,詳解其結構、經典模型及其在生成式任務中的 應用。同時,本書聚焦圖卷積網絡與圖註意力網絡 ,從譜圖卷積到多頭註意力機制,探討其在節點分 類、圖對齊等問題中的應用,並提供實驗分析與方 法對比。 ,以多模態知識圖譜對齊為案例,整 合文本、圖像等模態編碼器,闡述多模態信息融合 與實體對齊的實踐方案。
目錄大綱
前言
篇 基礎
章 多模態深度學習概述
一、什麼是深度學習
二、深度學習發展情況
三、深度學習類型的劃分
四、本書內容組織
第二篇 自然語言處理
第二章 生成式模型基礎:Transformer
一、背景介紹
二、CBOW和Skip-gram模型
三、Transformer基本結構
四、Transformer應用
第三篇 計算機視覺
第三章 通用計算機視覺方法:ResNet
一、背景介紹
二、卷積神經網絡(CNN)
三、殘差網絡(ResNet)
四、ResNet代碼解析與實戰
第四章 目標檢測方法:YOLO
一、背景介紹
二、YOLO基本結構
三、YOLO的發展
四、基於YOLOv7的目標檢測
五、實驗結果與分析
第五章 從自然語言處理到計算機視覺:ViT
一、背景介紹
二、ViT基本結構
三、ViT代碼解析與實戰
第四篇 圖學習
第六章 拓撲結構卷積:GCN
一、背景介紹
二、圖卷積網絡(GCN)
三、GCN應用案例分析
第七章 從自然語言處理到圖學習:GAT
一、背景介紹
二、GAT基本原理
三、GAT應用案例分析
第五篇 綜合應用
第八章 多模態知識圖譜對齊研究
一、多模態知識圖譜對齊問題
二、多模態知識圖譜對齊方法MMS
三、實驗結果與分析
參考文獻
