媒體與認知——現代機器學習與深度學習方法

王生進、彭良瑞、李亞利、方璐

  • 出版商: 清華大學
  • 出版日期: 2026-06-01
  • 售價: $534
  • 語言: 簡體中文
  • ISBN: 7302715645
  • ISBN-13: 9787302715641
  • 相關分類: DeepLearning
  • 下單後立即進貨 (約4週~6週)

  • 媒體與認知——現代機器學習與深度學習方法-preview-1
  • 媒體與認知——現代機器學習與深度學習方法-preview-2
  • 媒體與認知——現代機器學習與深度學習方法-preview-3
  • 媒體與認知——現代機器學習與深度學習方法-preview-4
  • 媒體與認知——現代機器學習與深度學習方法-preview-5
  • 媒體與認知——現代機器學習與深度學習方法-preview-6
  • 媒體與認知——現代機器學習與深度學習方法-preview-7
媒體與認知——現代機器學習與深度學習方法-preview-1

商品描述

"本書涵蓋經典機器學習方法以及近年來發展迅速的深度學習和大模型的內容,在全面介紹人工智能領域的媒體認知、認知的生物機理、機器學習、深度學習以及**的 Transformer與大模型等基礎知識的基礎上,著重介紹回歸與分類、支持向量機、集成學習、卷積神經網絡、循環神經網絡、貝葉斯決策、註意力機制、Transformer語言模型和多模態模型等現代機器學習的算法原理,並通過模擬視覺註意力機制的顯著性計算、復制與近似圖像檢索、檢測與識別等實際用例的算法過程來說明如何應用機器學習進行實際的媒體認知計算。 本書共9章,分為5部分:第1部分(第1、2章)為基礎篇,第2部分(第3章)為經典篇,第3部分(第4~7章)為現代篇,第4部分(第8章)為決策篇,第5部分(第9章)為應用篇。全書提供了大量計算實例,每章後均附有習題。 本書可作為高等院校電子信息類、計算機類、人工智能等相關專業高年級本科生、低年級研究生的教材,也可供從事電子工程、信息技術、人工智能、機器人等相關領域的研發人員、科技工作者和研究人員參考,是一本專業性和通用性兼顧的現代機器學習和深度學習教材。 "

作者簡介

"王生進,清華大學長聘教授、博士生導師,中國圖像圖形學會視頻圖像與安全專委會主任。長期從事計算機視覺、機器學習、具身智能研究。主持多項國家自然科學基金項目、863項目、國家科技支撐計劃、重點研發計劃課題等。研究成果獲得國家科技進步獎1次和省部級科學技術獎4次。連續6年入選愛思唯爾中國高被引學者榜單。彭良瑞,清華大學副研究員、博士生導師,IEEE高級會員。研究方向為機器視覺與人機交互、智能圖文信息處理等。作為負責人承擔多項國家自然科學基金項目、科技部重點研發計劃課題以及國際合作項目等,參與TH-OCR多文種文檔識別系統研制及產業化推廣,獲國家科技進步獎二等獎3次。李亞利,清華大學副研究員,CSIG視頻圖像與安全委員會成員。長期從事智能視覺識別與理解的研究。主持十四五重點研發計劃課題、國家自然科學基金青年項目等。獲吳文俊人工智能科學獎二等獎、公安部科學技術獎、ICPR賽道**論文獎、ICCPR**論文獎、ECCV無人機目標檢測挑戰賽等。方璐,清華大學教授、博士生導師,國家傑青。長期從事光場智能感知與計算的教學和科研工作。近5年發表SCI源刊論文30余篇,包括Nature 5篇、Science 1篇。主持國家自然科學基金項目5項。獲國際Falling Walls科學突破獎、何梁何利獎、中國青年科技獎、科學探索獎。出版光場成像與智能處理方面的英文專著1部。"

目錄大綱

 

目錄

 

 

 

 

第1章媒體認知與人工智能

 

1.1信息、媒體與認知

 

1.1.1信息表征

 

1.1.2媒體形態

 

1.1.3信號分析與信息處理

 

1.1.4認知與人工智能

 

1.2人工智能的誕生與學術流派

 

1.2.1人工智能的誕生

 

1.2.2人工智能的學術流派

 

1.3深度學習時代

 

1.3.1深度神經網絡模型

 

1.3.2反向傳播算法

 

1.3.3深度學習發展與應用

 

1.4大模型來臨

 

1.4.1ChatGPT的誕生

 

1.4.2大模型的本質

 

1.4.3大模型的特點

 

1.4.4人工智能生成內容

 

1.5人工智能應用場景領域

 

1.5.1計算機視覺

 

1.5.2生物特征識別

 

1.5.3智能交通與無人駕駛

 

習題

 

第2章認知的生物機理

 

2.1腦與感知認知

 

2.1.1大腦與神經元

 

2.1.2認知心理學概要

 

2.2知覺

 

2.2.1知覺的特性

 

2.2.2知覺的信息加工

 

2.2.3模式與模式識別 

 

2.3註意

 

2.3.1註意的分類

 

2.3.2註意與特征整合理論

 

2.3.3註意機制的神經網絡模型

 

2.4記憶

 

2.4.1記憶的模式

 

2.4.2記憶的神經網絡模型

 

2.5視覺感知模型

 

2.5.1生物視覺感知結構

 

2.5.2視覺信息處理機制

 

2.5.3視覺特征計算

 

習題

 

 

 

 

 

第3章機器學習

 

3.1機器學習基本概念

 

3.1.1基本定義

 

3.1.2線性回歸模型

 

3.1.3線性分類模型

 

3.2支持向量機

 

3.2.1線性可分問題

 

3.2.2近似線性可分問題

 

3.2.3非線性分類問題

 

3.2.4基於支持向量機的多分類任務

 

3.3集成學習方法

 

3.3.1決策樹

 

3.3.2Bagging方法

 

3.3.3Boosting方法

 

3.3.4梯度提升決策樹

 

3.4模型選擇與評估

 

3.4.1模型的擬合能力

 

3.4.2分類任務評價指標

 

3.4.3回歸任務評價指標

 

3.4.4模型的評估方法

 

習題

 

第4章深度學習

 

4.1神經元模型

 

4.1.1生物神經元模型

 

4.1.2人工神經元模型

 

4.2感知器模型

 

4.3全連接前饋神經網絡

 

4.3.1多層感知器

 

4.3.2激活函數

 

4.3.3損失函數

 

4.4BP學習算法

 

4.5深度網絡優化

 

4.5.1梯度下降法

 

4.5.2參數初始化

 

4.5.3優化器

 

4.5.4梯度消失與梯度爆炸

 

4.6無監督深度學習

 

4.6.1深度置信網絡

 

4.6.2自編碼器

 

4.6.3自監督學習

 

習題

 

第5章卷積神經網絡

 

5.1卷積神經網絡的基本結構

 

5.1.1卷積層

 

5.1.2卷積層的拓展與變種

 

5.1.3池化層

 

5.1.4歸一化處理

 

5.2典型卷積神經網絡結構

 

5.2.1常規卷積神經網絡結構

 

5.2.2輕量化卷積神經網絡結構

 

5.3卷積神經網絡的神經生理學關聯

 

5.4卷積神經網絡應用

 

5.4.1語義分割

 

5.4.2目標檢測

 

5.4.3實例分割

 

5.4.4圖像生成

 

習題

 

第6章循環神經網絡

 

6.1經典循環神經網絡

 

6.1.1序列建模

 

6.1.2基本單元

 

6.1.3優化學習

 

6.1.4變體及拓展結構

 

6.1.5梯度截斷

 

6.1.6長期依賴

 

6.2帶門控機制的循環神經網絡

 

6.2.1長短時記憶網絡

 

6.2.2門控循環單元

 

6.3深度循環神經網絡

 

6.4循環神經網絡的神經生理學關聯

 

6.5循環神經網絡應用

 

6.5.1預訓練語言模型ELMo

 

6.5.2機器翻譯

 

6.5.3圖像描述

 

6.5.4視頻動作識別

 

習題

 

第7章Transformer與大模型

 

7.1註意力機制與Transformer模型

 

7.1.1註意力機制

 

7.1.2自註意力機制

 

7.1.3多頭自註意力機制

 

7.1.4交叉註意力機制

 

7.1.5Transformer模型架構

 

7.1.6計算復雜度

 

7.1.7解碼搜索采樣策略

 

7.2Transformer語言模型

 

7.2.1詞嵌入

 

7.2.2自回歸模型

 

7.2.3僅包含解碼器的Transformer語言模型

 

7.2.4僅包含編碼器的Transformer語言模型

 

7.2.5Transformer模型改進技術

 

7.2.6大語言模型的訓練

 

7.3Transformer與視覺編碼器

 

7.3.1視覺Transformer

 

7.3.2文生圖模型

 

習題

 

第8章特征學習與貝葉斯決策

 

8.1特征提取

 

8.1.1圖像特征提取

 

8.1.2語音特征提取

 

8.1.3文本特征提取

 

8.2特征降維

 

8.2.1主成分分析

 

8.2.2線性判別分析

 

8.3貝葉斯決策

 

8.3.1貝葉斯公式

 

8.3.2正態分布下的貝葉斯決策

 

8.3.3模式識別系統的信息熵分析

 

8.4非監督學習

 

8.4.1K均值聚類

 

8.4.2高斯混合模型

 

8.5基於隱含馬爾可夫模型的序列建模

 

8.5.1基本原理

 

8.5.2評估問題求解

 

8.5.3解碼問題求解

 

8.5.4學習問題求解

 

習題

 

第9章視覺感知與認知計算

 

9.1模擬視覺註意機制的顯著性計算

 

9.1.1視覺註意與圖像顯著性

 

9.1.2基於註意窗估計的顯著性檢測方法

 

9.2近似復制圖像檢索

 

9.2.1視覺特征與視覺單詞

 

9.2.2多層次特征融合

 

9.2.3基於倒排表的圖像檢索

 

9.3人臉檢測與識別

 

9.3.1人臉檢測

 

9.3.2人臉識別

 

9.4圖像分類

 

9.4.1單標簽與多標簽圖像分類

 

9.4.2圖像分類方法

 

9.5媒體與認知相互作用

 

9.5.1媒體拓展人類認知邊界

 

9.5.2視覺暫留與影視技術

 

9.5.3立體視覺與立體顯示

 

9.5.4虛擬現實與增強現實

 

習題

 

參考文獻