多模態數據分析:AGI時代的數據分析方法與實踐

巴川

  • 出版商: 電子工業
  • 出版日期: 2025-07-01
  • 售價: $648
  • 語言: 簡體中文
  • ISBN: 7121505908
  • ISBN-13: 9787121505904
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

商品描述

真實世界的數據都是多模態的,真正的通用人工智能(AGI)必將 單一模態的局限。本書基於作者多年工業界大數據技術經驗,系統而全面地探討了多模態數據技術,從基礎概念到關鍵技術再到典型應用, 講解多模態數據分析的核心技術與前沿實踐。書中首先詳盡介紹了多模態數據分析相關知識,涉及文本、圖像、音頻、視頻等多模態數據;然後結合實例代碼,系統介紹了統計學與數據分析、機器學習、深度學習、知識圖譜、大模型等方法和模型,以及GPT與DeepSeek等大模型的多模態實踐分析; 結合醫療、直播、視頻等領域的案例闡述了多模態數據分析的多種算法模型的綜合應用。 《多模態數據分析:AGI時代的數據分析方法與實踐》體系化強、案例豐富,以“理論框架—技術路徑—實戰案例”層層遞進的方式提供了完整的知識鏈路,主體基於Python語言的大量實例代碼,可以幫助讀者學以致用。 《多模態數據分析:AGI時代的數據分析方法與實踐》既可作為數據分析師、數據科學家、數據工程師、算法工程師等數據相關從業者的學習用書,也可作為高校數學、統計學、計算機等相關專業的師生用書和培訓學校的教材。

作者簡介

巴川, 數據科學家,曾就職於中國搜索、搜狐暢遊、競技世界等互聯網公司。主要研究領域包括數據挖掘、人工智能、知識圖譜、精細化運營、風控體系等。CCF TF數據科學SIG ,CAAI機器博弈專委會 ,曾任北京航空航天大學兼職碩導,西安交通大學研究生院授課專家,多所高校兼職授課教師、多個智庫技術專家。 00、QCon、DataFun、DTCC、SACC、WOT、A2M、CDAS、TID、GIEC、CCF青年精英大會、中國軟件技術大會、中國計算機教育大會等行業峰會演講嘉賓及出品人。另任中國 大學生創新大賽、CCF青年精英科技創業秀等多個創新創業大賽專家評委,多所高校創新創業導師,助力科研成果轉化落地。 李慧, 數據分析挖掘工程師,碩士畢業於北京航空航天大學,曾就職百度,任SACC、 00、DataFun、WOT等前沿技術大會演講嘉賓,專註多模態數據分析領域研究,在用戶增長、因果推斷、數據預測等方向積累了豐富實踐經驗,秉持數據賦能理念,擅長驅動數據價值落地與場景化應用。 鐘宇周,碩士畢業於北京大學光華管理學院,曾就職於競技世界、阿裏巴巴,目前為快手主站數據分析師,負責C端流量核心業務,擅長統計回歸分析、機器學習模型預測與推斷、自然語言處理技術,致力於探索技術與業務結合的多模態數據分析方法。 葉心函, 數據分析挖掘工程師,碩士畢業於 大學,在AI、風控和知識圖譜等領域有豐富的多模態數據分析經驗,並且見解獨特,擅長運用前沿算法和模型解決覆雜數據問題,助力企業實現精準決策與高效增長。

目錄大綱

第1章 多模態數據分析概述 1
1.1 什麼是多模態數據 1
1.2 多模態數據分析的意義 4
1.3 多模態數據分析的挑戰 7
1.4 小結 9
第2章 單一模態數據處理與分析 11
2.1 文本數據處理與分析 11
2.1.1 文本數據處理 12
2.1.2 文本分類與主題建模 21
2.2 圖像數據處理與分析 25
2.2.1 圖像數據處理 25
2.2.2 圖像目標檢測 35
2.3 音頻數據處理與分析 37
2.3.1 音頻數據預處理 38
2.3.2 音頻分類與事件檢測 46
2.4 視頻數據處理與分析 49
2.4.1 視頻數據預處理 50
2.4.2 行為識別與動作分析 60
2.5 小結 65
第3章 多模態數據融合 66
3.1 多模態數據融合的研究意義 66
3.2 多模態數據融合的常規方法 67
3.2.1 特征級融合 67
3.2.2 決策級融合 71
3.2.3 模型級融合 75
3.2.4 混合級融合 80
3.3 多模態數據融合的創新方法 84
3.3.1 基於深度學習的多模態特征自適應融合 84
3.3.2 基於跨模態語義對齊的一致性增強融合 89
3.3.3 基於圖的多模態圖像關系推理融合 92
3.4 小結 95
第4章 統計學與數據分析 96
4.1 統計學概述 96
4.2 基礎知識 98
4.2.1 描述統計 98
4.2.2 假設檢驗 105
4.3 相關性分析 107
4.4 回歸分析 109
4.4.1 回歸分析介紹 109
4.4.2 案例:二手車怎麼買 111
4.5 算法案例:基於相關性統計的短語詞雲 121
4.5.1 文本數據處理 121
4.5.2 短語詞雲算法原理與展示 125
4.6 小結 126
第5章 基於機器學習的多模態數據分析 128
5.1 經典機器學習算法介紹 128
5.1.1 線性回歸 129
5.1.2 邏輯回歸 130
5.1.3 支持向量機 131
5.1.4 決策樹 132
5.1.5 隨機森林 134
5.1.6 XGBoost 137
5.1.7 樸素貝葉斯 137
5.1.8 神經網絡 138
5.2 案例:基於支持向量機的車牌識別 140
5.3 案例:基於神經網絡的機器翻譯 150
5.4 小結 154
第6章 基於深度學習的多模態數據分析 156
6.1 深度學習介紹 156
6.2 卷積神經網絡及其數據分析案例 158
6.2.1 卷積神經網絡介紹 158
6.2.2 案例:顏值評分 160
6.3 序列數據應用—LSTM 167
6.3.1 循環神經網絡和LSTM介紹 167
6.3.2 案例:用模型作詩 169
6.4 深度學習擴展知識與應用 175
6.5 小結 180
第7章 基於知識圖譜的多模態數據分析 181
7.1 知識圖譜技術體系及其構建方法 181
7.1.1 知識圖譜技術體系 181
7.1.2 案例:構建知識圖譜 184
7.2 知識圖譜與多模態數據融合 190
7.2.1 融合的優勢及應用方向 190
7.2.2 案例:構建基於多模態知識圖譜的多標簽預測模型 191
7.3 知識圖譜推理與分析 203
7.3.1 推理與分析方法介紹 203
7.3.2 案例:基於圖神經網絡的知識圖譜給用戶 電影 204
7.4 知識圖譜數據分析的企業級拓展應用 208
7.4.1 用戶傳播路徑 208
7.4.2 用戶搜索觀星臺 209
7.4.3 用戶關系網絡及健康度評估 210
7.5 小結 212
第8章 基於大模型的多模態數據分析 213
8.1 大模型概述 213
8.1.1 大模型的定義與特點 213
8.1.2 大模型的基本原理 214
8.1.3 大模型在多模態數據分析中的重要作用 217
8.2 大模型應用架構 218
8.2.1 業務架構 218
8.2.2 技術架構 220
8.2.3 技術路線選擇 224
8.3 大模型在多模態數據分析中的應用 226
8.3.1 大模型助力多模態數據處理 226
8.3.2 大模型助力多模態數據融合 228
8.3.3 大模型助力多模態數據分析 230
8.4 GPT與DeepSeek:多模態數據分析領域的交鋒 231
8.4.1 GPT:多模態先驅,當下實力究竟幾何 231
8.4.2 DeepSeek:新晉黑馬,突破重圍有何獨特優勢 233
8.4.3  對壘:GPT與DeepSeek多模態數據分析比拼 235
8.5 小結 237
第9章 實戰案例:挖掘肺部病變,賦能精準醫療 239
9.1 多模態數據分析在醫療領域的發展和應用現狀 239
9.2 肺部病變識別的背景介紹 241
9.3 肺部病變識別的實踐過程 242
9.3.1 CT影像數據預處理 242
9.3.2 使用TensorFlow搭建CNN模型 250
9.3.3 使用模型識別疑似病竈圖像 255
9.4 小結 258
0章 實戰案例:剖析疾病數據,助力早期篩查 260
10.1 疾病早篩數據預處理 260
10.2 建立重大疾病預測模型 267
10.3 疾病早篩實際業務過程和價值預估 269
10.4 小結 272
1章 實戰案例:聚焦直播高光時刻,推動話題制造 273
11.1 直播數據特點 273
11.2 直播數據反饋 274
11.3 視覺內容識別 276
11.4 彈幕評論解析 280
11.5 音頻情感分析 283
11.6 協同確定直播高光時刻 286
11.7 小結 287
2章 實戰案例:解析優質視頻,汲取創作靈感 288
12.1 短視頻數據特點 288
12.2 使用多模態大模型做視頻分析的優勢和局限性 290
12.3 從視頻內容預處理到靈感孵化 293
12.4 數據驅動的靈感閉環 299
12.5 小結 301
數據是AI的基石 多模態是通向AGI的關鍵 多模態數據的一切盡在本書中 從基礎概念到關鍵技術,再到典型應用 講解多模態數據分析核心技術與前沿實踐 “理論框架—技術路徑—實戰案例”層層遞進 提供了一套完整的多模態數據分析知識鏈路 主體包括基於Python語言的大量實例代碼 不僅讓讀者學以致用,還能擁有實踐經驗 作者擁有多年工業界大數據技術實踐經驗 獲得業內眾多專家聯合力薦 既可作為數據分析師、數據科學家、數據工程師、 算法工程師等數據相關從業者的學習用書 也可作為高校數學、統計、計算機等相關專業教材 願你在AI時代浪潮中踏浪而行 翻出屬於自己的那朵美麗浪花