人工智能數據服務(微課版)

王珊珊,梁同樂,黃永健

  • 出版商: 人民郵電
  • 出版日期: 2026-06-01
  • 定價: $299
  • 售價: $298
  • 語言: 簡體中文
  • ISBN: 7115691371
  • ISBN-13: 9787115691378
  • 相關分類: AI Coding
  • 下單後立即進貨 (約4週~6週)

  • 人工智能數據服務(微課版)-preview-1
人工智能數據服務(微課版)-preview-1

相關主題

商品描述

本書涵蓋從數據采集、數據預處理、數據標註到數據標註質量管理的完整流程,旨在為讀者構建一套全面、實用且具有前瞻性的人工智能數據服務知識體系。 在內容編排上,本書以理論、方法、實踐相結合的方式逐步展開。第1章介紹人工智能數據服務的定義、技術特征、行業背景與典型應用案例等,幫助讀者建立整體認知。第2章至第3章深入講解數據采集與預處理的關鍵技術,包括數據采集的基本概念與方法、數據格式與標準化管理、合規性管理、數據清洗技術、數據變換、數據集構建等,為讀者後續學習標註數據打好基礎。第4章至第9章依次介紹文本、圖像、語音、視頻、三維點雲等典型數據的標註方法與工具應用,並結合真實案例帶領讀者進行實操訓練。第10章聚焦數據標註質量管理,全面闡述質檢方法、質檢流程等內容,提升讀者對輸出高質量數據的理解與實踐能力。 本書適合高等學校人工智能、計算機科學與技術、數據科學與大數據技術等相關專業的學生學習,也適合作為從事數據處理、模型訓練、智能系統開發等工作的工程技術人員和教育培訓者的指導讀物。對於希望系統掌握人工智能數據服務全流程知識、具備一線實操能力的讀者而言,本書將提供堅實的理論基礎與完整的實踐路徑。

作者簡介

王珊珊,高級工程師、副教授。研究方向涵蓋人工智能算法、大數據分析與智能系統。主持省級科研項目及多項橫向課題,在智慧醫療、材料分析與教育信息化等方向取得應用成果。擁有國家實用新型專利與多項軟件著作權,主持開發國際化課程並在海外高校開展教學。

目錄大綱

第 1章 人工智能數據服務概述 1

1.1 什麼是人工智能數據服務 1

1.1.1 人工智能數據服務的定義 1

1.1.2 數據服務類型 1

1.1.3 人工智能數據服務的技術特征 2

1.2 人工智能數據服務行業背景 3

1.2.1 全球人工智能發展的推動力 3

1.2.2 中國人工智能數據服務行業的

崛起 3

1.2.3 行業生態的多元化構成 4

1.2.4 行業發展面臨的主要問題 5

1.2.5 行業的轉型趨勢 6

1.2.6 國家政策支持與監管框架建設 7

1.2.7 行業發展前景與人才需求趨勢 8

1.3 人工智能數據服務流程 8

1.4 人工智能數據服務在產業中的典型

應用案例 9

1.4.1 醫療健康領域:騰訊的醫學影像

數據平臺 9

1.4.2 智能交通領域:滴滴的交通大數據

平臺 9

1.4.3 金融科技領域:螞蟻集團的智能

風控系統 9

1.4.4 工業制造領域:華為雲工業

智能體 10

1.5 小結 10

1.6 習題 10

1.7 課後拓展 11

第 2章 數據采集技術 13

2.1 數據采集的基本概念 13

2.1.1 數據采集的定義及核心目標 13

2.1.2 數據采集的分類體系 14

2.2 數據采集方法 16

2.2.1 網絡數據爬取 16

2.2.2 物聯網設備采集 25

2.2.3 第三方API接入 26

2.3 數據格式與標準化管理 27

2.3.1 常見數據格式 27

2.3.2 元數據管理 28

2.4 合規性管理 29

2.4.1 隱私保護技術 29

2.4.2 數據授權與審計 30

2.5 小結 31

2.6 習題 31

2.7 課後拓展 32

第3章 數據預處理 34

3.1 數據預處理基礎 34

3.1.1 數據預處理的目標與原則 34

3.1.2 數據質量評估指標 35

3.2 數據清洗技術 37

3.2.1 去除重復值與噪聲 37

3.2.2 缺失值處理 38

3.2.3 異常值檢測 38

3.3 數據轉換 39

3.3.1 標準化與歸一化 39

3.3.2 離散化與編碼 39

3.4 數據集構建 40

3.4.1 數據劃分方法 40

3.4.2 樣本平衡技術 41

3.5 小結 42

3.6 習題 42

3.7 課後拓展 43

第4章 數據標註簡介 45

4.1 數據標註的概念 45

4.1.1 數據標註的應用 45

4.1.2 數據標註分類 46

4.2 數據標註的類型 48

4.2.1 文本數據標註 48

4.2.2 圖像數據標註 48

4.2.3 語音數據標註 49

4.2.4 視頻數據標註 49

4.2.5 三維點雲標註 50

4.2.6 AI大模型標註 51

4.3 數據標註涉及技術 51

4.3.1 算法 51

4.3.2 數據格式 56

4.3.3 數據標註工具 60

4.4 數據標註步驟 62

4.4.1 數據收集 62

4.4.2 任務理解 63

4.4.3 標註準備 63

4.4.4 數據標記 63

4.4.5 質量控制 63

4.4.6 數據質檢 64

4.4.7 數據集整合 64

4.4.8 反饋與疊代 64

4.5 小結 65

4.6 習題 65

4.7 課後拓展 66

第5章 文本數據標註 67

5.1 文本數據標註概念 67

5.1.1 什麼是文本數據標註 67

5.1.2 文本數據標註因素和規範 68

5.1.3 文本數據標註應用領域 70

5.2 文本數據標註分類 71

5.2.1 實體標註 71

5.2.2 實體關系標註 73

5.2.3 文本屬性標註 73

5.2.4 文檔分類標註 74

5.2.5 閱讀理解標註 74

5.2.6 多實體標註 75

5.2.7 情感色彩標註 75

5.3 文本數據標註的工具 76

5.3.1 doccano的安裝 76

5.3.2 創建doccano文本數據標註

項目 79

5.4 文本數據標註實戰 81

5.4.1 實體標註案例 81

5.4.2 多實體標註案例 86

5.4.3 實體關系標註案例 89

5.4.4 情感色彩標註案例 95

5.5 小結 98

5.6 習題 99

5.7 課後拓展 100

第6章 圖像數據標註 101

6.1 圖像數據標註的概念 101

6.1.1 什麼是圖像數據標註 101

6.1.2 圖像數據標註規範 102

6.1.3 圖像數據標註發展現狀 104

6.1.4 圖像數據標註的重要性 106

6.2 圖像數據標註分類 107

6.2.1 圖像框選 107

6.2.2 OCR技術 108

6.3 圖像數據標註工具 109

6.4 圖像數據標註的技術難題與解決

方案 110

6.4.1 技術難題 110

6.4.2 解決方案 111

6.5 圖像數據標註實戰 112

6.5.1 圖像框選案例 112

6.5.2 圖像OCR案例 117

6.6 小結 121

6.7 習題 121

6.8 課後拓展 122

第7章 語音數據標註 123

7.1 語音數據標註概念 123

7.1.1 什麼是語音數據標註 123

7.1.2 語音數據標註發展現狀 124

7.2 語音數據標註分類 125

7.2.1 基礎處理 125

7.2.2 內容轉義 126

7.2.3 特征分析 126

7.3 語音數據標註工具 127

7.4 語音數據標註方法 129

7.4.1 音頻分類 130

7.4.2 自然語料標註 130

7.4.3 時間段分類 131

7.5 語音數據標註實戰 132

7.6 小結 137

7.7 習題 137

7.8 課後拓展 138

第8章 視頻數據標註 140

8.1 視頻數據標註概念 140

8.1.1 什麼是視頻數據標註 140

8.1.2 視頻數據標註與圖像數據標註的

差異 141

8.1.3 視頻數據標註發展現狀 142

8.2 視頻數據標註分類 143

8.2.1 空間標註 143

8.2.2 時間標註 144

8.2.3 語義標註 145

8.3 視頻數據標註工具 145

8.4 視頻數據標註方法 146

8.4.1 單一圖像法 146

8.4.2 連續幀法 147

8.4.3 基於規則的標註 148

8.4.4 基於機器學習的標註 148

8.5 視頻數據標註實戰 149

8.6 小結 153

8.7 習題 154

8.8 課後拓展 154

第9章 三維點雲標註 156

9.1 三維點雲標註的概念 156

9.1.1 什麼是三維點雲標註 156

9.1.2 三維點雲標註的因素與規範 157

9.1.3 三維點雲的應用 161

9.1.4 三維點雲標註的發展現狀 162

9.2 三維點雲數據的分類 164

9.2.1 基於采集方式的分類 164

9.2.2 基於數據密度的分類 164

9.2.3 基於數據處理方式的分類 164

9.3 三維點雲標註工具 165

9.3.1 SSE的安裝 165

9.3.2 SSE的介紹 171

9.4 三維點雲標註實戰 172

9.5 小結 175

9.6 習題 175

9.7 課後拓展 176

第 10章 數據標註質量管理 178

10.1 數據質量對機器學習模型的影響 178

10.2 數據標註質量控制與風險管理 179

10.3 數據標註質檢方法 180

10.4 數據標註質檢流程 187

10.5 數據標註質檢管理 189

10.6 小結 191

10.7 習題 191

10.8 課後拓展 192