大數據技術導論
湯東,陳艷,黃源
- 出版商: 電子工業
- 出版日期: 2025-07-01
- 售價: $329
- 語言: 簡體中文
- 頁數: 280
- ISBN: 7121505568
- ISBN-13: 9787121505560
- 
    相關分類:
    
      大數據 Big-data
 
下單後立即進貨 (約4週~6週)
商品描述
本書深入淺出地講解大數據技術的基礎知識與實際應用。本書共10章,分別是大數據介紹、數據采集、大數據架構、大數據存儲、數據清洗、大數據分析與挖掘、大數據可視化、大數據安全、數據治理及大數據的應用。本書可作為本科院校和職業院校的專業課教材,也可作為大數據技術愛好者的參考書。
目錄大綱
第1章  大數據介紹	1
本章學習目標	1
1.1 大數據概述	1
1.1.1  認識大數據	1
1.1.2  大數據的特征	4
1.1.3  大數據技術的應用	7
1.2 大數據的發展	12
1.2.1  國外的大數據發展	12
1.2.2  我國的大數據發展	13
1.3 大數據開發語言Python	14
1.3.1  Python簡介	14
1.3.2  Python使用基礎	15
1.4 本章小結	17
習題1	18
第2章  數據采集	19
本章學習目標	19
2.1 認識數據采集	19
2.1.1  數據采集介紹	19
2.1.2  數據采集平臺	22
2.2  網絡爬蟲	29
2.2.1  網絡爬蟲的概述	29
2.2.2  網絡爬蟲的分類及特點	35
2.2.3  網絡爬蟲框架	37
2.3 本章小結	41
習題2	42
第3章  大數據架構	43
本章學習目標	43
3.1 大數據架構概述	43
3.1.1  大數據架構介紹	43
3.1.2  大數據架構分類	44
3.2 Hadoop架構	46
3.2.1  Hadoop介紹	46
3.2.2  Hadoop發展史	47
3.2.3  Hadoop核心組件概述	48
3.3 Hadoop核心組件	49
3.3.1  HDFS	49
3.3.2  YARN	56
3.3.3  MapReduce	59
3.4 Hadoop生態圈	63
3.4.1  ZooKeeper	63
3.4.2  Spark	65
3.4.3  Flink	69
3.5 本章小結	72
習題3	73
第4章  大數據存儲	74
本章學習目標	74
4.1 大數據存儲概述	74
4.1.1  認識大數據存儲	74
4.1.2  大數據存儲的分類	76
4.1.3  NewSQL數據庫	84
4.2 大數據中的數據庫應用	85
4.2.1  MySQL	85
4.2.2  HBase	87
4.2.3  Redis	90
4.2.4  MongoDB	92
4.2.5  InfluxDB	94
4.2.6  OrientDB	96
4.3  數據倉庫	98
4.3.1  數據倉庫概述	98
4.3.2  Hive	104
4.3.3  數據倉庫的應用	106
4.4  本章小結	106
習題4	107
第5章  數據清洗	108
本章學習目標	108
5.1 數據清洗概述	108
5.1.1  認識數據清洗	108
5.1.2  數據清洗的常見方法	111
5.1.3  數據標準化	115
5.1.4  數據清洗中的常見算法	117
5.2  數據質量與數據質量管理	119
5.2.1  數據質量	119
5.2.2  數據質量管理	121
5.3  數據清洗工具	124
5.3.1  Python	124
5.3.2  R語言	128
5.3.3  Kettle	130
5.3.4  DataCleaner	130
5.4  本章小結	132
習題5	132
第6章  大數據分析與挖掘	133
本章學習目標	133
6.1  大數據分析概述	133
6.1.1  大數據分析的概念	133
6.1.2  大數據分析的類型	136
6.1.3  大數據分析的方法	136
6.2  數據挖掘	142
6.2.1  數據挖掘概述	142
6.2.2  數據挖掘應用	145
6.3  數據挖掘算法	149
6.3.1  K-Means算法	149
6.3.2  決策樹算法	151
6.3.3  KNN算法	153
6.3.4  樸素貝葉斯算法	155
6.3.5  主成分分析算法	157
6.3.6  遺傳算法	158
6.4  本章小結	160
習題6	160
第7章  大數據可視化	161
本章學習目標	161
7.1 大數據可視化概述	161
7.1.1  大數據可視化的概念	161
7.1.2  大數據可視化的流程	165
7.1.3  大數據可視化圖表介紹	169
7.2 大數據可視化方法	175
7.2.1  文本可視化	175
7.2.2  網絡可視化	178
7.2.3  空間信息可視化	179
7.3  大數據可視化工具	183
7.3.1  ECharts	183
7.3.2  Tableau	185
7.3.3  D3.js	186
7.4  大數據可視化應用	188
7.4.1  大數據可視化的應用場景	188
7.4.2  大數據可視化的行業應用	188
7.5  本章小結	191
習題7	192
第8章  大數據安全	193
本章學習目標	193
8.1  大數據安全概述	193
8.1.1  認識大數據安全	193
8.1.2  大數據安全中的關鍵技術	199
8.2  大數據安全體系	212
8.2.1  大數據安全體系概述	212
8.2.2  大數據安全體系加固措施	215
8.3 本章小結	218
習題8	218
第9章  數據治理	219
本章學習目標	219
9.1 數據治理概述	219
9.1.1  認識數據治理	219
9.1.2  數據治理的研究內容	223
9.2 企業架構	236
9.2.1  認識企業架構	236
9.2.2  主流的企業架構	238
9.3  數據治理框架	241
9.3.1  ISO38500數據治理框架	241
9.3.2  DAMA數據治理框架	241
9.3.3  DGI數據治理框架	243
9.3.4  IBM數據治理框架	244
9.3.5  DCMM數據治理框架	245
9.4 本章小結	247
習題9	248
第10章  大數據的應用	249
本章學習目標	249
10.1 旅遊大數據	249
10.1.1  旅遊大數據的發展	249
10.1.2  大數據對旅遊業的影響	250
10.1.3  大數據在旅遊業中的應用	251
10.1.4  旅遊大數據面臨的問題	253
10.2 工業大數據	253
10.2.1  認識工業大數據	254
10.2.2  工業大數據實施的關鍵因素	256
10.2.3  工業大數據的應用	260
10.3 交通大數據	264
10.3.1  認識交通大數據	264
10.3.2  交通大數據實施的關鍵因素	267
10.3.3  交通大數據的應用	270
10.4 本章小結	271
習題10	272

 
     
    
 
    
 
    
 
    
 
     
     
    
 
    
