大數據分佈式基礎與編程實踐
祝翠玲 楊成偉 劉位龍
- 出版商: 經濟科學出版社
- 出版日期: 2024-11-01
- 售價: $468
- 語言: 簡體中文
- 頁數: 502
- ISBN: 7521864352
- ISBN-13: 9787521864359
-
相關分類:
大數據 Big-data
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書共分為三部分:工具實踐篇、數據庫實踐篇和編程實踐篇。工具實踐篇主要介紹在大數據分佈式環境中的各種基礎環境的安裝和部署及簡單應用;數據庫實踐篇主要介紹在大數據分佈式環境中關系型數據庫、非關系型數據庫以及數據倉庫的安裝部署及使用;編程實踐篇主要介紹在已經部署的分佈式環境中進行HDFS程序設計、MapReduce分佈式編程、Python分佈式編程實踐以及利用Spark環境進行編程實踐。
目錄大綱
第一篇 工具實踐篇
第1章 大數據與Linux系統實踐
本章學習目的
1.1 Linux操作系統
1.2 Linux虛擬機
1.3 虛擬機軟件安裝部署
1.4 Linux Ubuntu安裝部署
1.5 Linux虛擬機導入/導出
1.6 本章小結
本章習題
第2章 Hadoop分佈式框架實踐
本章學習目的
2.1 Hadoop分佈式框架
2.2 JDK工具包
2.3 Hadoop分佈式部署
2.4 本章小結
本章習題
第3章 Spark分佈式框架實踐
本章學習目的
3.1 Spark介紹
3.2 在Ubuntu環境中安裝Spark
3.3 本章小結
本章習題
第4章 HDFS分佈式文件系統實踐
本章學習目的
4.1 分佈式文件系統
4.2 分佈式文件系統HDFS操作
4.3 本章小結
本章習題
第5章 Anaconda應用實踐
本章學習目的
5.1 Anaconda介紹
5.2 Linux中Anaconda的部署與使用
5.3 本章小結
本章習題
第6章 Python應用實踐
本章學習目的
6.1 Python簡介
6.2 在Ubuntu中安裝Python
6.3 在IDEA中進行Python實踐
6.4 本章小結
本章習題
第二篇 數據庫實踐篇
第7章 MySQL關系型數據庫實踐
本章學習目的
7.1 關系數據庫
7.2 安裝MySQL
7.3 MySQL常用操作
7.4 本章小結
本章習題
第8章 HBASE非關系型數據庫實踐
本章學習目的
8.1 NoSQL數據庫
8.2 HBase概述
8.3 HBase的部署與使用
8.4 本章小結
本章習題
第9章 Redis非關系型數據庫實踐
本章學習目的
9.1 Redis數據庫簡介
9.2 Redis安裝與部署
9.3 Redis的使用
9.4 本章小結
本章習題
第10章 Hive數據倉庫實踐
本章學習目的
10.1 數據倉庫
10.2 數據倉庫Hive
10.3 Hive的部署與使用
10.4 本章小結
本章習題
第三篇 編程實踐篇
第11章 HDFS分佈式文件系統編程實踐
本章學習目的
11.1 HDFS程序設計
11.2 HDFS程序設計實踐
11.3 本章小結
本章習題
第12章 MapReduce分佈式編程實踐
本章學習目的
12.1 分佈式計算基礎
12.2 MapReduce架構演變
12.3 MapReduce編程模型
12.4 MapReduce編程實踐——求聚合
12.5 MapReduce編程實踐——求均值
12.6 MapReduce編程實踐——去重
12.7 MapReduce編程實踐——單表join連接
12.8 本章小結
本章習題
第13章 Python分佈式編程實踐
本章學習目的
13.1 Python開發環境
13.2 在IDEA中編寫Python爬蟲程序
13.3 本章小結
本章習題
參考文獻
附錄1 Hadoop 3.2.0 HDFS命令指南
1.用戶命令
2.管理命令
3.調試命令
4.Hadoop常用命令快速一覽
5.HDFS命令參考
6.分佈式覆制
7.管理員命令
附錄2 課程實踐報告
部分課後題答案