Hadoop大數據技術基礎(Python版)微課視頻版

劉彬斌

  • 出版商: 清華大學
  • 出版日期: 2022-06-01
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • ISBN: 7302601305
  • ISBN-13: 9787302601302
  • 相關分類: Hadoop大數據 Big-data
  • 下單後立即進貨 (約4週~6週)

  • Hadoop大數據技術基礎(Python版)微課視頻版-preview-1
  • Hadoop大數據技術基礎(Python版)微課視頻版-preview-2
  • Hadoop大數據技術基礎(Python版)微課視頻版-preview-3
Hadoop大數據技術基礎(Python版)微課視頻版-preview-1

買這商品的人也買了...

商品描述

《Hadoop大數據技術基礎(Python版)微課視頻版》從初學者角度出發,通過豐富的示例和實戰項目,詳細講解大數據開發環境、關鍵技術及其應用。全書共分10章,第1~9章的內容分別為大數據概述、Linux系統的安裝與使用、Python 3語言基礎、Hadoop開發環境、HDFS技術、MapReduce技術、Hive數據倉庫、HBase分佈式數據庫、Sqoop工具,第10章詳細解析了實戰項目“貨運車分佈分析平臺”,幫助初學者快速入門。本書所有知識點都結合具體的編程示例,對於重要知識點提供視頻講解,還設計了多個實訓,使讀者通過實踐環節加強對知識點的理解和掌握。 本書適合作為高等院校電腦應用、大數據技術及相關專業的教材,也適合作為大數據技術相關培訓的教材和大數據技術初學者的自學資料。

目錄大綱

目錄

第1章大數據概述

1.1大數據的產生與發展

1.2大數據的基礎知識

1.3大數據架構

1.4本章小結

1.5課後習題

第2章Linux系統的安裝與使用

2.1系統安裝

2.1.1安裝 CentOS 7.x

2.1.2安裝步驟

2.2基本命令

2.2.1cd命令

2.2.2打包和解壓命令

2.2.3其他常用命令

2.3權限與目錄

2.3.1權限

2.3.2目錄

2.4文件操作

2.4.1文件與目錄管理

2.4.2用戶和用戶組管理

2.5網絡配置

2.6本章小結

2.7課後習題

第3章Python 3語言基礎

3.1Python 3簡介

3.1.1Python 的發展歷史

3.1.2Python的應用

3.2環境搭建

3.2.1Python 3環境的搭建

3.2.2PyCharm

3.3基礎語法

3.3.1語法規範

3.3.2數據類型

3.3.3Number數據類型

3.3.4字符串

3.3.5列表

3.3.6元組

3.3.7字典

3.3.8集合

3.3.9函數

3.3.10模塊

3.3.11類和對象

3.3.12封裝

3.3.13構造函數

3.3.14繼承

3.3.15異常

3.3.16操作MySQL

3.4本章小結

3.5課後習題

3.6實訓

第4章Hadoop開發環境

4.1Hadoop生態圈工具

4.2環境搭建

4.2.1Linux虛擬機基礎配置

4.2.2Xshell工具

4.2.3安裝JDK

4.2.4安裝Hadoop

4.2.5安裝SSH

4.2.6復制虛擬機

4.2.7修改其他虛擬機 

4.2.8設置免密

4.2.9啟動Hadoop集群

4.3常見問題匯總

4.4本章小結

4.5課後習題

第5章HDFS技術

5.1HDFS架構

5.2HDFS命令

5.2.1version命令

5.2.2dfsadmin命令

5.2.3jar命令

5.2.4fs命令

5.3API的使用

5.3.1hdfs模塊

5.3.2pyhdfs模塊

5.4本章小結

5.5課後習題

5.6實訓

第6章MapReduce技術

6.1MapReduce工作原理

6.1.1MapReduce作業流程

6.1.2早期MapReduce架構存在的問題

6.2YARN運行概述

6.2.1yarn模塊介紹

6.2.2YARN的工作流程

6.3利用Python進行MapReduce編程

6.3.1Hadoop Streaming概述

6.3.2Hadoop Streaming原理

6.3.3Hadoop Streaming用法

6.3.4Python編寫MapReduce環境搭建

6.3.5用Python編寫MapReduce代碼入門程序(詞頻統計)

6.3.6清洗數據

6.4mrjob模塊

6.4.1mrjob模塊概述

6.4.2安裝mrjob模塊

6.4.3mrjob模塊的第一個例子(詞頻統計)

6.4.4mrjob模塊的運行方式

6.4.5MRJob類的工作原理

6.4.6mrjob模塊的數據清洗

6.4.7mrjob模塊的兩表合並

6.5本章小結

6.6課後習題

6.7實訓

第7章Hive數據倉庫

7.1Hive模型

7.1.1Hive的架構與基本組成

7.1.2Hive的數據模型

7.2Hive安裝

7.2.1Hive的基本安裝

7.2.2MySQL的安裝

7.2.3Hive的配置

7.3HiveQL詳解

7.3.1元數據存儲

7.3.2數據存儲

7.3.2HQL操作

7.4本章小結

7.5課後習題

7.6實訓

第8章HBase分佈式數據庫

8.1HBase工作原理

8.1.1HBase的表結構

8.1.2體系結構

8.1.3物理模型

8.1.4HBase讀寫流程

8.2HBase完全分佈式

8.2.1安裝前準備

8.2.2配置文件

8.2.3集群啟動

8.3HBase Shell

8.3.1DDL操作

8.3.2DML操作

8.4本章小結

8.5課後習題

第9章Sqoop工具

9.1Sqoop的安裝

9.2Sqoop的使用

9.2.1MySQL數據的導入導出

9.2.2Oracle數據的導入導出

9.3本章小結

9.4課後習題

第10章Hadoop實戰——貨運車分佈分析平臺

10.1需求分析

10.2案例1: 各個城市中各種貨運車的數量

10.2.1業務簡介

10.2.2業務模型

10.2.3業務邏輯

10.2.4數據呈現

10.3案例2: 報廢貨運車占比

10.3.1業務簡介

10.3.2業務模型

10.3.3業務邏輯

10.3.4數據呈現

10.4案例3: 各種貨運車的總量

10.4.1業務簡介

10.4.2業務模型

10.4.3業務邏輯

10.4.4數據呈現