大數據存儲技術(微課版)
徐自力,王波,黃家麒
- 出版商: 電子工業
- 出版日期: 2025-09-01
- 售價: $270
- 語言: 簡體中文
- 頁數: 192
- ISBN: 7121511460
- ISBN-13: 9787121511462
-
相關分類:
大數據 Big-data
下單後立即進貨 (約4週~6週)
相關主題
商品描述
隨著數據量的爆炸式增長,大數據存儲技術在數據科學、人工智能、雲計算等領域的重要性日益凸顯。大數據不僅為個人生活、企業經營,以及國家與社會的發展帶來了機遇,也帶來了挑戰。本書是一本大數據入門圖書,主要介紹了Hive、HBase、Sqoop等內容。本書采用理論與實踐相結合的講解方式,旨在幫助讀者擺脫枯燥的理論學習,註重實際動手能力的培養。通過本書的學習,讀者可以掌握Hadoop生態圈中常用組件的大數據存儲技術,如HDFS、Hive、HBase。本書不僅註重理論知識的講解,更強調實踐能力的培養,適合高職學生使用,可以幫助讀者快速入門大數據領域,提升自己的實踐能力和就業競爭力。
目錄大綱
項目一 大數據存儲 1
任務1 數據倉庫介紹 3
1.1.1 數據倉庫概念 3
1.1.2 數據倉庫的構建 4
1.1.3 數據倉庫的主要特點 5
1.1.4 數據倉庫和數據庫的區別 5
1.1.5 數據倉庫應用場景 6
任務2 NoSQL數據庫介紹 7
1.2.1 NoSQL數據庫概念 7
1.2.2 NoSQL數據庫的基本原理 7
1.2.3 NoSQL數據庫的常見存儲結構類型 8
1.2.4 NoSQL數據庫適用場景 8
1.2.5 NoSQL數據庫的關鍵技術 9
項目二 Hadoop基礎介紹 11
任務1 基於VMware創建CentOS 7虛擬機 14
2.1.1 VMware軟件安裝 14
2.1.2 創建CentOS 7虛擬機 16
2.1.3 虛擬機網絡配置 23
任務2 Hadoop環境搭建 29
2.2.1 Java環境配置 29
2.2.2 Hadoop偽分布式環境搭建 30
項目三 HDFS操作與MapReduce基礎 36
任務1 HDFS的操作命令 39
3.1.1 環境準備 39
3.1.2 HDFS操作 40
任務2 第一個MapReduce程序WordCount 43
3.2.1 創建MapReduce工程 43
3.2.2 編寫代碼 46
3.2.3 MapReduce程序運行 50
項目四 Hive基礎介紹 55
任務1 Hive安裝 60
4.1.1 基礎環境準備 60
4.1.2 Hive安裝步驟 60
任務2 Hive數據庫操作 62
任務3 Hive數據表操作 65
項目五 Hive數據類型 72
任務1 Hive原始數據類型應用 75
5.1.1 數值類型 75
5.1.2 字符串類型 76
5.1.3 布爾類型與時間類型 77
5.1.4 插入演示數據 78
任務2 Hive復雜數據類型應用 79
5.2.1 array 79
5.2.2 map 80
5.2.3 struct 81
5.2.4 union 82
項目六 Hive表操作 84
任務1 Hive內部表與外部表 86
6.1.1 Hive內部表 86
6.1.2 Hive外部表 88
任務2 Hive分區表 91
任務3 Hive分桶表 96
項目七 Hive數據操作 100
任務 Hive數據操作 102
7.1.1 使用load命令加載數據 103
7.1.2 使用insert命令插入數據 104
7.1.3 export命令與import命令 108
7.1.4 使用truncate命令刪除數據 109
項目八 Hive QL語句 111
任務1 Hive QL語句 112
8.1.1 基礎查詢 113
8.1.2 運算符 116
8.1.3 Hive函數 117
8.1.4 表連接 125
8.1.5 排序 128
8.1.6 分組 131
任務2 Hive JDBC操作 133
8.2.1 Hive JDBC工程搭建 133
8.2.2 通過Hive JDBC操作數據表 137
項目九 HBase基礎介紹 144
任務 HBase安裝 147
9.1.1 基礎環境準備 147
9.1.2 安裝HBase 148
項目十 HBase操作 151
任務1 HBase Shell操作 154
任務2 HBase Java API 157
項目十一 Sqoop基礎介紹 167
任務1 Sqoop安裝 169
任務2 Sqoop應用 170
項目十二 綜合應用——電商會員分析 176
任務1 Sqoop會員數據采集 178
12.1.1 準備數據 178
12.1.2 數據采集 180
任務2 會員信息分析 181