Hive數據倉庫應用

黑馬程序員

  • 出版商: 清華大學
  • 出版日期: 2021-09-01
  • 定價: $359
  • 售價: 8.0$287
  • 語言: 簡體中文
  • 頁數: 271
  • 裝訂: 平裝
  • ISBN: 7302589593
  • ISBN-13: 9787302589594
  • 相關分類: HadoopLinux大數據 Big-data
  • 立即出貨 (庫存 < 4)

  • Hive數據倉庫應用-preview-1
  • Hive數據倉庫應用-preview-2
  • Hive數據倉庫應用-preview-3
Hive數據倉庫應用-preview-1

買這商品的人也買了...

商品描述

本書從理論知識入手,結合數據倉庫的概念幫助讀者更好地理解Hive,在掌握Hive相關理論知識的基礎上,逐步深入地學習Hive。“工欲善其事,必先利其器”,首先從創建虛擬機並安裝Linux操作系統開始逐步完成Hive的部署,然後在部署完成的Hive環境基礎上,學習Hive數據定義語言、Hive數據操作語言和Hive數據查詢語言的相關操作,在學習了上述三種語言之後,接下來深入學習Hive的其他功能,包括Hive內置函數、Hive自定義函數、Hive的新特性事務以及Hive的相關優化,從而幫助讀者掌握Hive的強大功能和特性。最後,本書通過一個綜合項目——教育大數據分析平臺,使讀者對Hive數據倉庫在實際應用中涉及的相關知識內容具有更深入的理解,在此項目中不僅會涉及使用Hive實現數據倉庫分層、數據轉換和數據分析的相關操作,而且還涉及使用Sqoop將數據倉庫中的數據進行導出和導入,以及使用FineBI工具實現數據可視化功能。 本書附有配套視頻、源代碼、習題、教學設計、教學課件等資源。同時,為了幫助初學者更好地學習本書的內容,還提供了在線答疑,歡迎讀者關註。 本書可以作為高等學校本、專科電腦相關專業,信息管理等相關專業的大數據課程教材,也可以供相關技術人員參考,是一本適合廣大電腦編程愛好者的優秀讀物。

作者簡介

傳智教育傳播教育軟件開發人才的科技公司,“黑馬江蘇程序員”是傳智教育傳播教育教育IT高端品牌。高美雲是本書。 創作團隊核心成員,同時描寫超長本教材,長時間,深受喜愛。

目錄大綱

1章蜂巢簡介1
1.1 認識數據保管1
1.1.1數據保管簡介1
1.1.2 數據保管箱3
1.1.3 數據倉庫的數據模型5
1.2蜂巢概述6
1.3Hive架構7
1.4Hive工作原理8
1.5Hive 數據類型9
1.6島嶼小結10
1.7課後習題11

2章Hive部署12
2.1裡奴環境的搭建12
2.1.1創建虛擬機12
2.1.2啟動虛擬機並安裝Linu作系統19
2.1.3克隆虛擬機26
2.1.4配置Linu系統網絡及主機名30
2.1.5配置SSH服務34
2.2JDK的部署42
2.3Zookeeper的部署43
2.3.1Zookeeper集的安裝與配置43
2.3.2Zookeeper集的啟動與關閉46
2.4Hadoop的部署48
2.4.1Hadoop高可用集的規劃48
2.4.2 安裝Hadoop49
2.4.3配置Hadoop高可用集51
2.4.4啟動Hadoop高可用集58
2.5Hive的部署622.5.1Hive的部署之嵌入模式62
2.5.2Hive部署之本地模式64
2.5.3Hive部署之遠程模式70
2.6島嶼小結74
2.7課後習題74

3章Hive的數據定義語言76
3.1數據庫的基本著作76
3.1.1創建數據庫76
3.1.2查詢數據庫77
3.1.3 查看數據庫信息78
3.1.4 切換數據庫79
3.1.5修改數據庫79
3.1.6 刪除數據庫80
3.2 數據表的基本作法81
3.2.1創建表格句式分析81
3.2.2數據表簡介84
3.2.3 創建數據表84
3.2.4 查看數據表86
3.2.5修改數據表88
3.2.6 刪除數據表94
3.3 分區表95
3.3.1創建分區表95
3.3.2 分區查詢表96
3.3.3 添加界限97
3.3.4重分本質98
3.3.5移動分區98
3.3.6 刪除 100
3.4分桶表101
3.4.1創建分桶表101
3.4.2查看分桶表信息102
3.5臨時表103
3.6視圖104
3.6.1創建視圖105
3.6.2 查詢視圖信息105
3.6.3 查看視圖106
3.6.4 修改視圖107
3.6.5 刪除視圖109
3.7?109
3.7.1Hive中的索引110
3.7.2創建索引110
3.7.3 查看索引表111
3.7.4查看?111
3.7.5重建索引112
3.7.6刪除索引113
3.8島小結114
3.9課後習題114

4章Hive的數據作語言116
4.1加載文件116
4.1.1加載文件的語法格式116
4.1.2 向分區表加載文件119
4.2基本查詢120
4.3 插入數據121
4.3.1基本插入121
4.3.2 插入 123
4.3.3 向分區表插入數據127
4.4導入和導出131
4.5島嶼小結133
4.6課後習題133

5章Hive數據查詢語言135
5.1選擇句式分析135
5.2Hive交互138
5.2.1關係138
5.2.2算術相似140
5.2.3邏輯矛盾142
5.2.4 複雜交互143
5.3 公用表表達式146
5.4 表現作147
5.5排序作149
5.6UNION語句154
5.7JOIN語句156
5.8篩選查詢161
5.8.1隨機數161
5.8.2分桶掃162
5.8.3 數據塊擦162
5.9島嶼小結164
5.10課後習題164

6章蜂巢函數165
6.1Hive函數165
6.1.1聚合函數165
6.1.2數學函數169
6.1.3集合函數170
6.1.4類型轉換函數171
6.1.5 日期功能172
6.1.6條件函數176
6.1.7 字符串函數178
6.1.8表生成函數182
6.2Hive自定義函數185
6.2.1UDF186
6.2.2UDTF196
6.2.3UDAF199
6.3島嶼小結203
6.4課後習題203

7章蜂巢事務205
7.1 事務特性205
7.2Hive 事務的設計與實現206
7.3開啟蜂巢事務207
7.4更新作209
7.5 刪除作210
7.6島嶼小結211
7.7課後習題211

8章蜂巢優化213
8.1Hive存儲優化213
8.2蜂巢優化優化215
8.2.1配置MapReduce壓縮215
8.2.2 配置地圖個數216
8.2.3 配置減少個數217
8.2.4 配置合併文件217
8.2.5並行執行218
8.2.6配置本地模式218
8.2.7 配置219
8.3HiveQL語句優化技巧219
8.4島嶼小結219
8.5課後習題220

9章綜合項目——教育大數據分析平台221
9.1項目概述221
9.1.1 項目背景介紹221
9.1.2 需求分析222
9.1.3 原始數據結構222
9.1.4數據收藏設計223
9.1.5 項目​​目錄224
9.2部署Sqoop225
9.3 實現數據存儲注意事項227
9.4數據採集231
9.5數據轉換235
9.6數據分析237
9.6.1實現地區訪問用戶量統計237
9.6.2實現會話頁面排行榜238
9.6.3實現訪問用戶量統計240
9.6.4實現來源訪問用戶量統計241
9.6.5實現諮詢統計242
9.7 數據可視化245
9.7.1 導出數據245
9.7.2 安裝、啟動與配置FineBI247
9.7.3 實現數據可視化260
9.8島小結271