Spark項目實戰(第2版)

黑馬程序員

  • 出版商: 清華大學
  • 出版日期: 2025-03-01
  • 售價: $234
  • 語言: 簡體中文
  • 頁數: 159
  • ISBN: 7302684944
  • ISBN-13: 9787302684947
  • 相關分類: Spark
  • 下單後立即進貨 (約4週~6週)

  • Spark項目實戰(第2版)-preview-1
  • Spark項目實戰(第2版)-preview-2
  • Spark項目實戰(第2版)-preview-3
Spark項目實戰(第2版)-preview-1

商品描述

"本書以電商網站中的用戶行為數據作為數據源,系統地介紹瞭如何使用 Spark生態系統進行大數據離線分析和實時分析的方法。全書共7章,分別講解了項目需求、項目架構、項目實現流程、大數據集群環境搭建、熱門品類Top10分析、各區域熱門商品Top3分析、網站轉化率統計、廣告點擊流實時統計和使用FineBI實現數據可視化。 本書附有配套視頻、教學PPT、教學設計等資源,同時,為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關註。 本書適合作為高等教育本科和專科的數據科學與大數據技術及相關專業的教材,也適合數據分析、數據可視化等領域的從業者閱讀。 "

目錄大綱

目錄

 

第1章項目概述1

1.1項目需求和目標1

1.2預備知識2

1.3項目架構2

1.4開發環境和工具3

1.5項目開發流程4

1.6硬件要求6

1.7本章小結6

第2章搭建大數據集群環境7

2.1基礎環境搭建7

2.1.1創建虛擬機7

2.1.2安裝Linux操作系統16

2.1.3克隆虛擬機22

2.1.4配置虛擬機25

2.2安裝JDK39

2.3部署ZooKeeper集群41

2.4部署Hadoop集群46

2.5部署Spark52

2.6部署HBase集群55

2.7部署Kafka集群59

2.8本章小結61

第3章熱門品類Top10分析62

3.1數據集分析62

3.2實現思路分析63

3.3實現熱門品類Top10分析64

3.3.1環境準備64

3.3.2實現Spark程序72

3.3.3數據持久化76

3.4運行Spark程序80

3.5本章小結84

第4章各區域熱門商品Top3分析85

4.1實現思路分析85

4.2實現各區域熱門商品Top3分析86

4.2.1實現Spark程序86

4.2.2數據持久化89

4.3運行Spark程序90

4.4本章小結92

第5章網站轉化率統計93

5.1數據集分析93

5.2實現思路分析94

5.3實現網站轉化率統計95

5.3.1生成用戶行為數據95

5.3.2實現Spark程序96

5.3.3數據持久化102

5.4運行Spark程序103

5.5本章小結104

第6章廣告點擊流實時統計105

6.1數據集分析105

6.2實現思路分析105

6.3表設計106

6.4實現廣告點擊流實時統計107

6.4.1生成用戶行為數據107

6.4.2實現Spark程序110

6.4.3數據持久化114

6.5運行Spark程序116

6.6本章小結118

第7章數據可視化119

7.1數據映射119

7.1.1部署Phoenix119

7.1.2建立映射121

7.2FineBI的安裝與配置126

7.3實現數據可視化136

7.3.1新建數據集136

7.3.2實現熱門品類Top10的可視化142

7.3.3實現各區域熱門商品Top3的可視化147

7.3.4實現網站轉化率的可視化150

7.3.5實現廣告點擊流實時統計的可視化155

7.4本章小結159