實戰大數據分佈式大數據分析處理系統開發與應用
井超//楊俊//喬鋼柱
- 出版商: 機械工業
- 出版日期: 2023-01-01
- 定價: $479
- 售價: 8.5 折 $407
- 語言: 簡體中文
- 頁數: 230
- 裝訂: 平裝
- ISBN: 7111720652
- ISBN-13: 9787111720652
-
相關分類:
大數據 Big-data
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
離散與組合數學 (Discrete and Combinatorial Mathematics, 5/e)$980$931 -
$403WebGIS 之 OpenLayers 全面解析, 2/e -
$505深入淺出 Pandas:利用 Python 進行數據處理與分析 -
工業大數據分析實踐$600$570 -
$301機器學習與振動信號處理 -
銷售 AI 化!看資料科學家如何思考, 用 Python 打造能賺錢的機器學習模型$620$527 -
$254軟件定義網絡(SDN)基礎教程 -
$500pandas 數據處理與分析 -
大數據技術及架構圖解實戰派$876$832 -
Clean Architecture 實作篇:在整潔的架構上弄髒你的手 (Get Your Hands Dirty on Clean Architecture)$500$390 -
Web API 設計原則|API 與微服務傳遞價值之道 (Principles of Web API Design: Delivering Value with APIs and Microservices)$520$411 -
$203軟件定義網絡(SDN)技術與應用 -
$857劍指大數據 — 企業級數據倉庫項目實戰 (電商版) -
$305大數據採集與預處理技術 (HDFS + HBase + Hive + Python)(微課視頻版) -
電商實戰營 — 電商數據分析$359$341 -
$510前端性能揭秘 -
$505Hadoop 3.x 大數據開發實戰 (視頻教學版) -
Apache Airflow 數據編排實戰$768$730 -
$458BERT 基礎教程:Transformer 大模型實戰 -
$505Doris 實時數倉實戰 -
AI 生成技術實戰手冊 (修訂版)$220$209 -
精通無瑕程式碼:工程師也能斷捨離!消除複雜度、提升效率的 17個關鍵技法 (The Art of Clean Code: Best Practices to Eliminate Complexity and Simplify Your Life)$600$396 -
大數據實時流處理技術實戰 — 基於 Flink + Kafka 技術$299$284 -
LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具$680$537 -
內行人才知道的系統設計面試指南 第二輯 (System Design Interview – An Insider's Guide: Volume 2)$820$648
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
實戰大數據——分佈式大數據分析處理系統開發與應用,從大數據技術基礎概念出發,
介紹了大數據分析的流程和大數據分析處理系統的組成,
以及大數據集群的搭建,並在此基礎上講解了多種不同技術構成的離線/實時數據分析系統實戰項目。
全書共10章,包括大數據概述、大數據分析的基本流程與工具、分佈式大數據分析處理系統概述、構建大數據集群環境、
構建基於LayUI的集群管理系統、基於HBase的大數據離線分析系統、基於Hive+Hadoop+Spark的大數據離線分析系統、
基於MySQL+Spark的大數據離線分析系統、基於Redis+Kafka+Spark的大數據實時分析系統、
基於Flume+Kafka+Flink的大數據實時分析系統。
實戰大數據—— 分佈式大數據分析處理系統開發與應用,
適合從事大數據系統搭建與運維、大數據分析等崗位的技術人員閱讀,
也適合高等院校大數據相關專業的學生使用。
目錄大綱
前言
第1章 大數據概述1
1.1 大數據的基本概念1
1.1.1 何謂大數據1
1.1.2 大數據的產生階段2
1.1.3 大數據的核心技術和計算模式2
1.2 大數據的應用2
1.2.1 大數據的應用場景2
1.2.2 大數據系統的作用2
1.3 大數據技術生態圈3
1.3.1 Linux操作系統3
1.3.2 Hadoop生態系統6
1.3.3 Spark對Hadoop的完善8
1.4 大數據技術的新發展9
1.4.1 Hadoop 3.0的新特性9
1.4.2 大數據引擎Flink10
1.4.3 智能化大數據分析處理11
本章小結12
第2章 大數據分析的基本流程與工具13
2.1 數據採集13
2.1.1 網絡爬蟲採集數據13
2.1.2 使用Excel爬取數據14
2.2 數據存儲16
2.2.1 關係型數據的存儲—基於MySQL16
2.2.2 非關係型數據的存儲—基於
Redis、HBase17
2.3 數據分析與數據處理18
2.3.1 數據分析常用工具—pandas19
2.3.2 分佈式計算框架19
2.3.3 分佈式數據挖掘和深度學習20
2.4 數據可視化22
2.4.1 Python數據可視化庫Matplotlib22
2.4.2 Python數據可視化庫pyecharts22
2.4.3 數據可視化圖表庫ECharts23
2.4.4 數據可視化工具Apache Superset24
本章小結24
第3章 分佈式大數據分析處理系統
概述25
3.1 什麼是分佈式大數據分析處理
系統25
3.2 分佈式大數據分析處理系統的
作用26
3.3 分佈式大數據分析處理系統的
應用場景26
3.4 分佈式大數據分析處理系統的
構成30
3.4.1 數據採集子系統30
3.4.2 數據存儲系統30
3.4.3 數據分析處理系統31
3.4.4 數據可視化系統32
3.5 分佈式大數據分析處理系統的
實現32
3.5.1 系統前端—HTML、CSS、jQuery32
3.5.2 系統後端—SpringBoot、SSM33
3.5.3 Web服務器端—Tomcat35
本章小結35
第4章 構建大數據集群環境36
4.1 部署大數據處理環境36
4.1.1 搭建Hadoop集群36
4.1.2 ZooKeeper的安裝部署42
4.1.3 Kafka的安裝部署45
4.1.4 Spark集群搭建47
4.2 部署大數據存儲環境49
4.2.1 MySQL的安裝部署49
4.2.2 Hive的安裝部署50
4.2.3 HBase的安裝部署51
4.2.4 Redis的安裝部署55
本章小結57
第5章 構建基於LayUI的集群管理
系統58
5.1 集群管理系統概述58
5.1.1 需求分析58
5.1.2 系統架構—系統+集群+UI59
5.2 系統開發的前期準備操作60
5.2.1 本機環境配置60
5.2.2 集群環境配置62
5.2.3 構建項目工程結構74
5.3 系統的代碼實現75
5.3.1 Controller層實現75
5.3.2 構造系統所需工具包90
5.3.3 核心類實現97
5.4 構造系統UI界面—基於
LayUI100
本章小結105
第6章 基於HBase的大數據離線分析
系統106
6.1 系統架構概述106
6.1.1 需求分析106
6.1.2 系統架構—HBase+SpringBoot+
ECharts107
6.2 採集股份轉讓數據108
6.2.1 使用爬蟲抓取數據108
6.2.2 數據採集模塊測試111
6.3 數據存儲和處理模塊實現113
6.3.1 數據庫設計113
6.3.2 使用HBase存儲並處理數據114
6.3.3 數據存儲和處理模塊測試119
6.4 數據可視化模塊實現120
6.4.1 數據可視化模塊後端設計—
基於SpringBoot120
6.4.2 數據可視化模塊前端設計—
基於ECharts122
6.4.3 數據可視化頁面展示125
本章小結126
第7章 基於Hive+Hadoop+Spark的
大數據離線分析系統127
7.1 系統架構概述127
7.1.1 需求分析127
7.1.2 數據存儲—Hive+Hadoop129
7.1.3 數據處理與可視化—
Spark+SSM+ECharts129
7.2 採集旅遊相關數據130
7.2.1 使用爬蟲採集城市、景點數據130
7.2.2 數據採集模塊測試133
7.3 數據存儲模塊實現135
7.3.1 數據庫設計135
7.3.2 使用HDFS和Hive存儲數據137
7.3.3 數據存儲模塊測試138
7.4 數據分析處理模塊實現139
7.4.1 Spark處理數據139
7.4.2 分詞處理和情感分析—
基於jieba+SnowNLP庫139
7.4.3 數據分析處理模塊測試142
7.5 數據可視化模塊實現143
7.5.1 數據可視化模塊後端設計—
基於SSM143
7.5.2 數據可視化模塊前端設計—
基於ECharts154
7.5.3 數據可視化頁面展示161
本章小結167
第8章 基於MySQL+Spark的大數據
離線分析系統168
8.1 系統架構概述168
8.1.1 需求分析168
8.1.2 數據存儲—MySQL170
8.1.3 數據處理與可視化—
Spark Streaming +Apache Superset170
8.2 採集電商數據170
8.2.1 使用爬蟲爬取商品信息170
8.2.2 數據採集模塊測試182
8.3 數據分析處理模塊實現183
8.3.1 數據庫設計183
8.3.2 Spark處理商品數據185
8.3.3 數據分析處理模塊測試192
8.4 數據可視化模塊實現193
8.4.1 使用Apache Superset繪製數據
可視化圖表193
8.4.2 數據可視化頁面展示193
本章小結196
第9章 基於Redis+Kafka+Spark的
大數據實時分析系統197
9.1 系統架構概述197
9.1.1 需求分析197
9.1.2 數據存儲—Redis198
9.1.3 數據處理與可視化—Kafka+
Spark Streaming+SSM+ECharts199
9.2 採集汽車網站數據199
9.2.1 使用爬蟲獲取汽車和用戶
數據199
9.2.2 數據採集模塊測試201
9.3 數據存儲模塊實現201
9.3.1 數據庫設計201
9.3.2 使用MySQL存儲汽車
數據202
9.3.3 數據存儲模塊測試202
9.4 數據分析處理模塊實現202
9.4.1 實時發送數據至Kafka203
9.4.2 Spark處理汽車數據203
9.4.3 Redis數據庫存儲處理結果204
9.4.4 數據分析處理模塊測試204
9.5 數據可視化模塊205
9.5.1 數據可視化模塊後端設計—
基於SSM206
9.5.2 數據可視化模塊前端設計—
基於ECharts208
9.5.3 數據可視化頁面展示209
本章小結212
第10章 基於Flume+Kafka+Flink的
大數據實時分析系統213
10.1 系統架構概述213
10.1.1 需求分析213
10.1.2 數據存儲—MySQL214
10.1.3 數據處理與可視化—Kafka+
Flink +SpringBoot+ECharts215
10.2 採集直播審計數據215
10.2.1 模擬直播審計數據215
10.2.2 使用Flume採集直播審計數據217
10.2.3 數據採集模塊測試219
10.3 數據分析處理模塊實現219
10.3.1 實時發送數據至Kafka220
10.3.2 Flink處理直播審計數據220
10.3.3 MySQL數據庫存儲處理結果222
10.3.4 數據分析處理模塊測試223
10.4 數據可視化模塊224
10.4.1 數據可視化模塊後端設計—
基於SpringBoot224
10.4.2 數據可視化模塊前端設計—
基於ECharts226
10.4.3 數據可視化頁面展示230
本章小結230
