大數據應用技術
王國珺 饒緒黎 王鵬
- 出版商: 人民郵電
- 出版日期: 2021-12-01
- 定價: $299
- 售價: 7.9 折 $236
- 語言: 簡體中文
- 頁數: 200
- 裝訂: 平裝
- ISBN: 711556213X
- ISBN-13: 9787115562135
-
相關分類:
大數據 Big-data
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$301乙太坊 Solidity 智慧合約開發 -
$305軟件需求分析實戰 -
$352分佈式實時系統數據分發服務 -
$450仿人機器人建模與控制 -
$185Flutter 開發入門與實踐 -
$564自主移動機器人與多機器人系統:運動規劃、通信和集群 -
$354群智感知計算 -
$270測試技術模擬與實踐 -
$408Python 編程從入門到提高 -
$301圖像處理與圖像分析基礎 (C/C++語言版) -
電商存儲系統實戰 : 架構設計與海量數據處理$534$507 -
$374數據中心數字孿生應用實踐 -
$284實時嵌入式系統設計方法 -
$509Python 工匠 案例、技巧與工程實踐 -
$422Koa 開發:入門、進階與實戰 -
$374虛擬偶像 AI 實現 -
MLOps 實踐 — 機器學習從開發到生產 (全彩)$636$604 -
$551圖解智能網聯汽車:原理●構造●診斷●維修 -
$458動手打造深度學習框架 -
$374虛擬現實與增強現實技術 -
$232IT項目經理進階之道 -
$709分佈式機器學習 — 系統、工程與實戰 -
APCS 大學程式設計先修檢測完勝教材 -- 使用 C & Python$500$395 -
$422大模型動力引擎 — PyTorch 性能與顯存優化手冊 -
$709智能駕駛硬件在環模擬測試與實踐
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書主要結合當前流行的大數據框架Hadoop、HBase、Hive、、Storm、Flume、Kafka、Spark、Spark GraphX,採用案例形式系統地講解大數據應用技術的相關知識。全書共有8章,分別介紹了大數據概論、大數據基礎知識、大數據文件存儲系統、大數據文件存儲系統、大數據計算技術、大數據應用程序協調服務、大數據存儲應用技術、大數據倉庫應用技術、大數據實時應用技術。為了讓讀者能夠及時地檢驗自己的學習效果,把握自己的學習進度,各章後面都附有相應的習題。
作者簡介
王國珺,副教授,從事高校計算機教育近20年,主要研究方向為大數據、機器學習,近期主持省級課題1項,廳級課題1項,參與省級課題1項,公開發表國家級論文5篇。
目錄大綱
第壹章 大數據概論 1
1.1 數據的基本概念 1
1.1.1 什麼是數據 1
1.1.2 數據組成結構 2
1.1.3 數據的價值 4
1.2 什麼是大數據 4
1.2.1 大數據產生背景 4
1.2.2 大數據發展的原動力 5
1.2.3 大數據基本概念與特徵 6
1.2.4 大數據與雲計算 6
1.2.5 大數據與人工智能 7
1.3 大數據主要技術 8
1.3.1 概述 8
1.3.2 大數據採集與處理 9
1.3.3 大數據存儲技術 9
1.3.4 大數據計算技術 11
1.3.5 大數據可視化 12
1.3.6 大數據安全 12
1.4 大數據主流框架 14
1.4.1 Hadoop 14
1.4.2 ZooKeeper 14
1.4.3 HBase 14
1.4.4 Hive 14
1.4.5 Storm 15
1.4.6 Flume 15
1.4.7 Kafka 15
1.5 本章小結 15
1.6 習題 16
第2章 大數據基礎知識 17
2.1 概述 17
2.1.1 Hadoop產生背景 17
2.1.2 Hadoop核心模塊 18
2.1.3 Hadoop相關項目 19
2.2 Common 20
2.3 HDFS 20
2.3.1 HDFS設計思想 20
2.3.2 HDFS體系結構 21
2.3.3 文件系統命名空間 22
2.3.4 數據複製 22
2.3.5 副本放置策略 23
2.3.6 副本選擇 23
2.3.7 安全模式 23
2.3.8 元數據的持久性 24
2.3.9 通信協議 24
2.3.10 健壯性 24
2.4 YARN 25
2.5 MapReduce 27
2.6 Hadoop應用場景 29
2.7 Hadoop環境配置 29
2.7.1 Hadoop配置基礎知識 29
2.7.2 Hadoop安裝模式 29
2.7.3 Hadoop版本選擇 30
2.7.4 Hadoop偽分佈模式搭建 31
2.8 基於Hadoop平臺的IDEA開發環境搭建 36
2.8.1 Maven項目的創建 36
2.8.2 編寫經典的MapReduce程序WordCount 38
2.9 本章小結 46
2.10 習題 46
第3章 大數據文件存儲系統 48
3.1 數據塊 48
3.2 HDFS工作流 49
3.2.1 HDFS寫數據過程 49
3.2.2 HDFS讀數據過程 50
3.3 HDFS應用程序設計 51
3.3.1 HDFS Shell命令 51
3.3.2 Web接口 53
3.3.3 HDFS API 55
3.3.4 HDFS API寫操作 57
3.3.5 HDFS API讀操作 59
3.4 HDFS存儲格式 60
3.5 Hadoop I/O 61
3.5.1 壓縮 61
3.5.2 I/O序列化類型 64
3.6 本章小結 67
3.7 習題 67
第4章 大數據計算技術 68
4.1 MapReduce運行過程 68
4.2 MapReduce編程過程 70
4.3 MapReduce數據類型 72
4.4 Mapper輸入 73
4.5 Shuffle原理 76
4.5.1 Shuffle工作原理 76
4.5.2 自定義分區 79
4.5.3 自定義排序 81
4.5.4 自定義分組 82
4.6 Combiner本地合併優化 83
4.7 Reducer輸出 84
4.8 計數器 89
4.9 MapReduce應用開發 91
4.9.1 *大*小計數值 92
4.9.2 全排序 94
4.9.3 二次排序 97
4.10 本章小結 102
4.11 習題 102
第5章 大數據應用程序協調服務 103
5.1 ZooKeeper概述 103
5.1.1 ZooKeeper簡介 103
5.1.2 ZooKeeper常用術語 104
5.1.3 ZooKeeper設計目標 104
5.1.4 數據模型和分層命名空間 105
5.1.5 ZooKeeper工作原理 106
5.2 ZooKeeper集群搭建 107
5.2.1 集群規劃 107
5.2.2 ZooKeeper集群安裝 107
5.3 ZooKeeper與Hadoop高可用性 110
5.4 Hadoop高可用性集群部署 111
5.4.1 集群規劃 111
5.4.2 集群部署 112
5.5 本章小結 122
5.6 習題 122
第6章 大數據存儲應用技術 123
6.1 HBase 基礎知識 123
6.1.1 HBase產生背景 123
6.1.2 HBase數據模型 124
6.1.3 HBase體系結構 125
6.1.4 HBase與HDFS 127
6.1.5 HBase應用場景 127
6.2 HBase開發環境配置 128
6.2.1 HBase配置前的準備工作 128
6.2.2 HBase配置基礎知識 128
6.2.3 HBase集群環境配置 130
6.3 HBase Shell 134
6.4 HBase API 139
6.4.1 管理表結構 139
6.4.2 管理表信息 142
6.4.3 信息查詢 143
6.5 HBase表設計 145
6.6 本章小結 145
6.7 習題 145
第7章 大數據倉庫應用技術 147
7.1 Hive基礎知識 148
7.1.1 Hive產生背景 148
7.1.2 Hive體系結構 148
7.1.3 Hive執行流程 150
7.1.4 Hive應用場景 151
7.2 Hive開發環境配置 151
7.2.1 Hive配置基礎知識 151
7.2.2 Hive安裝模式 151
7.2.3 Hive遠程安裝模式實戰 153
7.3 Hive命令 155
7.3.1 Hive交互命令界面Shell簡介 155
7.3.2 Hive非交互界面執行簡介 156
7.4 Hive開發基礎知識 157
7.4.1 數據類型與文本文件編碼 158
7.4.2 數據讀取模式 162
7.4.3 Hive關鍵字 162
7.5 Hive基本操作 163
7.5.1 Hive數據庫管理操作 163
7.5.2 Hive表管理操作 164
7.5.3 Hive查詢基本語法規則 165
7.5.4 Hive基本查詢 165
7.5.5 Hive*查詢 167
7.5.6 Hive JOIN查詢 173
7.6 Hive API 175
7.7 本章小結 176
7.8 習題 176
第8章 大數據實時應用技術 177
8.1 Storm基礎知識 177
8.1.1 Storm基本概述 178
8.1.2 Storm特徵 178
8.1.3 Storm系統結構 179
8.1.4 Storm運行原理 180
8.1.5 Storm應用場景 180
8.2 Storm開發環境安裝 181
8.2.1 Storm配置基礎知識 181
8.2.2 Storm快速部署 181
8.2.3 Storm集群部署 183
8.3 Storm 編程 185
8.4 Storm實現約車大數據分析 190
8.4.1 模擬生成實時約車數據 191
8.4.2 Flume整合Kafka 192
8.4.3 約車數據採集後基於Storm進行實時處理 195
8.5 本章小結 200
8.6 習題 200


