買這商品的人也買了...
-
$594響應式架構:消息模式 Actor 實現與 Scala、Akka 應用集成 -
Hadoop 技術手冊, 4/e (Hadoop: The Definitive Guide, 4/e)$980$774 -
Python + Spark 2.0 + Hadoop 機器學習與大數據分析實戰$680$530 -
Python 自動化的樂趣|搞定重複瑣碎 & 單調無聊的工作 (中文版) (Automate the Boring Stuff with Python: Practical Programming for Total Beginners)$500$395 -
$403AWS Lambda 實戰 : 開發事件驅動的無服務器應用程序 (AWS Lambda in Action: Event-Driven Serverless Applications) -
Docker 這樣學才有趣:從入門,到玩直播、挖礦$450$356 -
遊戲數據分析實戰$474$450 -
$352關聯數據:萬維網上的結構化數據 -
大數據時代一定要會的 SQL 商業資料分析術$680$578 -
推薦系統實踐$419$398 -
機器學習|工作現場的評估、導入與實作$580$458 -
大數據時代的資料庫處理:Spark SQL親自動手做$580$493 -
Think Complexity|複雜性科學與計算模型設計, 2/e (Think Complexity : Complexity Science and Computational Modeling, 2/e)$520$411 -
$327Hive 實戰 -
$469Spark 全棧數據分析 -
$374信息圖表其實很簡單 -
$454Akka 實戰 -
Web API 建構與設計 (Designing Web APIs: Building APIs That Developers Love)$480$379 -
唯一串流大數據處理平台 - Apache Kafka 動手做$580$493 -
SQL 達人的工作現場攻略筆記$580$458 -
東京大學資料科學家養成全書:使用 Python 動手學習資料分析$780$663 -
GAN 對抗式生成網路 (GANs in Action: Deep learning with Generative Adversarial Networks)$750$593 -
強化式學習:打造最強 AlphaZero 通用演算法$780$663 -
深度強化式學習 (Deep Reinforcement Learning in Action)$1,000$790 -
WebSecurity 網站滲透測試:Burp Suite 完全學習指南 (iT邦幫忙鐵人賽系列書)$600$468
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
Hadoop是一個分佈式系統的基礎架構,
支持對大量數據進行分佈式處理,能以高效、可靠的方式完成數據處理。
本書圍繞Hadoop生態圈技術進行講解,
主要包括Hadoop環境配置、Hadoop分佈式文件系統(HDFS)、
Hadoop分佈式計算框架MapReduce、Hadoop資源調度框架YARN與Hadoop新特性、
Hadoop分佈式數據庫HBase、Oozie工作流調度系統等內容。
本書以Linux操作系統為平臺,緊密結合實際應用,貫穿了大量實踐案例。
另外,本書配以多元的學習資源和平臺服務,
包括參考教案、案例素材下載、學習交流社區等,
為讀者提供全方位的學習體驗。
通過系統地學習本書內容和操作實踐,
讀者可以掌握大數據相關技能。
本書適合作為高等學校計算機專業大數據等相關課程的教材使用,
也適合具有一定Linux、Java開發經驗且想從事大數據開發工作的人員自學使用,
還適合作為大數據分析與運維人員的參考用書。
目錄大綱
第1章Hadoop入門1
任務1瞭解大數據現狀2
1.1.1大數據基本概念和特徵2
1.1.2大數據帶來的機遇和挑戰3
任務2瞭解Hadoop基礎4
1.2.1 Hadoop概述4
1.2.2 Hadoop生態圈7
1.2.3 Hadoop應用案例9
任務3搭建移動通信業務的Hadoop處理平臺11
1.3.1安裝虛擬機11
1.3.2安裝Linux操作系統13
1.3.3搭建移動通信業務的Hadoop處理平臺25
1.3 .4大數據集群管理平臺28
1.3.5技能實訓29
本章總結29
本章作業29
第2章Hadoop分佈式文件系統HDFS 31
任務1瞭解HDFS 32
2.1.1認識HDFS 32
2.1.2 HDFS架構34
任務2使用HDFS處理移動通信數據文件35
2.2.1使用HDFS shell操作完成移動通信數據的管理35
2.2.2使用Java API操作完成移動通信數據的管理38
2.2.3技能實訓43
任務3瞭解HDFS運行原理43
2.3.1 HDFS讀寫流程43
2.3.2 HDFS副本機制45
2.3.3 HDFS負載均衡46
2.3.4 HDFS機架感知46
任務4實現移動通信數據的行文件方式存儲47
2.4.1 Hadoop序列化機制47
2.4.2文件格式51
2.4.3技能實訓56
本章總結56
本章作業56
第3章Hadoop分佈式計算框架MapReduce 57
任務1使用MapReduce完成詞頻統計功能58
3.1.1 MapReduce基礎58
3.1.2 MapReduce編程模型59
3.1.3 MapReduce詞頻統計編程實例60
3.1.4技能實訓64
任務2按號段統計手機號碼65
3.2.1 MapReduce輸入/輸出格式65
3.2.2 Combiner類67
3.2.3 Partitioner類69
3.2.4 Shuffle階段72
3.2.5自定義RecordReader 73
3.2.6技能實訓77
任務3使用MapReduce編寫應用案例77
3.3.1使用MapReduce實現join操作78
3.3.2使用MapReduce實現排序功能84
3.3.3使用MapReduce實現二次排序功能86
3.3.4技能實訓91
本章總結91
本章作業91
第4章Hadoop YARN 93
任務1在YARN集群上運行MapReduce作業94
4.1.1 YARN的產生背景94
4.1.2 YARN簡介95
4.1.3 YARN架構設計101
4.1.4技能實訓103
任務2配置YARN容錯104
4.2.1 ResourceManager自動重啟104
4.2.2 ResourceManager高可用105
本章總結108
本章作業108
第5章ZooKeeper簡介及安裝109
任務1瞭解ZooKeeper 110
5.1.1 ZooKeeper概念110
5.1.2 ZooKeeper的作用及優勢111
5.1.3 ZooKeeper架構111
5.1.4 ZooKeeper的應用案例113
任務2搭建ZooKeeper單機環境114
5.2.1 ZooKeeper下載安裝114
5.2.2 ZooKeeper配置114
5.2.3啟動ZooKeeper 115
5.2.4技能實訓115
任務3實現分佈式系統服務器上下線的動態感知116
5.3.1 ZooKeeper Client命令行操作116
5.3.2 Java API操作ZooKeeper 119
5.3.3技能實訓129
本章總結130
本章作業130
第6章HBase基礎131
任務1瞭解HBase 132
6.1.1 HBase是什麼132
6.1.2 HBase發展歷史133
6.1.3 HBase使用案例133
任務2理解HBase體系架構134
6.2.1架構簡介134
6.2.2 HMaster 135
6.2.3 HRegion 135
6.2.4 HRegionServer 136
6.2.5 ZooKeeper 136
任務3理解HBase數據模型136
6.3.1數據模型137
6.3.2概念視圖137
6.3.3物理視圖139
任務4 搭建HBase環境140
6.4.1 HBase安裝包下載140
6.4.2 HBase解壓安裝141 6.4.3HBaseα
分佈式環境搭建141
6.4 .4技能實訓145
本章總結145
本章作業146
第7章HBase操作147
任務1使用HBase Shell完成“王者榮耀”遊戲玩家信息管理操作148
7.1.1 DDL操作148
7.1.2 DML操作154
7.1.3技能實訓159
任務2使用HBase Java API完成“王者榮耀”遊戲玩家信息管理操作159
7.2.1開發環境搭建159
7.2.2核心API 163
7.2.3技能實訓170
任務3使用HBase Rest API訪問“王者榮耀“遊戲玩家信息表170
7.3.1啟動/停止休息服務命令170 7.3.3
訪問方式171
本章
總結172
本章作業172
第8章HBase應用173
任務1使用表空間管理“王者榮耀”遊戲玩家信息表174
8.1.1 HBase名字空間簡介174
8.1.2
技能訓練182
任務2對“王者榮耀”遊戲玩家信息表進行權限管理182
8.2.1授予權限GRANT 182
8.2.2查看權限USER_PERMISSION 184
8.2.3收回權限REVOKE 184
8.2.4技能實訓185
任務3理解HRegion切分185
8.3.1 HRegion切分概念185
8.3.2切分策略185
任務4瞭解HBase中的壓實過程186
8.4.1壓實概念187
8.4.2壓實實現方式187
8.4.3壓實參數187
本章總結188
本章作業188
第9章工作流調度框架Oozie 189
任務1理解Apache Oozie架構190
9.1.1 Oozie簡介190
9.1.2 Oozie架構190
任務2搭建Oozie環境194
9.2.1 Oozie下載安裝194
9.2.2 Oozie配置195
9.2.3 Oozie啟動198
9.2.4技能實訓198
任務3實現遊戲玩家搜索功能198
9.3.1 Shell Action 199
9.3.2 Java Action 201
9.3.3 MapReduce Action 203
9.3.4實現遊戲玩家搜索功能205
9.3.5技能實訓210
本章總結210
本章作業210
第10章項目實訓——《王者榮耀》遊戲英雄排行榜211
10.1項目需求212
10.2項目環境準備213
10.3項目覆蓋的技能點213
10.4難點分析214
10.5項目實現思路219
本章總結233
本章作業233
