買這商品的人也買了...
-
$305軟件需求分析實戰 -
$352分佈式實時系統數據分發服務 -
$450仿人機器人建模與控制 -
$270測試技術模擬與實踐 -
$408Python 編程從入門到提高 -
$509Python 工匠 案例、技巧與工程實踐 -
$422Koa 開發:入門、進階與實戰 -
$374虛擬偶像 AI 實現 -
MLOps 實踐 — 機器學習從開發到生產 (全彩)$636$604 -
$551圖解智能網聯汽車:原理●構造●診斷●維修 -
$458動手打造深度學習框架 -
$374虛擬現實與增強現實技術 -
$232IT項目經理進階之道 -
$749視覺慣性 SLAM:理論與源碼解析 -
$556點雲配準從入門到精通 -
$505Vue 3 移動 Web 開發與性能調優實戰 -
AI 加速器架構設計與實現圖書$594$564 -
$709分佈式機器學習 — 系統、工程與實戰 -
APCS 大學程式設計先修檢測完勝教材 -- 使用 C & Python$500$395 -
$505高效 C/C++ 調試 -
$352軟件優化技術 -
$458智能駕駛之激光雷達算法詳解 -
$422大模型動力引擎 — PyTorch 性能與顯存優化手冊 -
$290HDFS+MapReduce分佈式存儲與計算實戰 -
$709智能駕駛硬件在環模擬測試與實踐
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書以Hadoop HDFS為載體,濃縮介紹構成一款分佈式系統(尤其是存儲方向)所需的精華部件,
所有內容均基於當前新的3.3.x/3.4.x版本,分別從核心原理和拓展實踐兩個維度逐一闡述。
本書主要包括兩篇:核心原理篇介紹了HDFS的誕生歷史、元數據及Block管理、節點間通信機制、讀寫數據流程和高可用實現原理等;
拓展與實踐篇從實際出發,充分考慮了在應用過程中會遇到的痛點,
詳細介紹集群拓展方法、數據分層存儲、集群維護與多租戶實施等實踐經驗。
本書中各章節在需要的地方配有必要的流程圖和原理分析圖,便於讀者閱讀理解,並精選了非常有用的實際案例及拓展。
閱讀本書後,讀者會有1+1>2的收穫。
作者簡介
祝江華,大數據技術專家。多年來一直供職於頭部因特網公司,積累了較為豐富的大數據行業一線研發和集群維護經驗;熱愛開源,長期活躍在Apache開源社區,對包括Hadoop生態在內的多款組件有過深入研究;分佈式技術極客,擅長分佈式存儲方向,同時對大數據計算、數據湖等也有豐富實戰經驗。
目錄大綱
【目錄】
第1篇核心原理篇
第1章HDFS歷史延展/
1.1 分佈式與文件系統/
1.1.1 分佈式文件系統部署架構/
1.1.2 系統性能的影響因素/
1.2 HDFS設計及實現思想/
1.2.1 HDFS發展歷史/
1.2.2 HDFS性/
1.2.3 HDFS服務視圖/
1.2.4 HDFS架構/
1.3 小結/
第2章元數據架構/
2.1 內存Tree設計/
2.1.1 Namenode介紹/
2.1.2 Namenode啟動/
2.1.3 meta視圖/
2.1.4 FsDirectory和INodeMap/
2.1.5 文件維護/
2.2 FsImage和Edit Log/
2.2.1 FsImage分析/
2.2.2 Edit Log分析/
2.3 meta更新/
2.3.1 內存結構Update/
2.3.2 拓展:鎖優化/
2.4 小結/
第3章數據管理/
3.1 Namespace/
3.1.1 Namespace概況/
3.1.2 Namenode與Namespace/
3.1.3 DataNode與Namespace/
3.2 Slave節點/
3.2.1 Heartbeat機制/
3.2.2 FsDataset和DataStorage/
3.2.3 DataNode檢查器/
3.2.4 存儲類型/
3.2.5 拓展:NVDIMM/
3.3 Topology(Rack) Awareness/
3.3.1 Topology Awareness在分佈式存儲中的意義/
3.3.2 Topology Awareness在HDFS中實現/
3.3.3 Topology改進/
3.4 小結/
第4章Block與副本/
4.1 理解Block/
4.1.1 Block構成解析/
4.1.2 副本存儲解析/
4.2 Block狀態管理/
4.2.1 UnderConstruction/
4.2.2 Committed/
4.2.3 Complete/
4.2.4 UnderRecovery/
4.2.5 Block狀態小結/
4.3 副本狀態管理/
4.3.1 RBW/
4.3.2 finalized/
4.3.3 RWR/
4.3.4 RUR/
4.3.5 Temporary/
4.3.6 副本狀態小結/
4.4 Block管理/
4.4.1 無效Block/
4.4.2 損壞Block/
4.4.3 缺失與冗餘Block/
4.4.4 Block Recovery/
4.5 副本策略/
4.5.1 位置策略/
4.5.2 選盤(Volume)策略/
4.5.3 選盤策略改進/
4.6 小結/
第5章通信與訪問/
5.1 HDFS RPC/
5.1.1 Protocol Buffers介紹/
5.1.2 RPC架構/
5.1.3 非冪等訪問/
5.2 文件寫入/
5.2.1 數據包(packet)與Pipeline/
5.2.2 數據寫入/
5.2.3 Lease管理與pipeline Recovery/
5.3 數據訪問/
5.3.1 文件讀剖析/
5.3.2 short-circuit/
5.3.3 讀寫策略改進/
5.4 小結/
第6章HA和QJM/
6.1 HA發展路徑/
6.2 Quorum Journal Manager/
6.2.1 分佈式一致性原理/
6.2.2 Edit共享存儲系統/
6.2.3 QJM架構設計/
6.2.4 Edit Recovery/
6.3 HA原理/
6.3.1 ZKFC解析/
6.3.2 HA隔離機制/
6.3.3 Multi-Standby性/
6.3.4 HA優化及改進/
6.4 小結/
第7章緩存/
7.1 分佈式系統緩存設計/
7.1.1 本地緩存/
7.1.2 分佈式緩存/
7.2 集中式緩存管理/
7.2.1 原理介紹/
7.2.2 緩存調度/
7.2.3 DataNode緩存原理/
7.2.4 Cache&Uncache場景/
7.3 緩存實踐場景及改進/
7.3.1 實踐場景介紹/
7.3.2 集中式緩存V2/
7.4 小結/
第2篇拓展與實踐篇
第8章集群拓展/
8.1 水平拓展/
8.1.1 水平拓展策略及實踐/
8.1.2 Router-Based Federation/
8.2 垂直伸縮/
8.2.1 垂直伸縮策略及實踐/
8.2.2 HDFS Quotas/
8.3 多Namespace業務規劃/
8.4 小結/
第9章數據分層/
9.1 存儲分層的意義/
9.2 HDFS存儲分層/
9.2.1 冷熱集群分層管理/
9.2.2 異構分層存儲/
9.2.3 動態感知數據類型/
9.3 糾刪碼(Erasure Coding)/
9.3.1 EC使用介紹/
9.3.2 常見EC算法介紹/
9.3.3 EC讀寫解析/
9.4 數據遷移/
9.4.1 DistCp遷移/
9.4.2 FastCopy遷移/
9.5 小結/
第10章監控、多租戶和數據湖/
10.1 大數據監控/
10.1.1 基礎設施監控採集/
10.1.2 故障自愈/
10.2 多租戶與認證/
10.2.1 多租戶存儲規劃/
10.2.2 基於Kerberos的認證/
10.2.3 基於Delegation Token的認證/
10.3 HDFS與Data Lakes/
10.4 小結/
