買這商品的人也買了...
-
大話資料結構$590$466 -
Processing 入門-互動式圖形實作介紹 (Getting Started with Processing)$400$316 -
Perl 學習手冊, 6/e (Learning Perl, 6/e)$580$458 -
開發專屬個人的搜尋引擎:使用 Lucene & Heritrix, 2/e$560$476 -
$276Hadoop 雲計算實戰 -
掌握 Hadoop 翱翔雲端-Windoop 應用實作指南$500$390 -
Hadoop 技術手冊, 3/e (Hadoop: The Definitive Guide, 3/e)$880$695 -
精通 Cassandra (Cassandra 精通實戰解析)$600$510 -
無瑕的程式碼-敏捷軟體開發技巧守則 (Clean Code: A Handbook of Agile Software Craftsmanship)$580$452 -
Spring Data 技術手冊 (Spring Data)$580$458 -
搞懂 NoSQL 的 15 堂課 (NoSQL Distilled 中文版) (NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence)$360$284 -
$534Hadoop 技術內幕-深入解析 Hadoop Common 和 HDFS 架構設計與實現原理 -
$1,260Data Warehousing in the Age of Big Data (Paperback) -
Apache Sqoop Cookbook (Paperback)$470$446 -
$354HBase 管理指南 (HBase Administration Cookbook) -
挑戰大數據-Facebook、Google、Amazon 怎麼處理 Big Data?用 NoSQL 搞定每年 100 億顆硬碟資料$580$493 -
$414Hadoop 技術內幕-深入解析 YARN 架構設計與實現原理 -
雲端運算應用與實務$400$360 -
$474全程軟件測試(第2版) -
$474Hadoop 應用開發技術詳解 -
$534深入雲計算-Hadoop 源代碼分析(修訂版) -
$534HBase企業應用開發實戰/大數據技術叢書 -
$354Spark 大數據處理(技術應用與性能優化) -
最新 Hadoop Yarn 的精華:MapReduce 機制$480$408 -
Hadoop 實戰分析, 2/e (徹底研究 Hadoop 實戰分析)$720$612
商品描述
<內容簡介>
“Hadoop技術內幕”共兩冊,分別從源代碼的角度對“Common+HDFS”和“MapReduce的架構設計和實現原理”進行了極為詳細的分析。本書由Hadoop領域資深的實踐者親自執筆,首先介紹了MapReduce的設計理念和編程模型,然後從源代碼的角度深入分析了RPC框架、客戶端、JobTracker、TaskTracker和Task等MapReduce運行時環境的架構設計與實現原理,最後從實際應用的角度深入講解了Hadoop的性能優化、安全機制、多用戶作業調度器和下一代MapReduce框架等高級主題和內容。本書適合Hadoop的二次開發人員、應用開發工程師、運維工程師閱讀。
本書共12章,分4個部分(不包括附錄):第一部分(第1~2章),介紹了Hadoop源代碼的組織結構、獲取、編譯、調試、閱讀環境搭建,以及MapReduce的設計理念和基本架構;第二部分(第3章),著重講解了MapReduce的編程接口,主要包括舊API和新API兩套編程接口,以及Hadoop工作流;第三部分(第4~8章)主要分析了MapReduce的運行時環境,包括RPC框架、客戶端、JobTracker、TaskTracker和Task等的內部實現細節和機制剖析;第四部分(第9~12章)深入講解了Hadoop的性能優化、多用戶作業調度器、安全機制和下一代MapReduce框架等高級主題。
經過幾年的快速發展,Hadoop已經成為大數據時代存儲和處理海量數據的事實標準,具有高可靠性、高擴展性、高效性和高容錯性等許多優點,在學術界備受關註,在業界則更受歡迎。 Hadoop的功能非常強大,與之相伴的是使用上的複雜性,如何才能更好地使用Hadoop、更好地對Hadoop進行性能優化、擴展和定製?通過閱讀和研究它的源代碼實現以上目標是一種不錯的選擇。 “Hadoop技術內幕”這兩本書根據讀者的需求,對Common、HDFS和MapReduce等核心技術的架構設計和實現原理進行了深入且詳細的分析,對於想瞭解Hadoop工作機制的讀者來說,這兩本書應該是十分難得的,強烈推薦。
—— EasyHadoop開源技術社區(www.easyhadoop.com) 致力於Hadoop的易用和普及
Hadoop是近兩年來技術領域最熱門的話題,從媒體界到學術界,再到企業界,都給予了高度關註。在企業界,無論是在IT領域,還是在金融、電信、生物、醫藥、製造等傳統領域,Hadoop的應用都非常廣泛,可以說只要有海量數據需要處理的地方,就有Hadoop。尤其是在IT領域,從國外的Google、Yahoo! 、Microsoft、Oracle、Facebook,到國內的阿裡巴巴、淘寶、騰訊、百度、新浪、搜狐,都在Hadoop的研發和應用上投入了大量的人力和資金,並獲得了豐厚的收益。隨著Hadoop的普及,用戶遇到的問題會越來越多,也會越來越複雜。要解決實際生產環境中可能遇到的複雜問題,掌握Hadoop本身的設計和實現原理是根本之道。 “Hadoop技術內幕”這兩本書就本著這個目標出發,從源代碼的角度對Hadoop的工作機制進行了深入的分析,並對實踐中可能會遇到的各種問題給出瞭解決方案。
—— 童小軍資深Hadoop技術專家、企業級大數據解決方案RedHadoop創始人
本書主要內容:
Hadoop源代碼的組織結構、獲取方法、編譯與調試,以及閱讀環境的搭建;
MapReduce的設計目標和Hadoop的基本結構;
MapReduce的編程模型、核心概念、新舊API的比較,以及Hadoop的工作流;
Hadoop RPC框架的原理和機制分析;
作業提交與初始化過程詳細分析;
JobTracker和TaskTracker的內部實現機制剖析;
Task運行過程的深度分析;
Hadoop的性能優化經驗總結;
Hadoop多用戶作業調度器的實現原理;
Hadoop的安全機制和原理;
下一代MapReduce框架的設計
