Hadoop 技術內幕-深入解析 MapReduce 架構設計與實現原理 Hadoop技术内幕:深入解析MapReduce架构设计与实现原理 (大数据技术丛书)

董西成

  • 出版商: 機械工業
  • 出版日期: 2013-05-06
  • 定價: $414
  • 售價: 8.5$352
  • 語言: 簡體中文
  • 頁數: 318
  • ISBN: 7111422260
  • ISBN-13: 9787111422266
  • 相關分類: Hadoop分散式架構
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

商品描述

<內容簡介>

“Hadoop技術內幕共兩冊,分別從源代碼的角度對“Common+HDFS”“MapReduce的架構設計和實現原理進行了極為詳細的分析。本書由Hadoop領域資深的實踐者親自執筆,首先介紹了MapReduce的設計理念和編程模型,然後從源代碼的角度深入分析了RPC框架、客戶端、JobTrackerTaskTrackerTaskMapReduce運行時環境的架構設計與實現原理,最後從實際應用的角度深入講解了Hadoop的性能優化、安全機制、多用戶作業調度器和下一代MapReduce框架等高級主題和內容。本書適合Hadoop的二次開發人員、應用開發工程師、運維工程師閱讀。
本書共12章,分4個部分(不包括附錄):第一部分(第12章),介紹了Hadoop源代碼的組織結構、獲取、編譯、調試、閱讀環境搭建,以及MapReduce的設計理念和基本架構;第二部分(第3章),著重講解了MapReduce的編程接口,主要包括舊API和新API兩套編程接口,以及Hadoop工作流;第三部分(第48章)主要分析MapReduce的運行時環境,包括RPC框架、客戶端、JobTrackerTaskTrackerTask等的內部實現細節和機制剖析;第四部分(第912章)深入講解了Hadoop的性能優化、多用戶作業調度器、安全機制和下一代MapReduce框架等高級主題。

經過幾年的快速發展,Hadoop已經成為大數據時代存儲和處理海量數據的事實標準,具有高可靠性、高擴展性、高效性和高容錯性等許多優點,在學術界備受關註,在業界則更受歡迎。 Hadoop的功能非常強大,與之相伴的是使用上的複雜性,如何才能更好地使用Hadoop、更好地對Hadoop進行性能優化、擴展和定製?通過閱讀和研究它的源代碼實現以上目標是一種不錯的選擇。 “Hadoop技術內幕這兩本書根據讀者的需求,對CommonHDFSMapReduce等核心技術的架構設計和實現原理進行了深入且詳細的分析,​​對於想瞭解Hadoop工作機制的讀者來說,這兩本書應該是十分難得的,強烈推薦。
—— EasyHadoop開源技術社區(www.easyhadoop.com) 致力於Hadoop的易用和普及

Hadoop是近兩年來技術領域最熱門的話題,從媒體界到學術界,再到企業界,都給予了高度關註。
在企業界,無論是在IT領域,還是在金融、電信、生物、醫藥、製造等傳統領域,Hadoop的應用都非常廣泛,可以說只要有海量數據需要處理的地方,就有Hadoop尤其是在IT領域,從國外的GoogleYahooMicrosoftOracleFacebook,到國內的阿裡巴巴、淘寶、騰訊、百度、新浪、搜狐,都在Hadoop的研發和應用上投入了大量的人力和資金,並獲得了豐厚的收益。隨著Hadoop的普及,用戶遇到的問題會越來越多,也會越來越複雜。要解決實際生產環境中可能遇到的複雜問題,掌握Hadoop本身的設計和實現原理是根本之道。 “Hadoop技術內幕這兩本書就本著這個目標出發,從源代碼的角度對Hadoop的工作機制進行了深入的分析,並對實踐中可能會遇到的各種問題給出瞭解決方案。
—— 童小軍資深Hadoop技術專家、企業級大數據解決方案RedHadoop創始人
本書主要內容:
Hadoop源代碼的組織結構、獲取方法、編譯與調試,以及閱讀環境的搭建;
MapReduce的設計目標和Hadoop的基
​​本結構;
MapReduce的編程模型、核心概念、新舊API的比較,以及Hadoop的工作流;
Hadoop RPC框架的原理和機制分析;
作業提交與初始化過程詳細分析;
JobTrackerTaskTracker的內部實現機制剖析;
Task運行過程的深度分析;
Hadoop的性能優化經驗總結;
Hadoop多用戶作業調度器的實現原理;
Hadoop的安全機制和原理;
下一代MapReduce框架的設計