Hadoop 技術手冊, 4/e (Hadoop: The Definitive Guide, 4/e)

Tom White 著,林峰正、王耀聰、辜文元、施赬陽、周天穎 譯

立即出貨 (庫存 > 10)

  • 9789864761364 b1
  • 9789864761364 b2
  • 9789864761364 b3
  • 9789864761364 b4
  • 9789864761364 b5
  • 9789864761364 b6
  • 9789864761364 b7
  • 9789864761364 b8
  • 9789864761364 b9
  • 9789864761364 b10
  • 9789864761364 b11
  • 9789864761364 b12
9789864761364 b1

買這商品的人也買了...

產品描述

<內容簡介>

準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用Apache Hadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。

針對Hadoop 2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。

.學習基礎元件如MapReduce、HDFS及YARN。
.更深入探索MapReduce,包含開發應用程式。
.設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。
.學習兩種資料格式:Avro 的資料序列化和Parquet巢狀資料。
.使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。
.了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。
.學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。

<目錄>

 
第一部分 Hadoop 基礎
chapter 1|遇見 Hadoop
chapter 2|MapReduce
chapter 3|Hadoop 分散式檔案系統
chapter 4|YARN
chapter 5|Hadoop 的 I/O

第二部分 MapReduce
chapter 6|開發 MapReduce 程式
chapter 7|MapReduce 如何運作
chapter 8|MapReduce 的類型與格式
chapter 9|MapReduce 的特性

第三部分 Hadoop 操作
chapter 10|建立一個 Hadoop 叢集
chapter 11|Hadoop 的管理

第四部分 相關專案
chapter 12|Avro
chapter 13|Parquet
chapter 14|Flume
chapter 15|Sqoop
chapter 16|Pig
chapter 17|Hive
chapter 18|Crunch
chapter 19|Spark
chapter 20|HBase
chapter 21|ZooKeeper

第五部分 案例研究
chapter 22|Cerner 的可聚集資料
chapter 23|生物資料科學:用軟體拯救生命
chapter 24|Cascading

appendix A|安裝 Apache Hadoop
appendix B|Cloudera 的Hadoop 發行套件
appendix C|準備 NCDC 氣象資料
appendix D|舊版及新版的 Java MapReduce API
index