Hadoop 技術手冊, 4/e (Hadoop: The Definitive Guide, 4/e)
Tom White 著,林峰正、王耀聰、辜文元、施赬陽、周天穎 譯
- 出版商: 歐萊禮
- 出版日期: 2016-09-14
- 定價: $980
- 售價: 7.9 折 $774
- 語言: 繁體中文
- ISBN: 9864761366
- ISBN-13: 9789864761364
-
相關分類:
Hadoop
- 相關原文書: Hadoop: The Definitive Guide, 4/e (Paperback)
立即出貨 (庫存 > 10)
買這商品的人也買了...
-
$620$527C 語言教學手冊, 4/e
-
$580$458Spring Data 技術手冊 (Spring Data)
-
$580$522Hadoop 管理手冊 (Hadoop Operations)
-
$400$360It's Django -- 用 Python 迅速打造 Web 應用
-
$540$486最新網路概論, 14/e
-
$780$616精通 Python|運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)
-
$680$537資料科學的商業運用 (Data science for business)
-
$560$437Python 程式設計實務-從初學到活用 Python 開發技巧的16堂課
-
$680$612Docker 錦囊妙計 (Docker Cookbook)
-
$580$452Python 機器學習 (Python Machine Learning)
-
$520$468Spark 學習手冊 (Learning Spark: Lightning-Fast Big Data Analysis)
-
$580$493寫給 PM、RD 與設計師看的設計需求分析─使用者想要的應用程式都是這樣打造出來的 (Designing the Requirements: Building Applications that the User Wants and Needs)
-
$580$522機器學習 | 使用 Python 進行預測分析的基本技術
-
$480$384資料智慧化:利用資料科學,將資訊化為創見
-
$680$530Python + Spark 2.0 + Hadoop 機器學習與大數據分析實戰
-
$580$458網站擷取|使用 Python (Web Scraping with Python: Collecting Data from the Modern Web)
-
$520$442Spark 大數據分析新利器─資料科學家與數據分析師非用不可的入門指南書 (Big Data Analytics with Spark: A Practitioner's Guide to Using Spark for Large Scale Data Analysis)
-
$500$395Python 自動化的樂趣|搞定重複瑣碎 & 單調無聊的工作 (中文版) (Automate the Boring Stuff with Python: Practical Programming for Total Beginners)
-
$590$460TensorFlow+Keras 深度學習人工智慧實務應用
-
$390$332寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)
-
$580$458Deep Learning|用 Python 進行深度學習的基礎理論實作
-
$480$379初探機器學習|使用 Python (Thoughtful Machine Learning with Python)
-
$450$356演算法圖鑑:26種演算法 + 7種資料結構,人工智慧、數據分析、邏輯思考的原理和應用 step by step 全圖解
-
$540$459Hadoop 進入全球最大市場的實戰案例
-
$534$507Docker 技術入門與實戰, 3/e
商品描述
準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用Apache Hadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。
針對Hadoop 2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。
.學習基礎元件如MapReduce、HDFS及YARN。
.更深入探索MapReduce,包含開發應用程式。
.設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。
.學習兩種資料格式:Avro 的資料序列化和Parquet巢狀資料。
.使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。
.了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。
.學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。
目錄大綱
第一部分 Hadoop 基礎
chapter 1|遇見 Hadoop
chapter 2|MapReduce
chapter 3|Hadoop 分散式檔案系統
chapter 4|YARN
chapter 5|Hadoop 的 I/O
第二部分 MapReduce
chapter 6|開發 MapReduce 程式
chapter 7|MapReduce 如何運作
chapter 8|MapReduce 的類型與格式
chapter 9|MapReduce 的特性
第三部分 Hadoop 操作
chapter 10|建立一個 Hadoop 叢集
chapter 11|Hadoop 的管理
第四部分 相關專案
chapter 12|Avro
chapter 13|Parquet
chapter 14|Flume
chapter 15|Sqoop
chapter 16|Pig
chapter 17|Hive
chapter 18|Crunch
chapter 19|Spark
chapter 20|HBase
chapter 21|ZooKeeper
第五部分 案例研究
chapter 22|Cerner 的可聚集資料
chapter 23|生物資料科學:用軟體拯救生命
chapter 24|Cascading
appendix A|安裝 Apache Hadoop
appendix B|Cloudera 的Hadoop 發行套件
appendix C|準備 NCDC 氣象資料
appendix D|舊版及新版的 Java MapReduce API
index