Processing Big Data with Azure HDInsight: Building Real-World Big Data Systems on Azure HDInsight Using the Hadoop Ecosystem

Vinit Yadav

  • 出版商: Apress
  • 出版日期: 2017-06-01
  • 定價: $1,520
  • 售價: 9.0$1,368
  • 語言: 英文
  • 頁數: 207
  • 裝訂: Paperback
  • ISBN: 1484228685
  • ISBN-13: 9781484228685
  • 相關分類: HadoopMicrosoft Azure大數據 Big-data
  • 立即出貨 (庫存=1)

買這商品的人也買了...

商品描述

Get a jump start on using Azure HDInsight and Hadoop Ecosystem components. As most Hadoop and Big Data projects are written in either Java, Scala, or Python, this book minimizes the effort to learn another language and is written from the perspective of a .NET developer. Hadoop components are covered, including Hive, Pig, HBase, Storm, and Spark on Azure HDInsight, and code samples are written in .NET only.
 
Processing Big Data with Azure HDInsight covers the fundamentals of big data, how businesses are using it to their advantage, and how Azure HDInsight fits into the big data world. This book introduces Hadoop and big data concepts and then dives into creating different solutions with HDInsight and the Hadoop Ecosystem. It covers concepts with real-world scenarios and code examples, making sure you get hands-on experience. The best way to utilize this book is to practice while reading. After reading this book you will be familiar with Azure HDInsight and how it can be utilized to build big data solutions, including batch processing, stream analytics, interactive processing, and storing and retrieving data in an efficient manner.
 
What You'll Learn
  • Understand the fundamentals of HDInsight and Hadoop
  • Work with HDInsight cluster
  • Query with Apache Hive and Apache Pig
  • Store and retrieve data with Apache HBase
  • Stream data processing using Apache Storm
  • Work with Apache Spark
Who This Book Is For
 
Software developers, technical architects, data scientists/analyts, and Hadoop administrators who want to develop on Microsoft’s managed Hadoop offering, HDInsight
 
 
 

商品描述(中文翻譯)

在使用 Azure HDInsight 和 Hadoop 生態系統組件方面,快速入門。由於大多數 Hadoop 和大數據項目都是使用 Java、Scala 或 Python 編寫的,因此本書最大程度地減少了學習另一種語言的工作量,並從 .NET 開發人員的角度撰寫。本書涵蓋了 Hadoop 的組件,包括 Azure HDInsight 上的 Hive、Pig、HBase、Storm 和 Spark,並且代碼示例僅使用 .NET 編寫。

《使用 Azure HDInsight 處理大數據》介紹了大數據的基礎知識,以及企業如何利用它獲得優勢,以及 Azure HDInsight 如何適應大數據世界。本書介紹了 Hadoop 和大數據概念,然後深入探討了使用 HDInsight 和 Hadoop 生態系統創建不同解決方案的方法。它通過真實世界的場景和代碼示例來解釋概念,確保您獲得實踐經驗。最好的學習方法是在閱讀時進行實踐。閱讀本書後,您將熟悉 Azure HDInsight 以及如何利用它來構建大數據解決方案,包括批處理、流式分析、交互式處理以及高效存儲和檢索數據的方法。

《本書的學習內容》

- 理解 HDInsight 和 Hadoop 的基礎知識
- 使用 HDInsight 集群
- 使用 Apache Hive 和 Apache Pig 查詢
- 使用 Apache HBase 存儲和檢索數據
- 使用 Apache Storm 進行流式數據處理
- 使用 Apache Spark

《本書的讀者對象》

軟件開發人員、技術架構師、數據科學家/分析師和 Hadoop 管理員,他們希望在 Microsoft 的托管 Hadoop 解決方案 HDInsight 上進行開發。