Programming Pig: Dataflow Scripting with Hadoop (2/e)

Alan Gates, Daniel Dai

  • 出版商: O'Reilly
  • 出版日期: 2016-12-27
  • 售價: $1,370
  • 貴賓價: 9.5$1,302
  • 語言: 英文
  • 頁數: 368
  • 裝訂: Paperback
  • ISBN: 1491937092
  • ISBN-13: 9781491937099
  • 相關分類: Hadoop
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

商品描述

This guide is an ideal learning tool and reference for Apache Pig, the open source engine for executing parallel data flows on Hadoop. With Pig, you can batch-process data without having to create a full-fledged application—making it easy for you to experiment with new datasets.

This fully updated edition of Programming Pig introduces new users to Pig, and provides experienced users with comprehensive coverage on key features such as the Pig Latin scripting language, the Grunt shell, and User Defined Functions (UDFs) for extending Pig. If you need to analyze terabytes of data, this book shows you how to do it efficiently with Pig.

商品描述(中文翻譯)

這本書是一個理想的學習工具和參考資料,針對 Apache Pig 這個在 Hadoop 上執行並行資料流的開源引擎。使用 Pig,您可以批次處理資料,而不需要建立完整的應用程式,這使您可以輕鬆地嘗試新的資料集。

這本全面更新的《Programming Pig》介紹了 Pig,並為有經驗的使用者提供了關於關鍵功能的詳盡介紹,例如 Pig Latin 腳本語言、Grunt shell 和用於擴展 Pig 的使用者定義函數(UDFs)。如果您需要分析數量達到 TB 級別的資料,這本書將向您展示如何使用 Pig 進行高效處理。