Apache Oozie: The Workflow Scheduler for Hadoop (Paperback)

Mohammad Kamrul Islam, Aravind Srinivasan

  • 出版商: O'Reilly
  • 出版日期: 2015-06-23
  • 定價: $1,360
  • 售價: 8.0$1,088
  • 語言: 英文
  • 頁數: 272
  • 裝訂: Paperback
  • ISBN: 1449369928
  • ISBN-13: 9781449369927
  • 相關分類: Hadoop
  • 立即出貨(限量) (庫存=4)

買這商品的人也買了...

商品描述

Get a solid grounding in Apache Oozie, the Workflow scheduler system for managing Hadoop jobs. With this hands-on guide, two experienced Hadoop practitioners walk you through the intricacies of this powerful and flexible platform, with numerous examples and real-world use cases.

Once you set up your Oozie server, you’ll dive into techniques for writing and coordinating Workflows, and learn how to write complex data pipelines. Advanced topics show you how to handle shared libraries in Oozie, as well as how to implement and manage Oozie’s security capabilities.

  • Install and configure an Oozie server, and get an overview of basic concepts
  • Journey through the world of writing and configuring Workflows
  • Learn how the Oozie Coordinator schedules and executes Workflows based on triggers
  • Understand how Oozie manages data dependencies
  • Use Oozie Bundles to package several Coordinator apps into a data pipeline
  • Learn about security features and shared library management
  • Implement custom extensions and write your own EL functions and actions
  • Debug Workflows and manage Oozie’s operational details

商品描述(中文翻譯)

獲得 Apache Oozie 的扎實基礎,這是一個用於管理 Hadoop 任務的工作流程調度系統。這本實踐指南由兩位經驗豐富的 Hadoop 專家帶領您深入了解這個功能強大且靈活的平台,並提供眾多實例和實際應用案例。

一旦您設置好 Oozie 伺服器,您將深入研究撰寫和協調工作流程的技巧,並學習如何撰寫複雜的數據管道。高級主題將向您展示如何在 Oozie 中處理共享庫,以及如何實施和管理 Oozie 的安全功能。

以下是本書的主要內容:
- 安裝和配置 Oozie 伺服器,並瞭解基本概念
- 深入探索撰寫和配置工作流程的世界
- 瞭解 Oozie 協調器根據觸發器安排和執行工作流程的方式
- 理解 Oozie 如何管理數據依賴關係
- 使用 Oozie Bundles 將多個協調器應用程序打包成數據管道
- 瞭解安全功能和共享庫管理
- 實施自定義擴展,撰寫自己的 EL 函數和操作
- 調試工作流程並管理 Oozie 的運營細節

這本書將通過豐富的示例和真實世界的應用案例,幫助您深入了解 Apache Oozie,並成為一名熟練的使用者。