Pentaho Kettle 解決方案-使用 PDI 構建開源 ETL 解決方案(Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Integration) Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案

卡斯特 (Matt Casters), 布曼 (Roland Bouman), 東恩 (Jos van Dongen)

  • 出版商: 電子工業
  • 出版日期: 2014-03-01
  • 定價: $534
  • 售價: 8.5$454
  • 語言: 簡體中文
  • 頁數: 460
  • 裝訂: 平裝
  • ISBN: 7121224453
  • ISBN-13: 9787121224454

已絕版

買這商品的人也買了...

相關主題

商品描述

<內容簡介>

Pentaho Kettle解決方案--使用PDI構建開源ETL解決方案》(作者卡斯特、布曼、東恩)主要介紹如何使用開源ETL工具來完成數據整合工作。
    Pentaho Kettle解決方案--使用PDI構建開源ETL解決方案》介紹的PDI(Kettle)是一種開源的 ETL 解決方案,書中介紹瞭如何使用PDI來實現數據的剖析、清洗、校驗、抽取、轉換、加載等各類常見的ETL類工作。
    除了ODS/DW類比較大型的應用外,Kettle實際還可以為中小企業提供靈活的數據抽取和數據處理的功能。Kettle除了支持各種關係型數據庫、HBaseMongoDB這樣的NoSQL數據源外,它還支持ExcelAccess這類小型的數據源。並且通過插件擴展,Kettle可以支持各類數據源。本書詳細介紹了Kettle可以處理的數據源,而且詳細介紹瞭如何使用Kettle抽取增量數據。
    Kettle的數據處理功能也很強大,除了選擇、過濾、分組、連接、排序這些常用的功能外,Kettle里的Java表達式、正則表達式、Java腳本、Java類等功能都非常靈活而強大,都非常適合於各種數據處理功能。本書也使用了一些篇幅介紹Kettle這些靈活的數據處理功能。
    Pentaho Kettle解決方案:使用PDI構建開源ETL解決方案》後面章節介紹瞭如何在 Kettle上開發插件,如何使用Kettle處理實時數據流,以及如何在Amazon AWS上運行Kettle等一些高級主題。
    除了介紹PDI(Kettle)工具的使用和功能,本書還結合Kimball博士的數據倉庫和ETL子系統的理論,從實踐的角度介紹數據倉庫的模型設計、數據倉庫的構建方法,以及如何使用PDI實現Kimball博士提出的34ETL子系統。