The Data Warehouse ETL Toolkit : Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data
暫譯: 數據倉儲ETL工具包:提取、清理、標準化和交付數據的實用技術
Ralph Kimball, Joe Caserta
- 出版商: Wiley
- 出版日期: 2004-10-04
- 定價: $1,800
- 售價: 8.5 折 $1,530
- 語言: 英文
- 頁數: 528
- 裝訂: Paperback
- ISBN: 8126505540
- ISBN-13: 9780764567575
-
相關分類:
Data-mining
立即出貨
買這商品的人也買了...
-
計算機組織與設計--軟硬體界面第二版 (Computer Organization & Design, 2/e)$680$537 -
C++ Primer, 3/e 中文版$980$774 -
The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 2/e (Paperback)$2,240$2,128 -
Visual C#.NET 程式設計經典$650$514 -
Sun Certified Programmer & Developer for Java 2 Study Guide, 2/e$1,800$1,710 -
作業系統概念 (Operating System Concepts, 6/e Windows XP Update)$780$741 -
ASP.NET 程式設計徹底研究$590$466 -
ASP.NET 1.0 教學手冊--使用C# (Beginning ASP.NET 1.0 with C#)$580$458 -
鳥哥的 Linux 私房菜-伺服器架設篇$750$638 -
鳥哥的 Linux 私房菜─基礎學習篇增訂版$560$476 -
CCNA Self-Study: Interconnecting Cisco Network Devices (ICND) 640-811, 640-801, 2/e$2,220$2,109 -
SCJP‧SCJD 專業認證指南 (Sun Certified Programmer & Developer for Java 2 #310-305 與310-027)$850$723 -
人月神話:軟體專案管理之道 (20 週年紀念版)(The Mythical Man-Month: Essays on Software Engineering, Anniversary Edition, 2/e)$480$379 -
JSP 2.0 技術手冊$750$593 -
建構嵌入式 Linux 系統$780$616 -
最新 JavaScript 完整語法參考辭典 第三版$490$382 -
Windows 程式設計使用 MFC (Programming Windows with MFC, 2/e)$990$782 -
RFID 技術與應用$480$408 -
WDM Driver 程式設計實務$650$514 -
ISA Server 2004 防火牆安裝與管理指南$640$506 -
$675LPIC 1 Exam Cram 2: Linux Professional Institute Certification Exams 101 and 102 (Paperback) -
ASP.NET 徹底研究進階技巧─高階技巧與控制項實作$650$507 -
深入淺出 Java 程式設計, 2/e (Head First Java, 2/e)$880$695 -
大話設計模式$620$490 -
Silverlight 3.0 全面精通手冊─使用 VC#$650$514
商品描述
Description:
* Cowritten by Ralph Kimball, the world's leading data warehousing authority, whose previous books have sold more than 150,000 copies
* Delivers real-world solutions for the most time- and labor-intensive portion of data warehousing-data staging, or the extract, transform, load (ETL) process
* Delineates best practices for extracting data from scattered sources, removing redundant and inaccurate data, transforming the remaining data into correctly formatted data structures, and then loading the end product into the data warehouse
* Offers proven time-saving ETL techniques, comprehensive guidance on building dimensional structures, and crucial advice on ensuring data quality
Table of Contents:
Acknowledgments.
About the Authors.
Introduction.
Part I: Requirements, Realities, and Architecture.
Chapter 1: Surrounding the Requirements.
Chapter 2: ETL Data Structures.
Part II: Data Flow.
Chapter 3: Extracting.
Chapter 4: Cleaning and Conforming.
Chapter 5: Delivering Dimension Tables.
Chapter 6: Delivering Fact Tables.
Part III: Implementation and operations.
Chapter 7: Development.
Chapter 8: Operations.
Chapter 9: Metadata.
Chapter 10: Responsibilities.
Part IV: Real Time Streaming ETL Systems.
Chapter 11: Real-Time ETL Systems.
Chapter 12: Conclusions.
Index.
商品描述(中文翻譯)
**描述:**
* 本書由全球領先的資料倉儲權威 Ralph Kimball 共同撰寫,其前作已售出超過 150,000 本
* 提供針對資料倉儲中最耗時且勞力密集的部分——資料階段(即提取、轉換、加載 ETL 過程)的實際解決方案
* 描述從分散的來源提取資料、去除冗餘和不準確資料、將剩餘資料轉換為正確格式的資料結構,然後將最終產品加載到資料倉儲中的最佳實踐
* 提供經驗證的節省時間的 ETL 技術、建立維度結構的全面指導,以及確保資料品質的重要建議
**目錄:**
致謝。
關於作者。
導言。
**第一部分:需求、現實與架構。**
第 1 章:需求的周邊。
第 2 章:ETL 資料結構。
**第二部分:資料流。**
第 3 章:提取。
第 4 章:清理與一致性。
第 5 章:交付維度表。
第 6 章:交付事實表。
**第三部分:實施與操作。**
第 7 章:開發。
第 8 章:操作。
第 9 章:元資料。
第 10 章:責任。
**第四部分:即時串流 ETL 系統。**
第 11 章:即時 ETL 系統。
第 12 章:結論。
索引。
