Principles of Data Integration (Hardcover)

AnHai Doan, Alon Halevy, Zachary Ives

買這商品的人也買了...

商品描述

How do you approach answering queries when your data is stored in multiple databases that were designed independently by different people? This is first comprehensive book on data integration and is written by three of the most respected experts in the field.

This book provides an extensive introduction to the theory and concepts underlying today's data integration techniques, with detailed, instruction for their application using concrete examples throughout to explain the concepts. Data integration is the problem of answering queries that span multiple data sources (e.g., databases, web pages). Data integration problems surface in multiple contexts, including enterprise information integration, query processing on the Web, coordination between government agencies and collaboration between scientists. In some cases, data integration is the key bottleneck to making progress in a field.

The authors provide a working knowledge of data integration concepts and techniques, giving you the tools you need to develop a complete and concise package of algorithms and applications.

Table Of Contents

CH 1: Introduction

Part I: Foundational Data Integration Techniques

CH 2: Manipulating Query Expressions

CH 3: Describing Data Sources

CH 4: String Matching

CH 5: Schema Matching and Mapping

CH 6: General Schema Manipulation Operators

CH 7: Data Matching

CH 8: Query Processing

CH 9: Wrappers

CH 10: Data Warehousing and Caching

Part II: Integration with Extended Data Representations

CH 11: XML

CH 12: Ontologies and Knowledge Representation

CH 13: Incorporating Uncertainty into Data Integration

CH 14: Data Provenance

Part III: Novel Integration Architectures

CH 15: Data Integration on the Web

CH 16: Keyword Search: Integration on Demand

CH 17: Peer-to-Peer Integration

CH 18: Integration in Support of Collaboration

CH 19: The Future of Data Integration

商品描述(中文翻譯)

當您的數據存儲在由不同人獨立設計的多個數據庫中時,您如何處理回答查詢的方法?這是關於數據集成的第一本綜合性書籍,由該領域中最受尊敬的三位專家撰寫。

本書詳細介紹了當今數據集成技術的理論和概念,並通過具體示例提供了詳細的應用指導,以解釋這些概念。數據集成是解答跨多個數據源(例如數據庫、網頁)的查詢的問題。數據集成問題在多個情境中出現,包括企業信息集成、網絡上的查詢處理、政府機構之間的協調以及科學家之間的合作。在某些情況下,數據集成是在某一領域取得進展的關鍵瓶頸。

作者提供了數據集成概念和技術的實用知識,為您提供開發完整且簡潔的算法和應用程序所需的工具。

目錄

第1章:引言

第I部分:基礎數據集成技術

第2章:操作查詢表達式

第3章:描述數據源

第4章:字符串匹配

第5章:模式匹配和映射

第6章:通用模式操作符

第7章:數據匹配

第8章:查詢處理

第9章:包裝器

第10章:數據倉庫和緩存

第II部分:擴展數據表示的集成

第11章:XML

第12章:本體論和知識表示

第13章:將不確定性納入數據集成

第14章:數據來源

第III部分:新穎的集成架構

第15章:網絡上的數據集成

第16章:關鍵字搜索:按需集成

第17章:點對點集成

第18章:支持協作的集成

第19章:數據集成的未來