數據倉庫, 4/e (Building the Data Warehouse, 4/e)

W. H. Inmon 王志海等譯

買這商品的人也買了...

商品描述

《數據倉庫(原書第4版)》詳盡地講述了數據倉庫的基本概念、基本原理,
以及建立數據倉庫的方法和過程。
主要內容包括:決策支持系統的發展、數據倉庫環境結構、數據倉庫設計、
數據倉庫粒度劃分、數據倉庫技術、分佈式數據倉庫、EIS系統和數據倉庫的關係、
外部和非結構化數據與數據倉庫的關係、數據裝載問題、
數據倉庫與Web、ERP與數據倉庫以及數據倉庫的複查要目。

《數據倉庫(原書第4版)》是數據倉庫的創始人撰寫的關於數據倉庫的著作,
這個新版本收錄了該領域的經典理論和前沿發展。
本書既可以作為相關專業的研究生教材,也是數據倉庫的研究、開發和管理人員的必備指南。

作者簡介

王志海

博士,特聘教授。
1985年畢業於鄭州大學計算機科學系,獲理學學士學位,
1987年畢業於哈爾濱船舶工程學院計算機與信息科學系,獲工學碩士學位,
1998年畢業於合肥工業大學計算機與信息學院,獲博士學位。
先後在澳大利亞Monash大學計算機科學與軟件工程學院進行博士後研究工作,
Deakin大學信息技術學院任研究員,Monash大學計算機科學與軟件工程學院任高級研究員。
曾任中國計算機學會人工智能與模式識別專業委員會委員,
中國人工智能學會機器學習委員會委員,
2003年國際軟件工程大會數據挖掘技術在軟件工程中應用研討會
(:DMSE'2003,uSA)等程序委員會委員,
2004~2007年曆屆亞太數據庫知識發現與數據挖掘會議(PAKDD)程序委員會委員,
2005年中國分類技術及其應用研討會程序委員會委員等。
在國際學術刊物,國際學術會議和國內學術刊物上發表論文約30多篇。

目錄大綱

專家指導委員會
譯者序
第2版前言
第3版前言
第4版前言

第1章決策支持系統的發展
1.1演化
1.1.1直接存取存儲設備的出現
1.1.2個人計算機/第四代編程語言技術
1.1.3進入抽取程序
1.1.4蜘蛛網
1.2.自然演化式體系結構的問題
1.2.1數據缺乏可信性
1.2.2生產率問題
1.2.3從數據到信息
1.2.4方法的變遷
1.2.5體系結構化環境
1.2.6體系結構化環境中的數據集成
1.2.7用戶是誰
1.3開發生命週期
1.4硬件利用模式
1.5為重建工程創造條件
1.6監控數據倉庫環境
1. 7小結

第2章數據倉庫環境
2.1數據倉庫的結構
2.2面向主題
2.3第1天到第n天的現象
2.4粒度
2.4.1粒度帶來的好處
2.4. 2粒度的一個例子
2.4.3雙重粒度
2.5探查與數據挖掘
2.6活樣本數據庫
2.7分區設計方法
2.8數據倉庫中的數據組織
2.9審計與數據倉庫
2.10數據的同構/異構
2.11數據倉庫中的數據清理
2.12報表與體系結構化環境
2.13各種環境中的操作型窗口
2.14數據倉庫中的錯誤數據
2.15小結

第3章設計數據倉庫
3.1從操作型數據開始
3.2數據/過程模型與體系結構化環境
3.3數據倉庫與數據模型
3.3.1數據倉庫的數據模型
3.3.2中間層數據模型
3.3.3物理數據模型
3.4數據模型與迭代式開發
3.5規範化/反向規範化
3.6元數據
3.7數據周期——時間間隔
3.8轉換和集成的複雜性
3.9數據倉庫記錄的觸發
3.9.1事件
3.9.2快照的構成
3.9.3一些例子
3.10概要記錄
3.11管理大量數據
3.12創建多個概要記錄
3.13從數據倉庫環境到操作型環境
3.14數據倉庫數據的直接操作型訪問
3.15數據倉庫數據的間接訪問
3.15.1航空公司的佣金計算系統
3.15.2零售個性化系統
3.15.3信用審核
3.16數據倉庫數據的間接使用
3.17星形連接
3.18支持操作型數據存儲
3.19需求和Zachman框架
3.20小結

第4章數據倉庫中的粒度
4.1粗略估算
4.2規劃過程的輸入
4.3溢出存儲器中的數據
4.4確定粒度級別
4.5一些反饋循環技巧
4.6確定粒度級別的幾個例子
4.6.1銀行環境中的粒度級別
4.6. 2製造業環境中的粒度級別
4.6.3保險業環境中的粒度級別
4.7填充數據集市
4.8小結

第5章數據倉庫和技術
5.1管理大量數據
5.2管理多種介質
5.3索引和監控數據
5.4多種技術的接口
5.5程序員/設計者對數據存放位置的控制
5.6數據的並行存儲和管理
5.7語言接口
5.8數據的有效裝載
5.9有效利用索引
5.10數據壓縮
5.11複合主鍵
5.12變長數據
5.13加鎖管理
5.14只涉及索引的處理
5.15快速恢復
5.16其他的技術特徵
5.17 DBMS類型和數據倉庫
5.18改變DBMS技術
5.19多維DBMS和數據倉庫
5.20在多種存儲介質上構建數據倉庫
5.21數據倉庫環境中元數據的角色
5.22上下文和內容
5.22.1上下文信息的三種類型
5.22.2捕獲和管理上下文信息
5.22.3回顧上下文信息管理歷史
5.23刷新數據倉庫
5.24測試問題
5.25小結

第6章分佈式數據倉庫
6.1分佈式數據倉庫的類型
6.1.1局部數據倉庫和全局數據倉庫
6.1.2技術分佈式數據倉庫
6.1.3獨立開發的分佈式數據倉庫
6.2開發項目的本質特徵
6.3分佈式數據倉庫的開發
6.3.1在分佈的地理位置間協調開發
6.3.2企業數據的分佈式模型
6.3.3分佈式數據倉庫中的元數據
6.4在多種層次上構建數據倉庫
6.5多個小組建立當前細節級
6.5.1不同層的不同需求
6.5.2其他類型的細節數據
6.5.3元數據
6 .6公共細節數據採用多種平台
6.7小結

第7章主管信息系統和數據倉庫
7.1 EIS概述
7.2一個簡單例子
7.3向下鑽取分析
7.4支持向下鑽取處理
7.5作為EIS基礎的數據倉庫
7.6到哪裡取數據
7.7事件映射
7.8細節數據和EIS
7.9在EIS扣只保存匯總數據
7.10小結

第8章外部數據與數據倉庫
8.1數據倉庫中的外部數據
8.2元數據和外部數據
8.3存儲外部數據
8.4外部數據的不同部件
8.5建模與外部數據
8.6輔助報告
8.7外部數據存檔
8.8內部數據與外部數據的比較
8.9小結

第9章遷移到體系結構化環境
9.1一種遷移方案
9.2反饋循環
9.3策略方面的考慮
9.4方法和遷移
9.5數據驅動的開發方法
9.5.1概念
9.5.2系統開發生命週期
9.5.3智者觀點
9.6小結

第10章數據倉庫和Web
10.1支持電子商務環境
10.2將數據從Web移動到數據倉庫
10.3將數據從數據倉庫移動到Web
10.4對Web的支持
10. 5小結

第11章非結構化數據和數據倉庫
11.1兩個領域的集成
11.1.1文本——公共聯接
11.1.2基本錯誤匹配
11.1.3環境間文本匹配
11.1.4概率匹配
11.1.5匹配所有信息
11.2主題匹配
11.2.1產業特徵主題
11.2.2自然事件主題
11.2.3通過主題和主題詞關聯
11.2.4通過抽象和元數據關聯
11.3兩層數據倉庫
11.3.1非結構化數據倉庫分類
11.3.2非結構化數據倉庫中的文檔
11.3.3非結構化數據可視化
11.4自組織圖(SOM)
11.4.1非結構化數據倉庫
11.4.2數據量和非結構化數據倉庫
11.5適用於兩個環境
11.6小結

第12章大型數據倉庫
12.1快速增長的原因
12.2龐大數據量的影響
12.2.1基本數據管理活動
12.2.2存儲費用
12.2.3實際存儲費用
12.2.4大型數據量中的數據使用模式
12.2. 5一個簡單計算
12.2.6兩類數據
12.2.7數據分類涉及的問題
12.3數據在不同介質的存儲
12.3.1近線存儲
12.3.2訪問速度和磁盤存儲
12.3.3存檔存儲
12.3.4透明的意義
12.4環境間數據轉移
12.4.1 CMSM方法
12.4 .2數據倉庫使用監控器
12.4.3不同存儲介質下數據倉庫的擴展
12.5數據倉庫轉換
12.6總費用
12.7最大容量
12.8小結

第13章關係模型和多維模型數據庫設計基礎
13.1關係模型
13.2多維模型
13.3雪花結構
13.4兩種模型的區別
13.4.1區別的起源
13.4.2重建關係型數據
13.4.3數據的直接訪問和間接訪問
13.4.4支持將來未知的需求
13.4.5支持適度變化的需求
13.5獨立數據集市
13.6建立獨立數據集市
13.7小結

第14章數據倉庫高級話題
14 .1最終用戶的需求和數據倉庫
14.1.1數據倉庫和數據模型
14.1.2關係型的基礎
14.1.3數據倉庫和統計處理
14.2數據倉庫內的資源競爭
14.2 .1探查型數據倉庫
14.2.2數據挖掘型數據倉庫
14.2.3凍結探查型數據倉庫
14.2.4外部數據和探查型數據倉庫
14.3同一個處理器處理數據集市和數據倉庫
14.4數據的生命週期
14.5測試和數據倉庫
14.6追踪數據倉庫中的數據流
14.6.1數據倉庫中的數據速率
14.6.2 “推”和“拉”數據
14.7數據倉庫和基於網絡的電子商務環境
14.7.1兩種環境之間的界面
14.7.2粒度管理器
14.7.3概要記錄
14.7.4 ODS,概要記錄以及性能
14.8財務數據倉庫
14.9記錄系統
14.10結構體系的概要歷史——演化為公司信息工廠
14.10.1 CIF的進化
14.10.2障礙
14.11 CIF的未來
14.11.1分析
14.11. 2 ERP/SAP
14.11.3非結構化數據
14.11.4數據量
14.12小結

第15章數據倉庫的成本論證和投資回報
15.1應對競爭
15.2宏觀上的成本論證
15. 3微觀上的成本論證
15.4來自遺留環境的信息
15.4.1新信息的成本
15.4.2用數據倉庫收集信息
15.4.3成本比較
15.4.4建立數據倉庫
15.4.5完整的情況圖
15.4.6得到數據的障礙
15.5數據的時間價值
15.6集成的信息
15.6.1歷史數據的價值
15.6.2歷史數據和客戶關係模型
15.1小結

第16章數據倉庫和ODS
16.1互補的結構
16.1.1 ODS中的升級
16.1.2歷史數據與ODS
16.1.3概要記錄
16.2不同種類的ODS
16.3數據庫設計——一種混合的方式
16.4按比例畫圖
16.5 ODS中的事務集成
16.6對ODS處理日進行分片
16.7多個ODS
16.8 ODS和網絡環境
16.9 ODS的一個例子
16.10小結

第17章企業信息依從準則和數據倉庫.
17.1兩個基本行為
17.2財務依從準則
17.2.1 “是什麼”
17.2.2 “為什麼”
17.3審計公司的交流信息
17.4小結

第18章最終用戶社區
18. 1農民
18.2探險者
18.3礦工
18.4旅行者
18.5整個社區
18.6不同的數據類型
18.7成本論證和ROI分析
18.8小結

第19章數據倉庫設計的複查要目
19. 1何時進行設計複查
19.2誰負責設計複查
19.3有哪些議事日程
19.4結果
19.5複查管理
19.6典型的數據倉庫設計複查
19.7小結
術語表
參考文獻