數據星河(構建現代化數據倉庫之路)

程志遠 左巖 翟文麟

  • 出版商: 清華大學
  • 出版日期: 2025-05-01
  • 售價: $354
  • 語言: 簡體中文
  • 頁數: 216
  • ISBN: 7302686661
  • ISBN-13: 9787302686668
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書以數據倉庫建設內 容為主線,以理論基礎為核 心,引導讀者漸進式地學習 數據倉庫建設版圖中所需知 識。通過認識數據基建、數 據質量、數據安全、實時技 術、數據治理、數據資產、 數據服務、數據應用等8個 模塊及常見項目,使讀者能 夠瞭解日常數據倉庫開發流 程及數據倉庫工作的具體內 容,從而快速上手數據倉庫 建設工作。 本書共14章,分為基礎 篇、基建篇、應用篇、評價 篇、展望篇。基礎篇( 章和第2章)介紹數據倉庫 框架和數據倉庫模型建設知 識點;基建篇(第3~8章) 詳細講述數據倉庫中每個板 塊建設,由淺入深地剖析搭 建背景及搭建中的細節;應 用篇(第9~11章)通過實 戰講解,快速上手數據倉庫 常見項目;評價篇( 2章 和 3章)結合數據倉庫基 建和項目,闡述完整數據倉 庫需要具備的條件,並補充 評價體系指標;展望篇(第 14章)結合當前AIGC應用 衍生出數據倉庫未來發展探 索。本書示例代碼豐富,實 用性和系統性較強,助力讀 者透徹理解書中的重點、難 點。 本書適合初學者入門, 也適合工作多年的數據倉庫 開發者借鑒學習,還可作為 高等院校和培訓機構相關專 業的教學參考書。

目錄大綱

基礎篇
第1章 認識數據倉庫
1.1 大數據在如今社會中的運用
1.2 大數據相關崗位介紹
1.2.1 數據倉庫崗位介紹
1.2.2 數據平臺崗位介紹
1.2.3 數據分析崗位介紹
1.2.4 數據產品崗位介紹
1.2.5 數據挖掘崗位介紹
1.3 大數據在企業中的組織架構
1.3.1 數據中台
1.3.2 業務線數據
1.4 數據倉庫崗在大數據生態中的定位
1.4.1 數據倉庫概念
1.4.2 數據倉庫定位
1.5 數據倉庫發展史
1.5.1 數倉1.0傳統數據倉庫時代
1.5.2 數倉2.0Hadoop生態時代
1.5.3 數倉3.0雲端及數據平臺時代
1.5.4 數倉4.0湖倉一體時代
1.6 數據倉庫建設內容簡介
1.6.1 數據倉庫建設版圖
1.6.2 數據基建簡介
1.6.3 數據資產簡介
1.6.4 數據服務簡介
1.6.5 數據應用簡介
1.7 數據倉庫架構介紹
1.7.1 Lambda架構
1.7.2 HSAP架構
1.7.3 流批一體架構
1.7.4 Doris架構
1.8 數據倉庫所使用的技術棧
第2章 數據倉庫模型建設
2.1 OLTP與OLAP
2.1.1 什麽是OLTP
2.1.2 什麽是OLAP
2.1.3 OLTP與OLAP的區別
2.2 數據倉庫分層
2.2.1 數據倉庫分層原理
2.2.2 數據倉庫分層內容
2.3 數據倉庫模型介紹
2.4 數據倉庫模型建設方法
2.4.1 三範式建模與維度建模介紹
2.4.2 三範式建模與維度建模區別
2.5 數據模型建設的具體流程
2.5.1 數據模型設計的基本原則
2.5.2 數據模型設計過程
2.5.3 數據模型建設五要素
2.6 數據域與主題域
2.7 事實表設計
2.7.1 事實表類型
2.7.2 三類事實表區別
2.7.3 全量和增量