數據湖架構 Data Lake Architecture: Designing the Data Lake and Avoiding the Garbage Dump
恩門 (Bill Inmon)
- 出版商: 人民郵電
- 出版日期: 2017-05-01
- 定價: $294
- 售價: 7.9 折 $232
- 語言: 簡體中文
- 頁數: 145
- 裝訂: 平裝
- ISBN: 7115451737
- ISBN-13: 9787115451736
-
相關分類:
大數據 Big-data
- 此書翻譯自: Data Lake Architecture: Designing the Data Lake and Avoiding the Garbage Dump
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
Beyond Legacy Code: Nine Practices to Extend the Life (and Value) of Your Software (Paperback)$1,500$1,425 -
$534Spring 實戰, 4/e (Spring in Action, 4/e) -
$474程序員代碼面試指南:IT名企算法與數據結構題目最優解 -
$414數據架構:大數據、數據倉庫以及 Data Vault -
$348軟件安全開發:屬性驅動模式 -
$374實用機器學習 (Practical Machine Learning) -
ASP.NET Core 跨平臺開發從入門到實戰$390$371 -
Effective SQL 中文版 | 寫出良好 SQL 的 61個具體做法 (Effective SQL : 61 Specific Ways to Write Better SQL)$450$356 -
資料結構 -- 使用 Python$520$411 -
白話大數據與機器學習$480$379 -
寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)$390$308 -
精實 UX 設計|帶領敏捷團隊打造出色的產品, 2/e (Lean UX: Designing Great Products with Agile Teams, 2/e)$450$356 -
實戰聊天機器人 Bot 開發|使用 Node.js (Building Bots with Node.js)$380$323 -
$352實用機器學習 (Real-world Machine Learning) -
$354機器學習Web應用 -
$474Oracle高性能自動化運維 (High-performance and Automated Operation for Oracle) -
$469企業數據湖 -
$301Cloudera Hadoop 大數據平臺實戰指南 -
$297Spark 海量數據處理 : 技術詳解與平臺實戰 -
雲原生數據中臺:架構、方法論與實踐$594$564 -
人工智慧最後的祕密:權力、政治、人類的代價,科技產業和國家機器如何聯手打造AI神話?$499$394 -
PB 硬碟時代必備技法 -- 精解檔案系統技術及應用$780$616 -
數據網格|大規模提供資料驅動價值 (Data Mesh: Delivering Data-Driven Value at Scale)$680$537 -
跟 NVIDIA 學深度學習!從基本神經網路到 ......、GPT、BERT...,紮穩機器視覺與大型語言模型 (LLM) 的建模基礎$880$748 -
LLM 大型語言模型的絕世祕笈:27路獨步劍法,帶你闖蕩生成式 AI 的五湖四海 (iThome鐵人賽系列書)$650$507
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
隨著大數據的蓬勃發展,不少機構開始將源源不斷的數據流導入到一個叫“數據湖”的設備中去。
數據湖架構 是“數據倉庫”之父撰寫的全新著作,是幫助讀者認識數據湖架構,並把數據湖打造成公司資產的指導手冊。數據湖架構 共15章,分別涉及數據湖簡介、數據池據湖內部結構、數據池及其結構、各種類型的數據池等技術話題,目的在於講解如何構建有用的數據湖,以便數據科學家和數據分析師能夠解決商業挑戰並找出新的商業機會。
數據湖架構 適合數據管理者、學生、系統開發人員、架構師、程序員以及zui終用戶閱讀。
目錄大綱
第1章數據的湖泊1
1.1大數據來了1
1.2數據湖來了2
1.3 “單向”的數據湖3
1.4小結6
第2章改造數據湖7
2.1元數據7
2.2整合圖譜8
2.3數據科學家11
2.4通用性12
2.5小結13
第3章數據湖內部14
3.1模擬信號數據15
3.2應用程序數據17
3.3文本數據18
3.4另一個視角20
3.5小結21
第4章數據池22
4.1數據修整23
4.2初始數據池23
4.3模擬信號數據池24
4.4應用程序數據池25
4.5文本數據池25
4.6將數據直接傳入數據池26
4.7歸檔數據池26
4.8小結27
第5章數據池的通用結構28
5.1數據池描述29
5.2數據池目標30
5.3數據池數據30
5.4數據池元數據31
5.5數據池元過程32
5.6數據轉換標準33
5.7小結34
第6章模擬信號數據池35
6.1模擬信號數據問題35
6.2數據描述36
6.3捕獲初始數據、轉換初始數據37
6.4轉換/調整初始模擬信號數據38
6.5數據切除40
6.6聚類數據41
6.7數據關係42
6.8未來使用的可能性44
6.9 異常值45
6.10臨時性的特定分析47
6.11小結47
第7章應用程序數據池49
7.1數據的基因49
7.2數據描述50
7.3標準數據庫格式51
7.4數據的基本組織52
7.5數據的整合52
7.6數據模型53
7.6整合的必要性54
7.7從一個應用指向到下一個應用56
7.8交並應用57
7.9應用程序數據池內的數據子集58
7.10小結58
第8章文本數據池60
8.1文本消歧62
8.2傳入數據池的文本62
8.3文本消歧的輸出63
8.4固有的複雜性64
8.5文本消歧的功能66
8.6分類與本體66
8.7文本與語境的價值68
8.8對文本追根溯源69
8.9消歧的機制69
8.10分析數據庫70
8.11將結果可視化71
8.12小結73
第9章數據池間的對比74
9.1數據池的相似性74
9.2數據池間的差異性75
9.3數據最終狀態的關係型格式75
9.4技術間差異76
9.5數據池中數據的總預期容量76
9.6數據池間的數據移動77
9.7在多個數據池進行分析78
9.8使用元數據來關聯不同 數據池內的數據78
9.9假如…… 79
9.10小結80
第10章利用基礎架構82
10.1 “單向”數據湖83
10.2改造數據湖83
10.3轉換技術84
10.4一些分析問題84
10.5查詢文本數據87
10.6真實的分析88
10.7小結89
第11章搜索與分析90
11.1供應商所散佈的困惑95
11.2小結96
第12章數據池中的業務價值97
12.1模擬信號數據池中的業務價值97
12.2應用程序數據池中的業務價值99
12.3文本數據池中的業務價值100
12.4記錄中的業務價值比例101
12.5小結102
第13章一些額外話題104
13.1高層系統級別文檔104
13.2詳細的數據池級別文檔105
13.3什麼樣的數據會流入數據湖/數據池105
13.4分析在何處發生107
13.5數據的年齡110
13.6數據的安全110
13.7小結111
第14章分析與整合工具112
14.1可視化112
14.2搜索與修正113
14.3文本消歧114
14.4統計分析114
14.5經典的ETL處理115
14.6小結116
第15章歸檔數據池117
15.1數據的移 標準118
15.2結構性改動118
15.3小結119
術語表120
參考資料124
