數字化轉型實踐:構建雲原生大數據平臺
金鑫,武帥
- 出版商: 電子工業
- 出版日期: 2022-08-01
- 定價: $654
- 售價: 7.9 折 $517
- 語言: 簡體中文
- 頁數: 332
- ISBN: 7121440067
- ISBN-13: 9787121440069
-
相關分類:
大數據 Big-data
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
資料視覺化|使用 Python 與 JavaScript (Data Visualization with Python and JavaScript: Scrape, Clean, Explore & Transform Your Data)$680$537 -
STP 行銷策略之 Python 商業應用實戰|網路爬蟲 x 機器學習 x 數據分析$520$411 -
JavaScript 第一次學就上手$550$435 -
跟著 Docker 隊長,修練 22天就精通 - 搭配 20小時作者線上教學,無縫接軌 Microservices、Cloud-native、Serverless、DevOps 開發架構$880$695 -
Python 網路爬蟲:大數據擷取、清洗、儲存與分析 -- 王者歸來, 2/e$750$593 -
銷售 AI 化!看資料科學家如何思考, 用 Python 打造能賺錢的機器學習模型$620$527 -
集成式學習:Python 實踐!整合全部技術,打造最強模型 (Hands-On Ensemble Learning with Python: Build highly optimized ensemble machine learning models using scikit-learn and Keras)$750$638 -
$327智能製造:AI落地製造業之道 -
深入剖析 Kubernetes$560$476 -
Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模,數據工程一次搞定!$680$537 -
品質管理-品管大數據應用$480$470 -
Python 大數據特訓班:資料自動化收集、整理、清洗、儲存、分析與應用實戰, 3/e (附320分鐘影音/範例程式)$520$411 -
Notion 打造你的高效數位人生 -- 王者歸來$500$395 -
Apache NiFi|讓你輕鬆建立 Data Pipeline$580$458 -
親密的駭人 – 堅固網路安全建設從內網開始$880$695 -
客戶留存數據分析與預測$768$730 -
Apache Spark大數據分析:基於Azure Databricks雲平臺$479$455 -
DevOps Handbook |打造世界級技術組織的實踐指南, 2/e (中文版) (The Devops Handbook: How to Create World-Class Agility, Reliability, & Security in Technology Organizations, 2/e)$650$514 -
SRE 實踐與開發平台指南:從團隊協作、原則、架構和趨勢掌握全局,做出精準決策$620$484 -
SQL Server 管理實戰 (適用 SQL Server 2022/2019)$800$632 -
Python 大數據專案 X 工程 X 產品 資料工程師的升級攻略, 2/e$780$616 -
專業 SCRUM:基於 Azure DevOps 的敏捷實踐$774$735 -
$505數據治理實踐者手記 -
$417大模型應用開發:RAG 入門與實戰 -
$659基於大模型的 RAG 應用開發與優化 — 構建企業級 LLM 應用
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
21 世紀,因特網行業的爆發開啟了全球數據量急劇增長的新時代,數據已經成為驅動企業數字化轉型的核心力量。整個數據行業的技術能力不斷提升,從數據庫到數據倉庫,再到開源大數據,都在經濟社會中發揮著極其重要的作用。近年來,新興數據技術與雲計算相互輔助,共同發展,誕生了一系列雲原生數據服務,讓企業能夠突破傳統模式的局限,專註於業務,降本增效。本書以全球前沿的雲原生服務為基礎,詳細展現瞭如何將數據存儲、數據引入、批量數據處理、實時數據處理、數據倉庫、數據可視化和機器學習等核心要素綜合起來,逐步構建一個高效的大數據服務平臺。
目錄大綱
第1章 數字化轉型與數據技術 001
1.1 數字化轉型 002
1.2 基於數據進行數字化轉型 004
1.3 數據倉庫 006
1.4 大數據 009
1.5 數據湖 013
1.6 雲計算中數據技術的演進 016
1.7 本書目標 018
第2章 數據存儲 019
2.1 數據存儲的發展與趨勢 020
2.1.1 集中式文件系統 020
2.1.2 網絡文件系統 021
2.1.3 分佈式文件系統 022
2.1.4 雲原生存儲 024
2.2 Azure Blob對象存儲 025
2.2.1 數據冗餘策略 027
2.2.2 分層存儲 030
2.2.3 兼容HDFS的WASB文件系統 031
2.3 創建存儲賬號 033
2.3.1 訂閱 033
2.3.2 資源組 034
2.3.3 存儲賬號 036
2.4 Azure數據湖存儲 039
2.4.1 分層命名空間 039
2.4.2 兼容HDFS的ABFS文件系統 040
2.5 創建數據湖存儲 043
2.6 基於HDFS訪問數據湖存儲 045
2.7 在HDInsight中訪問數據湖存儲 058
2.8 本章小結 064
第3章 數據引入 065
3.1 什麼是數據引入 066
3.2 數據引入面臨的挑戰 067
3.3 數據引入工具 069
3.4 數據工廠 071
3.4.1 什麼是數據工廠 071
3.4.2 創建數據工廠 072
3.4.3 數據工廠的主要組件 076
3.5 引入數據 084
3.5.1 數據復制 084
3.5.2 管道設計 088
3.5.3 參數化 098
3.5.4 監控 100
3.6 本章小結 102
第4章 批量數據處理 103
4.1 數據處理概述 104
4.2 數據處理引擎 105
4.2.1 MapReduce 105
4.2.2 Spark 107
4.3 Databricks 111
4.4 使用Databricks處理批量數據 115
4.5 Databricks的特性 121
4.5.1 依賴庫管理 121
4.5.2 Databricks文件系統(DBFS) 124
4.5.3 密鑰管理 126
4.5.4 Delta Lake 129
4.6 使用數據工廠處理批量數據 134
4.6.1 設計Data Flow 134
4.6.2 Data Flow的設計模式 144
4.6.3 如何選擇Data Flow與Databricks 145
4.7 本章小結 146
第5章 實時數據處理 147
5.1 什麼是實時數據處理 148
5.2 消息隊列 149
5.3 Kafka的使用 153
5.3.1 創建虛擬網絡 153
5.3.2 創建Kafka集群 155
5.3.3 配置IP advertising 157
5.3.4 生產者發送數據 159
5.4 實時數據處理引擎 166
5.5 使用Spark Structured Streaming處理實時數據 171
5.5.1 連通Kafka與Databricks 171
5.5.2 在Databricks中處理數據 174
5.5.3 使用Cosmos DB保存數據 176
5.6 Event Hub 182
5.7 本章小結 190
第6章 數據倉庫 191
6.1 什麼是數據倉庫 192
6.2 雲原生數據倉庫 194
6.3 Synapse Analytics 199
6.3.1 什麼是Synapse Analytics 199
6.3.2 Synapse SQL的架構 200
6.3.3 創建Synapse工作區 208
6.3.4 創建SQL池 210
6.3.5 連接SQL池 212
6.4 數據加載 214
6.4.1 數據加載方式 214
6.4.2 使用COPY導入數據 220
6.5 Synapse SQL的資源和負荷管理 227
6.5.1 資源類 227
6.5.2 並發槽 229
6.5.3 最大並發查詢數 231
6.5.4 工作負荷組 232
6.5.5 工作負荷分類器 239
6.6 數據倉庫發展趨勢 242
6.6.1 挑戰 242
6.6.2 趨勢 244
6.7 Synapse Analytics的高級特性 245
6.7.1 Synapse 工作室 246
6.7.2 數據中心 247
6.7.3 無服務器SQL池 248
6.7.4 托管Spark 252
6.8 本章小結 257
第7章 數據可視化 258
7.1 數據可視化概述 259
7.2 數據可視化工具 260
7.3 Power BI 263
7.3.1 什麼是Power BI 263
7.3.2 Power BI的構件 265
7.3.3 使用Power BI Desktop 268
7.3.4 使用Power BI服務 281
7.4 本章小結 285
第8章 機器學習 286
8.1 機器學習概述 287
8.1.1 算法類型 287
8.1.2 業務場景 290
8.2 機器學習的流程 291
8.3 機器學習的挑戰與雲原生平臺的優勢 293
8.4 雲原生機器學習平臺 296
8.4.1 創建工作區 297
8.4.2 創建數據存儲庫 298
8.4.3 創建數據集 301
8.4.4 創建計算資源 303
8.5 機器學習設計器 305
8.6 自動化機器學習 310
8.7 本章小結 315
參考文獻 316
