Apache NiFi|讓你輕鬆建立 Data Pipeline
蘇揮原
- 出版商: 碁峰資訊
- 出版日期: 2023-03-24
- 定價: $580
- 售價: 7.9 折 $458
- 語言: 繁體中文
- 頁數: 264
- 裝訂: 平裝
- ISBN: 626324416X
- ISBN-13: 9786263244160
-
相關分類:
Message Queue
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
Kafka 技術手冊|即時資料與串流處理 (Kafka: The Definitive Guide)$580$458 -
$505Hadoop + Spark + Python 大數據處理從算法到實戰 -
Mike Cohn 的使用者故事:敏捷軟體開發應用之道 (User Stories Applied : For Agile Software Development)$600$468 -
Kettle 構建 Hadoop ETL 系統實踐$474$450 -
深入剖析 Kubernetes$560$420 -
會動的演算法:61 個演算法動畫+全圖解逐步拆解,人工智慧、資料分析必備$620$490 -
你就是不寫測試才會沒時間:Kuma 的單元測試實戰 -- Java篇(iThome鐵人賽系列書)$650$507 -
Kubernetes 建置與執行 : 邁向基礎設施的未來, 3/e (Kubernetes: Up and Running: Dive Into the Future of Infrastructure, 3/e)$580$458 -
嵌入式金融大衝擊!:從 Google、Apple,到 IKEA、賓士,科技巨擘與零售龍頭都爭先布局的創新金融版圖$390$332 -
資料科學基礎數學 (Essential Math for Data Science)$680$537 -
軟體測試實務 : 業界成功案例與高效實踐 [ I ]$650$507 -
Spark分佈式處理實戰$299$284 -
決戰!微前端架構 Micro Frontends:新一代可擴展的網頁開發模式,實現各種框架的無縫整合與溝通$820$648 -
$658Flink SQL 與 DataStream:入門、進階與實戰 -
CI/CD 安全防護大揭密:DevSecOps 最佳實踐指南$680$530 -
快速精通 iOS 17 程式設計:從零開始活用 Swift 與 SwiftUI 開發技巧$760$593 -
創新驅動設計:單體與微服務混合架構策略與實踐$690$656 -
LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具$680$537 -
前端測試指南:策略與實踐$650$507 -
OpenTelemetry 入門指南:建立全面可觀測性架構(iThome鐵人賽系列書)【軟精裝】$750$585 -
深入理解 Prometheus 監控系統$479$455 -
SRE 工作現場直擊!:維運起點 x 實戰經驗 x 職涯規劃面面觀(iThome鐵人賽系列書)$600$468 -
可觀測性入門指南:Logs、Metrics、Traces 三大實戰應用,用 24個 Lab 鞏固你的 SRE 技能樹 (iThome鐵人賽系列書)$680$530 -
SRE 實踐手冊 : 軟件組織如何規模化實施站點可靠性工程$768$730 -
Python 原力爆擊:OpenAI / Gemini / AWS / Ollama 生成式 AI 應用新手指南$650$507
商品描述
‧精簡的設定和範例介紹,快速掌握Apache NiFi核心精髓
‧整合當今主流的資料工程架構與相關服務說明
‧掌握資料流設計的特性與重點,踏出資料工程第一步
本書介紹Apache NiFi這套服務工具,讀者可以於該服務設計自動化處理資料流(Data Pipeline)。所有的設計與設定都是以No Code與WEB UI方式處理,具備強大的操作互動性和易用性。另外支援大多數的資料載體,如:Relational Database、Document DB、Column-Based、DataWarehouse 、Message Queue等對接處理,並支援目前主流的三大雲平台-AWS(Amazon Web Service)、GCP(Google Cloud Platform)和Microsoft Azure,涵蓋大部分企業使用到的應用與服務,都可透過Apache NiFi做到一站式整合與資料流設計,確保資料處理邏輯以及流入和流出的方向和目的地。同時在面對大量資料處理時也可以運用高擴展的特性來平行執行,也能更細節地去追蹤資料的變化與狀態,最後做到完整的流程與錯誤控制以避免產生資料遺漏的窘境。
本書會介紹當今在資料工程常見的架構,接著介紹Apache NiFi的架構與元件、建置流程與設定、操作方式、與外部服務的整合和應用、資料追蹤等各個資料工程常見的應用處理。最後會提及資料工程領域的發展和重點分析,讓對於這塊領域較陌生或有興趣的讀者們,除了可以在本書學到Apache NiFi的核心價值之外,也能意識到該領域的後續發展與重點,給予讀者具體方向進行未來的發展和準備。
作者簡介
蘇揮原 Mars Su
畢業於國立臺灣科技大學資管所,目前於趨勢科技(TrendMicro)擔任Staff Data Engineer,參與過Streaming Data Pipeline架構設計與開發,以及NLP應用處理,熱衷於資料工程和機器學習等領域的研究與探索。
過往曾獲得iTHome 2021鐵人賽AI&Data組冠軍以及擔任過PyCon APAC 2022講者。
目錄大綱
第1章 Data Pipeline 的重要性
1.1 何謂 Data Pipeline?
1.2 何謂 Streaming 和 Batch?
1.3 何謂 Lambda、Kappa 和 Delta 架構?
1.4 為什麼需要使用 Apache NiFi?
1.5 小結
第2章 Apache NiFi 的架構與建置
2.1 Apache NiFi 架構與規格
2.2 Apache NiFi Data Flow 的版控 - NiFi Registry
2.3 如何建置 Apache NiFi & NiFi Registry
2.4 小結
第3章 Apache NiFi Componenet 介紹
3.1 FlowFile 的概念與操作
3.2 Processor 的概念與操作
3.3 Connection 的概念與操作
3.4 Processor Group 的概念與操作
3.5 Controller Service 的概念與操作
3.6 Templates、Label 和 Funnel 的概念與操作
3.7 NiFi Registry 的概念與操作
3.8 小結
第4章 Apache NiFi 的語法
4.1 Variables 和 Parameters 的範圍與差異
4.2 何謂 NiFi Expression Language?
4.3 小結
第5章 Apache NiFi 和 DB 對接與實務
5.1 何謂 RDB 和 DocumentDB?
5.2 如何對 MySQL 對接與操作?
5.3 如何與 MongoDB 對接與操作?
5.4 小結
第6章 Apache NiFi 和 Message Queue 對接與實務
6.1 什麼是 Message Queue?
6.2 什麼是 Apache Kafka?
6.3 如何對 Apache Kafka 對接與操作?
6.4 小結
第7章 Apache NiFi 和 Cloud 對接與實務
7.1 如何串接 AWS 服務?
7.2 如何串接 GCP 服務?
7.3 小結
第8章 Apache NiFi 監控與追蹤邏輯
8.1 訂定適當的監控指標
8.2 Apache NiFi 的 Reporting Task 和整合應用
8.3 Apache NiFi 的基本偵錯 Alert 機制
8.4 小結
第9章 資料工程的重要性與未來
9.1 資料工程是什麼?為何重要?
9.2 未來資料工程的變化與趨勢









