Kafka 技術手冊|即時資料與串流處理 (Kafka: The Definitive Guide)

Gwen Shapira, Neha Narkhede, Todd Palino 許致軒、蔡政廷、李尚

立即出貨 (庫存 > 10)

買這商品的人也買了...

相關主題

商品描述

每個企業應用都在創造資料,包括日誌紀錄、指標、使用者行為、聊天訊息等各種形式的資料。如何移動這些資料本身已經變得幾乎跟資料本身一樣重要。如果您是應用架構師、開發人員或產品工程師並且剛開始使用Apache Kafka,這本實務指南將協助您從新手成為專家,並能熟練地應用此串流平台處理即時資料。

來自Confluent與LinkedIn負責開發Kafka的工程師為您說明如何部署Kafka叢集生產環境、撰寫可靠的事件驅動微服務,以及藉由此平台打造具延展性的串流處理應用。透過詳細的範例,您將了解Kafka的設計原則、可靠度保證、關鍵API以及許多架構細節,包含副本協定、控制者與儲存層等。

.了解發佈/訂閱訊息機制與如何將其融入大數據生態系中
.探索藉由Kafka生產者與消費者讀寫串流資料
.了解Kafka模型與確保可靠的資料傳遞使用案例
.透過Kafka建立資料處理流與應用的最佳實作
.管理生產環境Kafka叢集,包含監控、調校與維運任務
.學習維運Kafka時最關鍵的指標
.探索Kafka串流的傳送能力如何讓它成為串流處理系統的絕佳資料來源

作者簡介

Neha Narkhede是Confluent的共同創辦人和總工程師,該公司主要業務為Apache Kafka訊息系統的商業支援。Neha也負責透過Kafka與Apache Samza為LinkedIn上PB的串流資料打造基礎設施。

Gwen Shapira是Confluent的系統架構師協助客戶成功地應用Apache Kafka。擁有豐富的打造延展性資料架構經驗。

Todd Palino是LinkedIn網站可靠度的資深主任工程師,負責維運目前最大的幾座Apache Kafka、Zookeeper與Samza的叢集。

目錄大綱

對一本技術書籍作者來說,聽見「我真希望這本書在我開始這個專案前就有了」是最大的讚美,這也是我們開始撰寫本書的目標。我們檢視過去打造Kafka 的經驗、在生產環境運行Kafka以及幫助許多企業建立Kafka的軟體架構並管理他們的資料串流,我們問自己「我們所能分享的經驗中,什麼是對新用戶最有幫助的,能使他們從初學者一步步成為專家?」本書反應了我們每日的日常任務:運行Apache Kafka 並且幫助其他人以最佳的方式使用他。

本書包含了我們認為在生產環境中成功地運行Apache Kafka並建立強健且高效的應用程式所需的知識。我們也強調了一些常見的使用案例:事件驅動的訊息傳遞微服務、串流處理應用程式以及大規模資料串流。我們也專注讓本書無論是使用案例或架構說明的內容都顯的平易近人,讓每個Kafka的使用者都能從中獲益。本書也包含實際操作的內容,例如如何安裝與設定Kafka 以及如何使用Kafka API等。我們也保留專屬章節討論Kafka 設計原則以及可靠度保證。此外還探討了許多Kafka令人讚賞的架構細節:副本協定、控制者與儲存層等。我們相信對於分散式系統有興趣的讀者來說,關於Kafka內部設計的章節閱讀起來不僅有趣,並且對於尋找在生產環境中部署Kafka並設計應用程式的使用者來說相當有幫助。對Kafka的運作原理多了解一分,你在應用Kafka時的各種權衡就會更有依據以及信心。

軟體工程面臨的一個問題就是通常一件任務不只有一種作法。類似Apache Kafka 這類的平台提供許多彈性的設定配置,這對專家來說相當有用,但也讓新用戶的學習曲線變得更為陡峭。查閱Apache Kafka 的官方文件會告訴你這些參數與配置的定義,但卻沒有告訴你該如何配置以及該避免哪些設定。本書會盡可能的說明這些選擇以及利弊,並且告訴你Kafka 中不同選項能否運用的時機。