買這商品的人也買了...
-
Verilog 硬體描述語言 (Verilog HDL: A Guide to Digital Design and Synthesis, 2/e)$480$432 -
Java 7 教學手冊, 5/e$650$553 -
公開來源情資技術:線上資訊搜尋與分析資源 (Open Source Intelligence Techniques: Resources for Searching and Analyzing Online Information, 4/e)$1,887$1,665 -
$354推薦系統 (Recommender Systems: An Introduction) -
$414Ansible自動化運維技術與最佳實踐 -
Spark 學習手冊 (Learning Spark: Lightning-Fast Big Data Analysis)$520$411 -
$230Spark Cookbook (中文版) -
會計人的 Excel 小教室$249$197 -
$474第一行代碼 : Android, 2/e -
圖解雲端技術|基礎架構x運作原理 x API$480$379 -
$414Python 數據可視化 (Mastering Python Data Visualization) -
資料視覺化|使用 Python 與 JavaScript (Data Visualization with Python and JavaScript: Scrape, Clean, Explore & Transform Your Data)$680$537 -
$414精通 Python 網絡爬蟲:核心技術、框架與項目實戰 -
$234Spark Streaming:實時流處理入門與精通 (Learning real-time processing with Spark Streaming) -
無瑕的程式碼-敏捷完整篇-物件導向原則、設計模式與 C# 實踐 (Agile principles, patterns, and practices in C#)$790$616 -
$294NLTK 基礎教程 — 用 NLTK 和 Python 庫構建機器學習應用 (NLTK Essentials) -
$474TensorFlow技術解析與實戰 -
$534Apache Kafka 源碼剖析 -
TensorFlow + Keras 深度學習人工智慧實務應用$590$460 -
資料結構 -- 使用 Python$520$411 -
寫給未來社會的新帳本──區塊鏈:人類的新型貨幣、終極信任機器與分散治理革命 (Decoding Global Blockchain and Investment Cases)$380$323 -
寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)$390$308 -
Docker 入門與實戰, 2/e$500$395 -
$403Python 金融實戰 (Python for Finance) -
$280Spark SQL大數據實例開發教程
相關主題
商品描述
本書以大數據處理引擎Spark的穩定版本1.6.x為基礎,從應用案例、原理、源碼、流程、調優等多個角度剖析Spark上的實時計算框架SparkStreaming。在勾勒出SparkStreaming架構輪廓的基礎上,從基本源碼開始進行剖析,由淺入深地引導已具有Spark和Spark Streaming基礎技術知識的讀者進行Spark Streaming的進階學習,理解Spark Streaming的原理和運行機制,為流數據處理的決策和應用提供了技術參考;結合Spark Streaming的深入應用的需要,對Spark Streaming的性能調優進行了分析,也對Spark Streaming功能的改造和擴展提供了指導。
本書適合大數據領域CTO、架構師、高級軟件工程師,尤其是Spark領域已有Spark Streaming基礎知識的從業人員閱讀,也可供需要深入學習Spark、Spark Streaming的高校研究生和高年級本生參考。
海報:

目錄大綱
第1章Spark Streaming應用概述
1.1 Spark Streaming應用案例
1.2 Spark Streaming應用剖析
第2章Spark Streaming基本原理
2.1 Spark Core簡介
2.2 Spark Streaming設計思想
2.3 Spark Streaming整體架構
2.4編程接口
第3章Spark Streaming運行流程詳解
3.1從StreamingContext的初始化到啟動
3.2數據接收
3.3數據處理
3.4數據清理
3.5容錯機制
3.5.1容錯原理
3.5.2 Driver容錯機制
3.5.3 Executor容錯機制
3.6 No Receiver方式
3.7輸出不重複
3.8消費速率的動態控制
3.9狀態操作
3.10窗口操作
3.11頁面展示
3.12 Spark Streaming應用程序的停止
第4章Spark Streaming性能調優機制
4.1並行度解析
4.1.1數據接收的並行度
4.1.2數據處理的並行度
4.2內存
4.3序列化
4.4 Batch Interval
4.5 Task
4.6 JVM GC
第5章Spark 2.0中的流計算
5.1連續應用程序
5.2無邊界表unbounded table
5.3增量輸出模式
5.4 API簡化
5.5其他改進
