大數據分析處理:Spark技術、應用與性能優質化

Spark亞太研究院 王家林 著、胡嘉璽 審閱.

立即出貨 (庫存 < 8)

買這商品的人也買了...

商品描述

<內容簡介>

Hadoop時代來臨之後,雖然已經建立了完整的生態圈,包括儲存、運算,叢集管理以及NoSQL/RDMS等,但這拼圖的最後一個缺角,卻是讓Hadoop人員搥胸頓足的即時處理。Spark的出現,不是淘汰Hadoop,而是讓這個Ecosystem更加完整。
Spark
完整的語法、支援HadoopMapReduce,再加上特殊的架構以及自有的查詢語言,讓整個大數據圈為之震憾,也打破了Hadoop保持的大數據處理紀錄。如果你是Hadoop的使用者,這本書是你一定要深深研讀,如果你是大數據的新手,這也是你入門的最好選擇。


本書特色:

  • 完全從企業處理大數據夜霧場景的角度出發,利用實際範例的程式碼來組織內容,從零起步,不用任何基礎。
  • 全書利用Spark框架中核心程式碼解析,掌握Spark實用開發技術,輕鬆駕馭Spark核心和子框架
  • 於網站附彩色程式碼圖檔供讀者下載、參考

<章節目錄>

ch01 Spark程式設計模型
ch02
建置Spark分散式叢集
ch03
Spark開發環境及其測試
ch04
Spark RDD與程式設計API實戰
ch05
Spark執行模式深入解析
ch06
Spark核心解析
ch07
GraphX大規模圖型計算與圖型擷取實戰
ch08
Spark SQL原理與實戰
ch09
Machine Learning on spark
ch10
Tachyon檔案系統
ch11
Spark Streaming原理與實戰
ch12
Spark多語言程式設計
ch13
R語言的分散式程式設計之SparkR
ch14
Spark效能最佳化和最佳做法
ch15
Spark原始程式解析
附錄A 動手實戰Scala三部曲