Spark數據分析:基於Python語言
[澳] 傑夫瑞·艾文(Jeffrey Aven) 著
- 出版商: 機械工業
- 出版日期: 2019-04-01
- 售價: $414
- 貴賓價: 9.5 折 $393
- 語言: 簡體中文
- ISBN: 7111622723
- ISBN-13: 9787111622727
-
相關分類:
Spark、資料科學
- 此書翻譯自: Data Analytics with Spark Using Python (Addison-Wesley Data & Analytics Series)
立即出貨
買這商品的人也買了...
-
$680$530 -
$250PySpark 實戰指南 : 利用 Python 和 Spark 構建數據密集型應用並規模化部署 (Learning PySpark)
-
$414$393 -
$354$336 -
$650$553 -
$534$507 -
$594$564 -
$534$507 -
$580$493 -
$799$559 -
$414$393 -
$359$341 -
$403Linux 系統安全:縱深防禦、安全掃描與入侵檢測
-
$520$364 -
$690$483 -
$580$458 -
$1,200$948 -
$1,330$1,264 -
$580$458 -
$600$360 -
$460$363 -
$680$510 -
$520$406 -
$420$252 -
$834$792
商品描述
本書介紹了使用Spark及其擴展、子項目,以及更廣的生態系統所需的所有知識,並使用常用而且直觀的PySpark開發環境提供了編程示例。本書專註於Python語言,廣大的數據從業人員、分析師和開發人員,即使幾乎沒有Hadoop或Spark經驗,也可以輕松上手。
本書包括從Spark基本編程到高級編程,再到Spark SQL和機器學習的廣泛內容。你會學到如何使用Spark高效管理各種形式的數據:流式數據、結構化數據、半結構化數據,還有非結構化數據。
本書內容
• 理解Spark在大數據和Hadoop生態圈中不斷發展的角色
• 使用各種部署模式創建Spark集群,並實現控制和優化
• 掌握Spark Core的RDD API編程技術,並使用高級的API平臺結構(包括共享變量、RDD存儲、分區等)擴展、加速和優化Spark執行
• 高效地將SQL和非關系型數據存儲與Spark集成
• 使用Spark Streaming和Apache Kafka處理流式數據和消息
• 使用SparkR和Spark MLlib實現預測建模
本書包括從Spark基本編程到高級編程,再到Spark SQL和機器學習的廣泛內容。你會學到如何使用Spark高效管理各種形式的數據:流式數據、結構化數據、半結構化數據,還有非結構化數據。
本書內容
• 理解Spark在大數據和Hadoop生態圈中不斷發展的角色
• 使用各種部署模式創建Spark集群,並實現控制和優化
• 掌握Spark Core的RDD API編程技術,並使用高級的API平臺結構(包括共享變量、RDD存儲、分區等)擴展、加速和優化Spark執行
• 高效地將SQL和非關系型數據存儲與Spark集成
• 使用Spark Streaming和Apache Kafka處理流式數據和消息
• 使用SparkR和Spark MLlib實現預測建模