Spark 2.x 大數據分析與機器學習實戰
Romeo Kienzler 賴裕文
- 出版商: 旗標
- 出版日期: 2018-09-14
- 定價: $650
- 售價: 8.5 折 $553
- 語言: 繁體中文
- 頁數: 336
- ISBN: 9863125539
- ISBN-13: 9789863125532
-
相關分類:
Spark、Machine Learning
立即出貨(限量) (庫存=2)
買這商品的人也買了...
-
Python + Spark 2.0 + Hadoop 機器學習與大數據分析實戰$680$530 -
為你自己學 Git$500$390 -
圖解區塊鏈$380$323 -
認識大數據的第一本書$450$383 -
實戰機器學習|使用 Spark$620$527 -
Python 資料科學與人工智慧應用實務$650$553 -
Python 深度學習實作:Keras 快速上手$500$390 -
$403Spring Cloud 微服務架構開發實戰 (全新升級版) -
$474智能運維:從0搭建大規模分佈式 AIOps 系統 -
機器學習|工作現場的評估、導入與實作$580$458 -
大數據時代的資料庫處理:Spark SQL親自動手做$580$493 -
Python 網路爬蟲與資料分析入門實戰$450$351 -
$474Elasticsearch 實戰 (Elasticsearch in Action) -
$352深度學習技術圖像處理入門 -
$422Spring Cloud微服務架構進階 (An in-Depth Analysis of spring cloud) -
CODE COMPLETE:軟體開發實務指南, 2/e (中文版) (Code Complete: A Practical Handbook of Software Construction, 2/e)$1,280$998 -
Attacking Network Protocols|王牌駭客的網路攻防手法大公開 (Attacking Network Protocols: A Hacker's Guide to Capture, Analysis, and Exploitation)$480$408 -
$607Spring 5 開發大全 -
Vue.js 建置與執行 (Vue.js: Up and Running: Building Accessible and Performant Web Apps)$480$379 -
Kubernetes 錦囊妙計 (Kubernetes Cookbook : Building Cloud Native Applications)$420$332 -
深度學習入門教室:6堂基礎課程 + Python 實作練習,Deep Learning、人工智慧、機器學習的理論和應用全圖解$550$495 -
不懂程式也能學會的大數據分析術 - 使用 RapidMiner$550$468 -
$534深入淺出 Prometheus:原理、應用、源碼與拓展詳解 -
輕鬆學會 LINE 程式設計與 AI 聊天機器人實作開發$520$406 -
機器學習的數學基礎 : AI、深度學習打底必讀$580$458
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書獲台灣 IBM 推薦
身處於資訊爆炸的時代,數據無時無刻不間斷產生,大型購物網站的會員資料、工廠大規模的感測器數據…等等,當要處理的資料規模達到大數據等級時,就不再是單機的 R 或 Python 可以應付得來的。
Apache Spark 是一套分散式和高擴展性的資料分析系統,在大數據分析乃至於計器學習的應用上佔有一席之地。為了因應資料量爆炸性的成長,Spark 也不斷擴充其功能模組,提供更具效率的資料分析與處理流程,也因此造成許多開發者對於 Spark 各個功能模組的用法與差異並不了解,對於新的功能模組也不得其門而入。
徹底了解Apache Spark 2.x中的新功能,建構全自動化的機器學習流程
本書由標準 Apache Spark 模組開始,將一一介紹記憶體管理、二進位處理、快取感知計算和程式碼生成,加快在 Spark 上的執行效率。並整合整合 H2O 和 Deeplearning4j,進行目前當紅的機器學習應用,以及運用 Jupyter 筆記本、Zeppelin、Docker 和 Kubernetes 在雲端架構上使用 Spark。書中使用支援度高且運算快的原生語言 Scala 來開發,並深入探討 Apache Spark 2.x 的細節以及提供實際的範例作為教學如:從 MQTT 接收 IoT 洗衣機的串流數據、道路安全數據中使用機器學習來做分類、使用深度學習來處理軸承的震動感測器數據的異常偵測…等等。
而最重要的,本書作者 Romeo Kienzler 做為 IBM Watson IoT worldwide 團隊的首席資料科學家,期許以業界的觀點,透過理論與實作帶領讀者進入大數據與機器學習的世界。你還將徹底了解 Apache Spark 2.x 中的新功能,特別是使用 SparkML 建構全自動化的機器學習流程,讓你對 Spark 有完全不同的全新認識。
本書特色 :
● 來自 IBM Watson IoT worldwide 團隊首席資料科學家的業界親傳
● 處理各種串流:TCP、Flume、Kafka、Twitter、MQTT
● Spark 的強力夥伴-機器學習函式庫:MLlib、SparkML、SystemML
● 最熱門的深度學習:DeepLearning4j、H2O
● Spark 的雲端部署:Docker、Kubernetes、 IBM DataScience Experience
作者簡介
Romeo Kienzler 是 IBM Watson IoT 全球團隊的首席資料科學家,幫助客戶大規模地應用先進的機器學習在其 IoT 感測器數據。
他擁有蘇黎世瑞士聯邦理工學院的計算機科學碩士學位,專攻資訊系統、生物資訊和應用統計學,目前的研究重點是 Apache Spark 上可擴展的機器學習,也是各種開源專案的貢獻者。
作者目前在瑞士伯恩應用科技大學擔任副教授,開設人工智慧課程,同時也是 IBM 技術專家委員會和 IBM Academy of Technology (IBM 主要的智囊團) 的成員。
目錄大綱
01 初嘗 Apache Spark V2
02 Apache Spark SQL
03 Catalyst 優化器
04 Project Tungsten
05 Apache Spark Streaming
06 結構化串流處理 (Structured Streaming)
07 Apache Spark MLlib
08 Apache SparkML
09 Apache SystemML
10 使用 DeepLearning4j 和 H2O 在 Apache Spark 上做深度學習
11 Apache Spark GraphX
12 Apache Spark GraphFrames
13 在 IBM DataScience Experience 上透過 Jupyter Notebooks 使用 Apache Spark
14 在 Kubernetes 之上運行 Apache Spark










