快速上手 Scala:Spark 大數據分析入門 Scala Programming for Big Data Analytics: Get Started with Big Data Analytics Using Apache Spark
杜金源,張真亦
- 出版商: 電子工業
- 出版日期: 2021-06-01
- 定價: $648
- 售價: 8.5 折 $551
- 語言: 簡體中文
- 頁數: 244
- 裝訂: 平裝
- ISBN: 712141385X
- ISBN-13: 9787121413858
-
相關分類:
Spark、Functional-programming
- 此書翻譯自: Scala Programming for Big Data Analytics: Get Started with Big Data Analytics Using Apache Spark
立即出貨
買這商品的人也買了...
-
網路安全與密碼學概論 (Cryptography and network security)$750$713 -
精通正規表達式, 3/e (Mastering Regular Expressions, 3/e)$780$616 -
完整學會 Git, GitHub, Git Server 的24堂課$360$284 -
Spark 學習手冊 (Learning Spark: Lightning-Fast Big Data Analysis)$520$411 -
為你自己學 Git$500$390 -
Java 減肥後輕量級語言:Scala 全方位程式開發 (舊名: 高手昇級:可完全取代Java的Scala)$540$459 -
Spark SQL 親自動手做:大數據時代的資料庫處理 (熱銷版)$580$493 -
機器學習開發神器!Google Cloud Platform 雲端開發應用超入門$490$417 -
Python 神乎其技 全新超譯版 - 快速精通 Python 進階功能, 寫出 Pythonic 的程式 (Python Tricks: A Buffet of Awesome Python Features)$580$493 -
$403ClickHouse 原理解析與應用實踐 -
$474RocketMQ 分佈式消息中間件:核心原理與最佳實踐 -
$403IntelliJ IDEA 入門與實戰 -
$378Elasticsearch 權威指南 -
$414gRPC 與雲原生應用開發 : 以 Go 和 Java 為例 -
$509Scala並發編程 第2版 -
$236Hadoop 應用開發與案例實戰 (慕課版) -
$356數據庫程序員面試筆試通關寶典 -
$374編程原則:來自代碼大師Max Kanat-Alexander的建議 -
$517RocketMQ 技術內幕:RocketMQ 架構設計與實現原理, 2/e -
$458Elasticsearch 搜索引擎構建入門與實戰 -
$357解決方案架構師修煉之道 -
Terraform 實戰$599$569 -
K8S 自學聖經:10大核心模板快速入門【圖解教學】$790$624 -
資料庫內部原理|深入了解分散式資料系統的運作方式$780$616 -
Microsoft Azure 學習手冊|雲端運算與雲端系統開發的關鍵知識 (Learning Microsoft Azure: Cloud Computing and Development Fundamentals)$880$695
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書是一本為Scala和Spark初學者準備的入門書籍,很適合準備踏入大數據開發領域的新手和其他對此感興趣的讀者閱讀。本書在內容上遵循從宏觀到微觀、由淺入深遞進式的講解方式,涵蓋了Spark入門開發所需的Scala基礎知識。具體來說,本書按照如下順序進行介紹。 首先,前三章從宏觀上介紹了Scala語言,包括初識Scala、安裝Scala及使用Scala Shell工具。 其次,第四章到第十二章是本書的重點,詳細介紹了與Spark開發密切相關的Scala語法,包括變量、數據類型、條件語句、代碼塊、函數、集合、循環、類和包,以及與異常處理相關的內容,每一章都對某個語法點進行深入探索。第十三章介紹瞭如何把寫好的Scala代碼進行編譯和打包。 最後,第十四章介紹了Spark的入門實踐,將前面章節所學到的Scala知識運用到Spark開發中。 此外,本書提供了豐富生動的代碼示例和章末練習,如果讀者能夠加以實踐並思考,一定會收獲頗豐!
作者簡介
目前在澳大利亞德勤工作,專攻大數據和機器學習方向。
他在端到端的生命週期方案及在雲環境(Azure、AWS和GCP)中設計、開發和部署生產級大數據分析解決方案架構方面擁有豐富經驗,這些環境支持廣泛的業務案例(包括數據湖、可伸縮預測和圖形分析、流處理)等。
他的經驗延伸到大數據分析的DevOps、平臺治理和管理方面。
杜金源,北航碩士,曾在樂視、美團擔任資深大數據開發工程師,在大數據離線數據倉庫、實時計算、分佈式系統和數據平臺工具鏈方面有多年開發經驗。
目前在阿裡巴巴擔任技術專家,從事個性化推薦算法和大數據領域的研發。
《Openshift助力DevOps:雲部署更簡單》。
目錄大綱
第一章Scala語言
初識Scala / 002
為什麼要學習Scala / 003
Scala和Java / 003
Scala和Java的關係/ 003
與Java庫進行交互/ 004
Scala和Java的代碼量/ 004
Scala:一種靜態類型語言/ 006
Apache Spark與Scala / 006
Scala的性能/ 009
學習Apache Spark / 009
第二章安裝Scala
在系統中檢查Scala安裝狀態/ 011
檢查Java Development Kit(JDK)
安裝狀態/ 012
安裝Oracle JDK / 013
在Windows上安裝Scala / 014
驗證Scala安裝狀態/ 016
在Linux中安裝Scala / 016
第三章使用Scala Shell
從Scala Shell中獲得幫助/ 021
Scala REPL的hello world / 022
一步步理解Scala REPL中的hello world / 022
使用Scala REPL的數據類型的
高級特性/ 024
Scala REPL中的粘貼模式/ 026
Scala REPL中檢索歷史記錄/ 027
Scala REPL的自動補全特性/ 028
從Scala REPL退出/ 031
第四章變量
從Scala中的變量開始/ 033
Scala變量的不可變性/ 034
定義可變和不可變的Scala變量/ 035
Scala中強調不可變性的原因/ 036
可變性和類型安全的註意事項/ 037
為變量指定類型與類型推斷/ 038
Scala標識符規則和命名規範/ 039
第五章數據類型
Scala的類型層次結構/ 041
Boolean類型/ 044
String類型/ 045
多行字符串/ 047
字符串操作/ 047
Scala中的特殊類型/ 054
Unit類型/ 054
Any類型/ 056
Scala中的類型轉換/ 057
第六章條件語句
布爾表達式/ 061
在Scala中使用條件語句/ 062
逐步理解條件語句/ 062
嵌套的If/Else語句/ 064
If/Else作為三元運算符/ 066
模式匹配/ 067
第七章代碼塊
Scala中的代碼塊/ 070
使用代碼塊的註意事項/ 072
代碼塊和If/Else語句/ 072
第八章函數
為什麼要使用函數/ 076
理解函數/ 077
Scala中的函數/ 078
函數調用/ 079
有關函數定義的說明/ 080
多個參數的函數/ 081
位置參數/ 082
函數中參數的默認值/ 083
無參函數/ 084
單行函數/ 085
在函數中使用return語句/ 085
將函數作為參數傳遞/ 085
匿名函數/ 088
第九章集合
現實中的集合示例/ 091
理解列表/ 093
索引列表元素/ 095
在列表中能存儲什麼/ 096
被廣泛使用的列表操作/ 097
創建集合/ 106
理解Map集合/ 107
索引一個Map集合/ 109
Map中key的唯一性/ 110
創建Map集合的其他方式/ 111
操作Map / 111
用函數風格疊代Map / 112
理解元組/ 113
索引元組/ 114
遍曆元組/ 115
創建元組的另一種方法/ 116
理解可變集合/ 116
與可變集合有關的註意事項/ 118
可變的Map / 119
使用嵌套的集合/ 120
第十章循環
Scala中循環的類型/ 123
for循環/ 124
while循環/ 125
比較for循環和while循環/ 127
中斷循環/ 128
第十一章類和包
Scala中的類和對象/ 131
創建Scala的類和對象/ 132
多屬性值和註意事項/ 135
對類屬性使用val關鍵字/ 135
對類屬性使用var關鍵字/ 136
對類屬性既不使用val也不使用var
關鍵字/ 136
單例對象/ 137
Case類/ 139
Case類實踐/ 140
類中的相等性檢查/ 141
同時使用Case類和集合/ 143
類和包/ 144
避免命名空間衝突/ 144
引入包/ 145
第十二章異常處理
Scala異常處理的基礎/ 149
類型推斷的含義和異常處理/ 157
使用Try、Catch和Finally / 159
第十三章編譯和打包
Scala開發生命週期/ 162
Scala開發生命週期實踐/ 163
Scala編譯構建工具(SBT) / 164
在Windows上使用SBT / 165
在SBT上構建.sbt / 166
使用SBT管理依賴/ 170
使用SBT創建可執行的Scala應用程序/ 174
對可執行的Scala應用程序使用
Scala應用特性/ 176
Scala應用程序的Maven文件夾結構/ 176
在Scala應用程序中創建多個類並使用它們/ 178
編譯Scala應用程序/ 180
以JARS的形式打包Scala應用程序/ 181
轉換到IDE / 182
安裝IntelliJ IDEA / 182
IntelliJ IDEA插件安裝/ 184
IntelliJ IDEA導入項目/ 184
第十四章你好,Apache Spark
回顧Spark / 191
分佈式計算引擎/ 191
Spark與Hadoop / 192
Spark與YARN / 192
Spark進程/ 193
Spark的抽象/ 193
Spark的惰操作模式/ 194
使用Scala開發Spark / 195
在Databricks中配置Spark環境/ 195
用Scala開發Apache Spark / 198
將RDD轉換為Dataframe / 202
加載數據到Databricks中/ 203
將RDD轉換為Dataframe / 205
使用SBT創建Spark應用/ 209
在IntelliJ IDEA中創建一個新的項目/ 209
為Uber JARs管理SBT插件/ 210在SBT中管理Apache Spark依賴/ 211
Spark應用程序代碼/ 212
結論及展望/ 219
