買這商品的人也買了...
-
大數據分析處理:Spark技術、應用與性能優質化$750$638 -
資料科學的商業運用 (Data science for business)$680$537 -
Git 學習指南$359$341 -
$505圖解Spark:核心技術與案例實戰 -
$250Apache Kylin 權威指南 -
$354Hadoop 金融大數據分析 -
$403企業 IT 架構轉型之道 (阿裡巴巴中臺戰略思想與架構實戰) -
$308Spark:大數據集群計算的生產實踐 -
打造可維護軟體|編寫可維護程式碼的10項法則 (Java版) (Building Maintainable Software, Java Edition: Ten Guidelines for Future-Proof Code)$450$356 -
$607深度學習、優化與識別 (Deep Learning,Optimization and Recognition) -
$301Spark與Hadoop大數據分析 (Big Data Analytics) -
$301Python 機器學習經典實例 (Python Machine Learning Cookbook) -
$301Cloudera Hadoop 大數據平臺實戰指南 -
大話 AWS 雲端架構:雲端應用架構圖解輕鬆學$550$429 -
AWS 解決方案架構師學習與備考 (第3版·SAA-C02)$588$559 -
大話 AWS 雲端架構:雲端應用架構圖解輕鬆學, 3/e$650$507 -
雲原生時代的可觀測系統最佳實戰$648$616 -
Azure DevOps 設計策略與實戰分析:開發工程師從入門到進階完全指南(iThome鐵人賽系列書)【軟精裝】$760$593 -
Terraform 建置與執行, 3/e (Terraform: Up and Running: Writing Infrastructure as Code, 3/e)$780$616 -
K8S 自學聖經:10大核心模板快速入門【圖解教學】$790$624 -
LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具$680$537 -
$426大模型應用開發 : 動手做 AI Agent -
Microsoft Azure 學習手冊|雲端運算與雲端系統開發的關鍵知識 (Learning Microsoft Azure: Cloud Computing and Development Fundamentals)$880$695 -
架構資料與機器學習平台|雲端啟動分析與AI驅動的創新 (Architecting Data and Machine Learning Platforms: Enable Analytics and Ai-Driven Innovation in the Cloud)$780$616 -
生成式 AI 專案實踐指南:從模型挑選、上線、RAG 技術到 AI Agent 整合$650$507
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
目錄大綱
前言
第1章Spark架構與集群環境1
1.1Spark概述與架構1
1.1.1Spark概述2
1.1.2Spark生態3
1.1.3Spark架構5
1.2在Linux集群上部署Spark8
1.2.1安裝OpenJDK9
1.2.2安裝Scala9
1.2. 3配置SSH免密碼登錄10
1.2.4Hadoop的安裝配置10
1.2.5Spark的安裝部署13
1.2.6Hadoop與Spark的集群複製14
1.3Spark集群試運行15
1.4IntellijIDEA的安裝與配置17
1.4.1Intellij的安裝17
1.4 .2Intellij的配置17
1.5EclipseIDE的安裝與配置18
1.6使用SparkShell開發運行Spark程序19
1.7本章小結20
第2章Spark編程模型21
2.1RDD彈性分佈式數據集21
2.1.1RDD簡介22
2.1.2深入理解RDD22
2.1.3RDD特性總結24
2.2Spark程序模型25
2.3Spark算子26
2.3.1算子簡介26
2.3.2Value型Transmation算子27
2.3.3Key—Value型Transmation算子32
2.3.4Action算子34
2.4本章小結37
第3章Spark機制原理38
3.1Spark應用執行機制分析38
3.1.1Spark應用的基本概念38
3.1.2Spark應用執行機制概要39
3.1.3應用提交與執行41
3.2Spark調度機制4 2
3.2.1Application的調度42
3.2.2job的調度43
3.2.3stage(調度階段)和TasksetManager的調度46
3.2.4task的調度50
3.3Spark存儲與I/O52
3.3.1Spark存儲系統概覽52
3.3.2BlockManager中的通信54
3.4Spark通信機制54
3.4.1分佈式通信方式54
3.4.2通信框架AKKA56
3.4.3Client、Master和Worker之間的通信57
3.5容錯機制及依賴65
3.5.1Lineage(血統)機制66
3.5.2Checkpoint (檢查點)機制68
3.6Shuffle機制70
3.6.1什麼是Shuffle70
3.6.2Shuffle歷史及細節72
3.7本章小結78
第4章深入Spark內核79
4.1Spark代碼佈局79
4.1.1Spark源碼佈局簡介79
4.1.2SparkCore內模塊概述80
4.1.3SparkCore外模塊概述80
4.2Spark執行主線(RDD→Task)剖析80
4.2.1從RDD到DAGScheduler81
4.2.2從DAGScheduler到TaskScheduler82
4.2.3從TaskScheduler到Worker節點88
4.3Client、Master和Worker交互過程剖析89
4.3.1交互流程概覽89
4.3.2交互過程調用90
4.4Shuffle觸發96
4.4.1觸發ShuffleWrite96
4.4.2觸發ShuffleRead98
4.5Sp ark存儲策略100
4.5.1CacheManager職能101
4.5.2BlockManager職能105
4.5.3DiskStore與DiskBlock——Manager類113
4.5.4MemoryStore類114
4.6本章小結117
第5章SparkonYARN118
5.1YARN概述118
5.2SparkonYARN的部署模式121
5.3SparkonYARN的配置重點125
5.3.1YARN的自身內存配置126
5.3.2SparkonYARN的重要配置127
5.4本章小結128
第6章BDAS生態主要模塊129
6.1SparkSQL129
6.1.1SparkSQL概述130
6.1.2SparkSQL的架構分析132
6.1.3SparkSQL如何使用135
6.2SparkStreaming140
6.2.1SparkStreaming概述140
6.2.2SparkStreaming的架構分析143
6.2.3SparkStreaming編程模型145
6.2.4數據源DataSource147
6.2.5DStream操作149
6.3SparkR154
6.3.1R語言概述154
6.3.2SparkR簡介155
6.3.3DataFrame創建156
6.3 .4DataFrame操作158
6.4MLlibonSpark162
6.4.1機器學習概述162
6.4.2機器學習的研究方向與問題164
6.4.3機器學習的常見算法167
6.4.4MLlib概述210
6.4.5MLlib架構212
6.4.6MLlib使用實例——電影推薦214
6.5本章小結220
第7章Spa rk調優221
7.1參數配置221
7.2調優技巧223
7.2.1序列化優化223
7.2.2內存優化224
7.2.3數據本地化228
7.2.4其他優化考慮229
7.3實踐中常見調優問題及思考230
7.4本章小結231
第8章Spark2.0.0232
8.1功能變化232
8.1.1刪除的功能232
8.1.2Spark中發生變化的行為233
8.1.3不再建議使用的功能233
8.2Core以及SparkSQL的改變234
8.2.1編程API234
8.2.2多說些關於SparkSession234
8.2.3SQL236
8.3MLlib237
8.3.1新功能237
8.3.2速度/擴展性237
8.4SparkR238
8.5Streaming238
8.5.1初識結構化Streaming238
8.5.2結構化Streaming編程模型239
8.5.3結果輸出240
8.6依賴、打包242
8.7本章小結242
