Hadoop/Spark大調制解調器器學習

Name: Hadoop/Spark大調制解調器器學習
Price: 607 TWD
Availability: InStock
Author: 翟俊海,張素芳
ISBN: 7030666879

翟俊海,張素芳

預覽內頁

出版商: 科學出版
出版日期: 2021-01-01
定價: $768
售價: 7.9 折 $607
語言: 簡體中文
頁數: 240
裝訂: 平裝
ISBN: 7030666879
ISBN-13: 9787030666871
相關分類: Hadoop、Machine Learning

立即出貨 (庫存=1)

買這商品的人也買了...

~~$1,250~~ $1,188

計算機組織與設計 : 硬體/軟體的介面, 5/e (Patterson: Computer Organization and Design: The Hardware/Software Interface, 5/e)
$505

數據挖掘：實用機器學習工具與技術 (Data Mining : Practical Machine Learning Tools and Techniques, 4/e)
~~$680~~ $537

Ansible : 建置與執行, 2/e (Ansible : Up and Running : Automating Configuration Management and Deployment the Easy Way, 2/e)
~~$1,200~~ $948

精通機器學習｜使用 Scikit-Learn , Keras 與 TensorFlow, 2/e (Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2/e)
$454

MATLAB 機器學習：人工智能工程實踐, 2/e
$1,188

數據庫系統基礎, 7/e (Fundamentals of Database Systems, 7/e)
~~$910~~ $865

作業系統, 10/e (授權經銷版)(Silberschatz: Operating System Concepts, 10/e)
$403

深度學習理論及實戰 (MATLAB 版)
$559

基於 MATLAB 的人工智能模式識別
$352

MATLAB 神經網絡 43個案例分析
$374

Vagrant 開發運維實戰 (Hands-On DevOps with Vagrant: Implement end-to-end DevOps and infrastructure management using Vagrant)
$509

Spark 實戰, 2/e (Spark in Action ,2/e)
~~$600~~ $474

動手學 GitHub！現代人不能不知道的協同合作平台
~~$580~~ $458

玩真的！Git ✕ GitHub 實戰手冊 - coding 實境、協同開發、雲端同步, 用最具臨場感的開發實例紮實學會！ (Git for Programmers)
~~$880~~ $695

建構微服務｜設計細微化的系統, 2/e (Building Microservices: Designing Fine-Grained Systems, 2/e)
~~$594~~ $564

從零開始學 Node.js

中文年末書展｜繁簡參展書2書75折詳見活動內容 »

75折
~~$780~~ $585

為你寫的 Vue Components：從原子到系統，一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)
75折
~~$960~~ $720

BDD in Action, 2/e (中文版)
75折
~~$750~~ $563

看不見的戰場：社群、AI 與企業資安危機
79折
~~$390~~ $308

AI 精準提問 × 高效應用：DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定
7折
~~$420~~ $294

超實用！Word．Excel．PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)
75折
~~$550~~ $412

裂縫碎光：資安數位生存戰
85折
~~$640~~ $544

日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集
79折
~~$630~~ $498

Google BI 解決方案：Looker Studio × AI 數據驅動行銷實作，完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini
79折
~~$599~~ $473

超有料 Plus！職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化！
75折
~~$690~~ $518

從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)
75折
~~$640~~ $480

Windows 11 制霸攻略：圖解 AI 與 Copilot 應用，輕鬆搞懂新手必學的 Windows 技巧
75折
~~$480~~ $360

精準駕馭 Word！論文寫作絕非難事 (好評回饋版)
~~$699~~ $629

Sam Yang 的插畫藝術：用 Procreate / PS 畫出最強男友視角 x 女孩美好日常
79折
~~$599~~ $473

AI 加持！Google Sheets 超級工作流
78折
~~$780~~ $608

想要 SSR? 快使用 Nuxt 吧!：Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化（iThome鐵人賽系列書）
75折
~~$500~~ $375

超實用！業務．總管．人資的辦公室 WORD 365 省時高手必備 50招 (第二版)
7折
~~$680~~ $476

Node-RED + YOLO + ESP32-CAM：AIoT 智慧物聯網與邊緣 AI 專題實戰
79折
~~$599~~ $473

「生成式⇄AI」：52 個零程式互動體驗，打造新世代人工智慧素養
7折
~~$720~~ $504

Windows APT Warfare：惡意程式前線戰術指南, 3/e
75折
~~$850~~ $637

我輩程式人：回顧從 Ada 到 AI 這條程式路，程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)
75折
~~$600~~ $450

不用自己寫！用 GitHub Copilot 搞定 LLM 應用開發
79折
~~$780~~ $616

Tensorflow 接班王者：Google JAX 深度學習又快又強大 (好評回饋版)
79折
~~$700~~ $553

GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)
79折
~~$460~~ $363

技術士技能檢定電腦軟體應用丙級術科解題教本｜Office 2021
75折
~~$560~~ $420

Notion 與 Notion AI 全能實戰手冊：生活、學習與職場的智慧策略 (暢銷回饋版)

商品描述

人類已進入大數據時代。大數據是指具有海量（volume）、多模態（variety）、變化速度快（velocity）、蘊含價值高（value）和不精確性高（veracity）“5V”特徵的數據。大數據給傳統的機器學習帶來巨大的挑戰，已引起學術界和工業界的高度關註。Hadoop和Spark正是在這種背景下產生的兩個大數據開源平臺。本書重點介紹基於這兩種大數據開源平臺的機器學習，包括機器學習概述、大數據與大數據處理系統、Hadoop分佈式文件系統HDFS、Hadoop並行編程框架MapReduce、Hadoop大調制解調器器學習和Spark大調制解調器器學習。

目錄大綱

目錄
前言

第1章機器學習概述 1
1.1 分類與聚類 1
1.1.1 分類 1
1.1.2 聚類 4
1.2 K-近鄰算法與模糊K-近鄰算法 7
1.2.1 K-近鄰算法 7
1.2.2 模糊K-近鄰算法 8
1.3 K-均值算法與模糊K-均值算法 10
1.3.1 K-均值算法 10
1.3.2 模糊K-均值算法 12
1.4 決策樹算法 13
1.4.1 離散值決策樹算法 13
1.4.2 連續值決策樹算法 25
1.5 神經網絡 31
1.5.1 神經元模型 32
1.5.2 梯度下降算法 33
1.5.3 多層感知器模型 35
1.6 極限學習機 40
1.7 支持向量機 42
1.7.1 線性可分支持向量機 42
1.7.2 近似線性可分支持向量機 46
1.7.3 線性不可分支持向量機 47
1.8 主動學習 49

第2章大數據與大數據處理系統 53
2.1 大數據及其特徵 53
2.2 Linux操作系統簡介 54
2.2.1 Linux版本 54
2.2.2 Linux的文件與目錄 56
2.2.3 Linux用戶與用戶組 62
2.2.4 Linux系統軟件包管理 65
2.2.5 Linux操作系統的安裝 66
2.3 大數據處理系統Hadoop 79
2.3.1 什麼是Hadoop 79
2.3.2 Hadoop的特性 82
2.3.3 Hadoop的體系結構 82
2.3.4 Hadoop的運行機制 83
2.3.5 Hadoop 1.0和Hadoop 2.0的區別 85
2.3.6 Hadoop的安裝及大數據處理環境的架構 87
2.4 大數據處理系統Spark 95
2.4.1 什麼是Spark 95
2.4.2 Spark的運行架構 96
2.4.3 Spark的工作機制 97

第3章 Hadoop分佈式文件系統HDFS 106
3.1 HDFS概述 106
3.1.1 HDFS的優勢 106
3.1.2 HDFS的局限性 107
3.2 HDFS的系統結構 107
3.3 HDFS的數據存儲 111
3.3.1 數據塊的存放策略 111
3.3.2 數據的讀取策略 112
3.3.3 文件系統元數據的持久性 114
3.3.4 HDFS的魯棒性 114
3.4 訪問HDFS 116
3.4.1 通過文件系統Shell訪問HDFS 116
3.4.2 通過文件系統Java API訪問HDFS 120
3.5 HDFS讀寫數據的過程 132
3.5.1 HDFS讀數據的過程 132
3.5.2 HDFS寫數據的過程 133

第4章 Hadoop並行編程框架MapReduce 135
4.1 MapReduce概述 135
4.2 MapReduce的大數據處理過程 136
4.2.1 Map階段 137
4.2.2 Shu2e階段 138
4.2.3 Reduce階段 140
4.3 一個例子:流量統計 141
4.4 MapReduce的系統結構 144
4.5 MapReduce的作業處理過程 146
4.6 MapReduce算法設計 147
4.6.1 大數據決策樹算法設計 147
4.6.2 大數據極限學習機算法設計 150

第5章 Hadoop大調制解調器器學習 152
5.1 基於Hadoop的大數據K-近鄰算法 155
5.1.1 大數據K-近鄰算法的基本思想 155
5.1.2 大數據K-近鄰算法的MapReduce編程實現 156
5.2 基於Hadoop的大數據極限學習機 170
5.2.1 大數據極限學習機的基本思想 170
5.2.2 大數據極限學習機的MapReduce編程實現 170
5.3 基於Hadoop的大數據主動學習 191
5.3.1 大數據主動學習的基本思想 191
5.3.2 大數據主動學習的MapReduce編程實現 192

第6章 Spark大調制解調器器學習 201
6.1 SparkMLlib 201
6.1.1 MLlib決策樹算法 201
6.1.2 MLlib決策森林算法 204
6.1.3 MLlib K-means算法 207
6.1.4 主成分分析 210
6.2 基於Spark的大數據K-近鄰算法 212
6.3 基於Spark的大數據主動學習 218
參考文獻 238