大數據分析技術基礎
榮垂田 著
- 出版商: 機械工業
- 出版日期: 2021-08-01
- 定價: $234
- 售價: 6.6 折 $154
- 語言: 簡體中文
- 頁數: 190
- 裝訂: 平裝
- ISBN: 711168558X
- ISBN-13: 9787111685586
-
相關分類:
大數據 Big-data
立即出貨 (庫存 < 3)
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
78折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$608 -
78折
BDD in Action, 2/e (中文版)$960$749 -
78折
看不見的戰場:社群、AI 與企業資安危機$750$585 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
78折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$328 -
78折
裂縫碎光:資安數位生存戰$550$429 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
78折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$538 -
78折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$499 -
78折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$374 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
78折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$530 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
78折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$562 -
78折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$663 -
79折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$474 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
78折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$437
相關主題
商品描述
大數據已發展成為一個學科。
本書作為該領域的入門教材,在內容上盡可能覆蓋大數據分析的基本理論和基本技術。
全書共9章:
第1章介紹大數據發展的背景和相關的理論知識;
第2章介紹大數據的採集方法,以及數據採集案例;
第3章介紹大數據處理平臺Hadoop,以及Hadoop在不同系統平臺上的安裝和部署方法;
第4章介紹MapReduce編程方法和開發工具,以及MapReduce編程實例;
第5章介紹HDFS及其相關的操作方法;
第6章介紹HBase及其相關的操作方法;
第7章介紹Hive及其在不同平臺上的安裝和部署方法、應用案例;
第8章介紹大數據處理平臺Spark,以及Spark編程實例;
第9章介紹NoSQL數據庫,以及典型的NoSQL數據庫系統。
本書可作為高等學校計算機、數據科學與大數據技術及人工智能或相關專業的本科生或研究生教材,
也可供對大數據分析感興趣的工程技術人員閱讀參考。
目錄大綱
前 言
第1章 大數據概述 1
11 大數據時代 1
111 大數據的發展歷程 1
112 大數據發展的內在驅動力 2
12 大數據的相關概念 6
121 大數據的5V特徵 6
122 大數據的相關定義 6
13 大數據的影響 8
14 大數據分析 9
141 大數據分析的特點 9
142 大數據分析的流程 9
143 大數據分析的核心技術 10
144 大數據分析的計算模式 11
15 大數據的行業應用 12
151 社交大數據 12
152 醫療大數據 13
153 房地產大數據 13
16 大數據與其他領域的關係 14
161 雲計算、大數據和物聯網 14
162 大數據與人工智能 16
習題 16
第2章 大數據的採集 18
21 大數據的來源 18
22 大數據採集工具 19
23 大數據預處理 19
24 Nutch應用案例 20
241 Nutch的安裝和配置 21
242 Nutch爬取與內容解析 23
25 Scrapy應用案例 25
251 Scrapy框架概述 25
252 Scrapy的安裝和配置 27
253 Scrapy爬取實例 27
254 總結 35
習題 36
第3章 大數據處理平臺
Hadoop 37
31 Hadoop概述 37
311 Hadoop的發展歷程 37
312 Hadoop的體系結構 38
313 Hadoop的特點 39
32 Hadoop的安裝和配置 40
321 準備工作 40
322 Hadoop軟件的安裝和配置 42
習題 64
第4章 MapReduce編程 66
41 MapReduce概述 66
42 開發工具IntelliJ IDEA 67
43 編程實例 71
431 MapReduce經典入門程序——
字數統計(WordCount) 71
432 MapReduce經典進階程序 81
433 在集群上運行MapReduce
程序 87
習題 93
第5章 HDFS 94
51 HDFS概述 94
52 HDFS的架構及特點 95
53 文件格式及其訪問方法 96
531 TextFile 97
532 SequenceFile 99
533 MapFile 102
534 RCFile 106
54 分佈式緩存 109
55 HDFS Shell命令 112
56 HDFS的其他訪問方式 116
習題 122
第6章 HBase 123
61 HBase概述 123
62 HBase的數據模型 124
63 HBase的邏輯結構 125
64 HBase的架構及特點 126
65 HBase的安裝與配置 129
66 HBase Shell命令 135
67 使用Java API訪問 HBase 140
習題 145
第7章 Hive 146
71 Hive概述 146
72 在本地安裝運行Hive 147
721 下載源文件 147
722 修改配置文件 148
723 啟動Hive 150
724 創建數據庫和文件夾 152
725 建表及加載數據 152
726 測試Hive 153
73 在Linux中安裝Hive 155
731 機器準備 155
732 Hive安裝包準備 155
733 修改Hive配置文件 156
734 修改Linux環境變量 157
735 啟動Hive和相關測試 158
習題 159
第8章 大數據處理平臺Spark 160
81 Spark概述 160
811 Spark的概念 160
812 學習Spark的原因 160
813 Spark組件 161
814 Spark任務執行過程 162
82 Spark本地(Windows)
安裝 163
821 安裝Scala 163
822 安裝Hadoop 164
823 安裝Spark 165
83 Spark集群安裝 166
84 Spark運行實例 169
841 蒙特·卡羅算法求π 169
842 WordCount程序 169
習題 170
第9章 NoSQL數據庫 171
91 NoSQL數據庫概述 171
911 NoSQL的產生 171
912 因特網對關係數據庫提出的
新要求 172
913 NoSQL數據庫的分類 172
92 MongoDB 173
921 MongoDB概述 173
922 MongoDB的優勢 173
923 MongoDB的安裝 174
924 MongoDB使用實例 178
93 Redis 180
931 Redis概述 180
932 Redis的應用場景 181
933 Redis的數據類型及操作 181
934 Redis的安裝 182
935 Redis使用實例 184
94 Memcached 185
941 Memcached概述 185
942 Memcached的應用場景 186
943 Memcached的數據類型
及操作 186
944 Memcached的安裝 187
945 Memcached使用實例 188
習題 189
參考文獻 190
