大數據分析與應用實踐指南--數據處理數據分析和應用場景案例

姜麗 張瑋

相關主題

商品描述

本書內容包含了大數據分析和應用的全過程,從數據的預處理,到數據的存儲,以及數據分析結果的可視化,整個實驗按數據處理、數據分析和應用場景案例一共分為數據處理、數據分析、實驗案例與應用場景三大部分。數據處理即利用Kettle工具進行數據抽取、數據清洗、數據集成、數據變換,向讀者介紹數據處理采集的方法與技巧。數據分析即通過cube工具創建立方體,通過維度建模、在線分析處理、數據挖掘構建商務智能分析系統。 本書可作為普通本科院校計算機類專業核心課程“大數據分析與應用”的配套教材,也可作為大數據相關行業開發人員的參考書。

目錄大綱

第1章 概述
1.1 預備知識
1.2 實驗環境及軟件
1.3 實驗環境安裝
1.3.1 Java的安裝
1.3.2 Java環境變量配置
1.3.3 Kettle的下載安裝與Spoon啟動
第2章 數據預處理
2.1 數據抽取
2.1.1 實驗一:覆雜表頭Excel數據源處理
2.1.2 實驗二:合並多個Excel文件
2.1.3 實驗三:數據庫文件的導入和導出
2.2 數據清洗
2.2.1 實驗一:字符串操作
2.2.2 實驗二:字段拆分、合並和值映射
2.2.3 實驗三:數據校驗
2.2.4 實驗四:去除重覆數據
2.2.5 實驗五:作業監控操作——發送郵件
2.3 數據集成
實驗:數據倉庫的建立
第3章 數據分析
3.1 數據可視化分析
3.1.1 實驗一:數據可視化
3.1.2 實驗二:使用Schema Workbench創建Cube(立方體)
3.1.3 實驗三:在線分析
3.2 數據挖掘
實驗:數據挖掘算法初識
第4章 大數據分析的應用
4.1 教育行業的應用
實驗:學生興趣愛好分析
4.2 電子商務應用
實驗:中醫證型關聯性分析
4.3 客戶關系管理應用
實驗:航空客運信息挖掘
第5章 數據工坊項目實踐
5.1 廣電大數據實戰
5.1.1 實驗一:廣電大數據處理
5.1.2 實驗二:廣電大數據可視化分析
5.2 新零售智能銷售數據實戰
5.2.1 實驗一:無人售貨機銷售數據處理
5.2.2 實驗二:無人售貨機銷售數據可視化分析