大數據工具應用(第2版)

鐘雪靈 郭藝輝 侯昉 劉曉慶 黃承慧 彭詩力

  • 出版商: 清華大學
  • 出版日期: 2026-01-01
  • 售價: $474
  • 語言: 簡體中文
  • 頁數: 292
  • ISBN: 7302708096
  • ISBN-13: 9787302708094
  • 相關分類: 大數據 Big-data
  • 下單後立即進貨 (約4週~6週)

  • 大數據工具應用(第2版)-preview-1
  • 大數據工具應用(第2版)-preview-2
  • 大數據工具應用(第2版)-preview-3
  • 大數據工具應用(第2版)-preview-4
  • 大數據工具應用(第2版)-preview-5
  • 大數據工具應用(第2版)-preview-6
  • 大數據工具應用(第2版)-preview-7
大數據工具應用(第2版)-preview-1

商品描述

《大數據工具應用》是與國家級一流本科在線開放課程“大數據工具應用”配套的新形態大數據入門教材,旨在系統講授大數據基礎知識與工具應用方法。教材立足應用入門,註重工具實操,強調案例驅動,力求將理論知識與實踐環節有機融合,通過具體案例講解與演示,幫助讀者學會選用合適的大數據工具解決實際問題。讀者只需具備Word和Excel的基本操作能力,即可順利使用本書學習,全程無須編程。 全書共7章,內容涵蓋大數據基礎與應用概況、數據獲取、數據分析入門、數據分析進階、Tableau數據可視化、數據分析拓展以及數據思維。 本書可作為新工科、新醫科、新農科、新文科建設中,普及大數據知識與工具應用的教材,也可作為廣大讀者邁入大數據領域、揭開大數據技術神秘面紗的入門參考書。

作者簡介

鐘雪靈,博士,廣東金融學院互聯網金融與信息工程學院教授,廣東省本科高校計算機類專業教學指導委員會委員。主持和參與多項國家自然科學基金項目和國家社會科學基金項目。在Naval Research Logistics, European Journal of Operational Research, Annals of Operations Research等期刊發表論文數十篇。入選廣東省高等學校優秀青年教師培養計劃項目。主編《Python程序設計基礎》和《算法基礎與實驗》兩部教材。主持和參與建設的慕課“大數據工具應用”已在“智慧樹”正式上線。

目錄大綱

第1章 大數據基礎及應用概況
1.1 基礎知識
1.1.1 大數據的定義
1.1.2 大數據的特點
1.1.3 大數據的結構
1.1.4 相關技術
1.1.5 現狀與趨勢
1.2 大數據處理步驟
1.2.1 數據獲取
1.2.2 數據存儲
1.2.3 數據管理
1.2.4 數據分析
1.3 應用案例
1.3.1 商品推薦服務
1.3.2 公共信息服務
1.3.3 數據呈現服務
第2章 數據獲取
2.1 公共開放數據資源
2.2 現有數據格式轉換與清洗整理
2.3 網頁數據采集
2.3.1 模板任務采集
2.3.2 自定義任務采集
第3章 數據分析入門
3.1 Weka簡介與數據預處理
3.1.1 軟件下載
3.1.2 文件與數據格式
3.1.3 Weka程序界面
3.1.4 數據預處理
3.2 數據分類
3.2.1 J48決策樹分類器
3.2.2 LinearRegression分類器
3.2.3 M5P分類器
3.3 數據聚類
3.3.1 SimpleKMeans聚類器
3.3.2 EM聚類器
3.3.3 DBSCAN聚類器
3.4 數據關聯
3.4.1 關聯規則相關概念
3.4.2 Apriori算法介紹
3.4.3 Weka中Apriori關聯規則挖掘
3.5 選擇屬性
3.5.1 屬性選擇概述
3.5.2 Weka中Select attributes標簽頁
3.5.3 選擇屬性模式介紹
3.5.4 Weka中選擇屬性操作示例
3.6 數據可視化
3.6.1 Visualize標簽頁
3.6.2 數值型類別屬性可視化
第4章 數據分析進階
4.1 貝葉斯網絡
4.1.1 貝葉斯公式簡介
4.1.2 貝葉斯網絡簡介
4.1.3 編輯貝葉斯網絡結構
4.1.4 使用貝葉斯網絡編輯器進行推理
4.2 神經網絡
4.2.1 神經網絡介紹
4.2.2 Weka神經網絡選項設置
4.2.3 編輯神經網絡
4.2.4 神經網絡參數調整
4.3 時間序列分析及預測
第5章 Tableau數據可視化
5.1 Tableau概述與入門
5.1.1 概述
5.1.2 下載與安裝
5.1.3 數據類型
5.1.4 Tableau Desktop軟件界面
5.1.5 文件類型
5.2 初級可視化分析
5.2.1 條形圖
5.2.2 直方圖
5.2.3 餅圖
5.2.4 折線圖
5.2.5 壓力圖
5.2.6 樹地圖
5.2.7 氣泡圖
5.3 地圖分析
5.3.1 認識地圖
5.3.2 創建地圖
5.4 高級數據操作
5.4.1 分層結構
5.4.2 組
5.4.3 集
5.4.4 參數
5.4.5 計算字段
5.5 分析圖表整合
5.6 案例一:無錫市宜居時間分析
5.6.1 創建計算字段
5.6.2 空氣質量
5.6.3 氣溫
5.6.4 宜居時間
5.6.5 制作儀表板
5.7 案例二:佛山市納稅企業增長情況分析
5.7.1 創建計算字段
5.7.2 預測
5.7.3 剖析-行業
5.7.4 剖析-區域
5.7.5 制作儀表板
5.7.6 分析
第6章 數據分析拓展
6.1 引言
6.1.1 研究背景及實驗數據
6.1.2 研究方法
6.2 k-最近鄰算法
6.2.1 k-最近鄰算法的基本原理
6.2.2 Weka中k-最近鄰算法應用實踐
6.3 支持向量機算法
6.3.1 支持向量機算法基本原理
6.3.2 Weka中支持向量機算法應用實踐
6.4 邏輯回歸算法
6.4.1 邏輯回歸算法基本原理
6.4.2 Weka中的邏輯回歸算法應用實踐
6.5 隨機森林算法
6.5.1 隨機森林算法基本原理
6.5.2 Weka中的隨機森林算法應用實踐
6.6 模型性能評估(一)
6.7 模型性能評估(二)
第7章 數據思維
7.1 數據分析基礎
7.1.1 相關概念
7.1.2 數據分析可以幫用戶做什麼
7.1.3 如何做有效的數據分析
7.2 數據分析思維、過程和方法
7.2.1 數據分析思維
7.2.2 數據分析過程
7.2.3 數據分析方法
7.2.4 數據分析結果展示
參考文獻