大數據分析方法及應用——基於Python實現

殷麗鳳 王斐

  • 出版商: 機械工業
  • 出版日期: 2025-08-01
  • 售價: $474
  • 語言: 簡體中文
  • 頁數: 288
  • ISBN: 7111782917
  • ISBN-13: 9787111782919
  • 相關分類: Python
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

《大數據分析方法及應用——基於Python實現》全面且系統地闡述了基於Python語言的大數據分析方法及技術,整體結構緊湊,邏輯清晰。全書共10章,前5章旨在為讀者打下堅實的理論與實踐基礎。該部分始於大數據的基本概念,隨後逐步深入Python基礎知識、數據預處理技術、大數據可視化手段及基於Python的數據處理與預處理技術,確保讀者能夠全面掌握數據分析所需的基本工具與方法。後5章則深入探索大數據分析的核心技術領域,涵蓋關聯分析、回歸分析、分類分析、聚類分析及離群點分析等關鍵內容。全書每一章均配有精心設計的典型案例與Python代碼實例,通過實戰演練的形式,直觀展現大數據分析原理在實際中的具體運用,讀者在鞏固理論知識的同時,能夠親身體驗實際操作過程,進而深化對大數據分析流程的理解與認識。 《大數據分析方法及應用——基於Python實現》在內容的專業性與閱讀體驗之間取得了良好的平衡,既可作為高校大數據技術課程的教材,也適合大數據技術愛好者進行自學。無論讀者是初學者,還是已具備一定基礎的從業者,本書均能提供寶貴的啟示與實用的知識,助力讀者在大數據分析的道路上不斷前行。

作者簡介

殷麗鳳,博士,副教授,碩士生導師,研究方向為大數據分析、機器學習以及深度學習等領域的算法及應用研究。畢業於哈爾濱理工大學計算機應用技術專業並獲得博士學位。近十多年來,一直致力於計算機應用技術領域的研究與教學。她的興趣涵蓋了軟件工程、機器學習、人工智能等方向。在多所高校擔任Python編程語言講授工作,並帶領學生完成了Python編程語言的課程設計工作。在教學中註重理論與實踐相結合,以生動的案例和實際應用來幫助學生 好地理解和掌握Python編程。她的專業知識和實踐經驗能夠將實際應用場景與Python編程相結合,為學生提供 加實用和有深度的學習體驗。

目錄大綱

前言
第1章 大數據分析概述
1.1 大數據介紹
1.1.1 大數據概念
1.1.2 大數據的5個“V”
1.1.3 大數據的處理方法
1.2 大數據關鍵技術
1.2.1 數據采集
1.2.2 數據預處理
1.2.3 數據存儲與管理
1.2.4 數據分析與挖掘
1.2.5 數據展現與可視化
1.3 大數據分析在不同領域的應用
1.3.1 商業與市場營銷
1.3.2 醫療與健康
1.3.3 金融與保險
1.3.4 社交網絡與媒體
1.4 Python介紹
1.4.1 安裝Python解釋器
1.4.2 安裝PyCharm
1.4.3 安裝 Anaconda
1.5 本章小結
1.6 習題
第2章 Python大數據分析基礎
2.1 Python基礎語法
2.1.1 關鍵字和標識符
2.1.2 常量與變量
2.1.3 基本數據類型
2.1.4 運算符和表達式
2.2 程序控制結構
2.2.1 順序結構
2.2.2 分支結構
2.2.3 循環結構
2.2.4 跳轉語句
2.3 組合數據類型
2.3.1 列表
2.3.2 元組
2.3.3 字典
2.3.4 集合
2.4 函數
2.4.1 函數的定義
2.4.2 函數的參數
2.4.3 函數的作用域
2.4.4 遞歸函數
2.5 面向對象程序設計
2.5.1 Python中的面向對象
2.5.2 成員可見性
2.5.3 方法
2.5.4 類的繼承
2.6 Python數據分析工具
2.7 本章小結
2.8 習題
第3章 大數據預處理
3.1 大數據預處理流程
3.2 數據清洗
3.2.1 缺失值處理
3.2.2 噪聲過濾
3.3 數據集成
3.3.1 實體識別
3.3.2 冗余屬性識別
3.4 數據規約
3.4.1 屬性規約
3.4.2 數值規約
3.5 數據變換
3.5.1 數據規範化
3.5.2 連續屬性離散化
3.6 本章小結
3.7 習題
第4章 大數據可視化分析
4.1 大數據可視化基礎
4.1.1 可視化的重要性
4.1.2 可視化設計原則
4.2 Matplotlib基礎——NumPy
4.2.1 創建數組
4.2.2 數組的常見屬性
4.2.3 數組的常見操作
4.2.4 數組的統計分析
4.3 Matplotlib
4.3.1 pyplot繪圖基礎
4.3.2 繪制散點圖
4.3.3 繪制折線圖
4.3.4 繪制柱狀圖
4.3.5 繪制直方圖
4.3.6 繪制餅圖
4.3.7 繪制箱線圖
4.4 實踐——中國GDP分析
4.4.1 數據準備
4.4.2 散點圖分析
4.4.3 折線圖分析
4.4.4 柱狀圖分析
4.4.5 餅圖分析
4.4.6 箱線圖分析
4.5 本章小結
4.6 習題
第5章 pandas數據處理與分析
5.1 認識pandas
5.1.1 pandas簡介
5.1.2 pandas的安裝與使用
5.2 pandas語法
5.2.1 Series類型
5.2.2 DataFrame類型
5.2.3 DataFrame數據計算
5.3 pandas讀寫數據
5.3.1 pandas讀數據
5.3.2 pandas寫數據
5.4 使用pandas進行數據預處理
5.4.1 合並數據
5.4.2 缺失值處理
5.4.3 排序和匯總
5.5 統計分析
5.5.1 分組聚合運算
5.5.2 創建透視表與交叉表
5.6 本章小結
5.7 習題
第6章 關聯分析
6.1 關聯分析基礎
6.1.1 啤酒與尿布的故事
6.1.2 關聯分析的定義
6.1.3 常用關聯分析算法
6.2 Apriori算法
6.2.1 相關概念
6.2.2 挖掘頻繁項集
6.2.3 挖掘關聯規則
6.2.4 Apriori算法的缺點
6.3 FP-growth算法
6.3.1 創建FP樹
6.3.2 利用FP樹挖掘頻繁項集
6.3.3 FP-growth算法的偽代碼
6.4 ECLAT算法
6.4.1 使用垂直數據格式挖掘頻繁項集
6.4.2 ECLAT算法的偽代碼
6.5 關聯規則評估指標
6.6 實踐——商品零售購物籃分析
6.6.1 背景與挖掘目標
6.6.2 數據初步探析
6.6.3 構建關聯分析模型
6.6.4 評估關聯分析模型
6.7 本章小結
6.8 習題
第7章 回歸分析
7.1 回歸分析的基礎
7.1.1 回歸分析的概念
7.1.2 回歸分析的步驟
7.2 一元線性回歸
7.2.1 一元線性回歸模型
7.2.2 參數w和b的推導過程
7.2.3 參數w和b求解的代碼實現
7.3 多元線性回歸
7.3.1 多元線性回歸模型和參數求解
7.3.2 參數W求解的代碼實現
7.4 正則化回歸
7.4.1 嶺回歸模型
7.4.2 最小絕對收縮與選擇算子
7.4.3 彈性網絡
7.5 回歸模型的評價指標
7.6 實踐——回歸分析
7.6.1 數據的初步探析
7.6.2 利用一元線性回歸預測房屋完成單位數量模型
7.6.3 利用多元線性回歸預測房屋完成單位數量模型
7.6.4 利用正則化回歸預測房屋完成單位數量模型
7.7 本章小結
7.8 習題
第8章 分類分析
8.1 分類分析的基礎
8.1.1 二元分類和多元分類
8.1.2 分類的步驟
8.2 決策樹