Python數據處理、分析與可視化

陳承歡,李天霞,徐嘉憶

  • 出版商: 電子工業
  • 出版日期: 2026-01-01
  • 售價: $359
  • 語言: 簡體中文
  • 頁數: 324
  • ISBN: 7121483114
  • ISBN-13: 9787121483110
  • 相關分類: Python
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書采用案例和理論相結合的形式,以Anaconda和PyCharm為開發工具,系統地重點闡述了利用Python進行數據預處理、分析與可視化等相關知識,講解了Python各種數據處理展示的函數方法的使用方法。全書共有6章,分別是數據分析概述、Python基礎、利用Pandas進行數據預處理、利用Pandas進行數據分析、利用Matplotlib進行數據可視化、Python數據分析與綜合應用。書中安排了思維導圖、學習目標、知識指南、任務實訓、結果分析、鞏固訓練、每章測試等模塊。本書既可以作為本科和高職院校各專業數據分析相關課程的教材,也可以作為企業電子商務、市場營銷、數據分析人員的參考資料。

目錄大綱

目 錄
模塊1 認知數據分析與構建編程環境
【知識探析與技能訓練】
1.1 初識數據分析
1.1.1 數據分析定義
1.1.2 數據分析在企業經營決策中的主要作用
1.1.3 常用數據分析方法
1.1.4 常用數據分析工具與類庫
1.1.5 數據分析過程中常見的數據問題
1.1.6 數據分析的過程
1.2 認知數據可視化
1.3 熟悉與準備數據分析的編程環境
1.3.1 熟悉與使用Python 的交互式編程環境
1.3.2 熟悉與使用Jupyter Notebook 集成開發環境
【任務實戰】
【任務1-1】在Jupyter Notebook 開發環境中打開並運行Python程序t1-01.ipynb
【任務1-2】在Jupyter Notebook 開發環境中打開並運行Python程序t1-02.ipynb
【在線考核】
模塊2 Python及其應用
【知識探析與技能訓練】
2.1 Python的編碼規範與命名要求
2.2 Python轉義字符與註釋
2.2.1 Python轉義字符
2.2.2 Python程序的註釋
2.3 Python數據類型及其應用
2.3.1 Python 的數值類型
2.3.2 Python 字符串操作與計算
2.3.3 Python 列表創建與應用
2.3.4 Python 元組的創建與應用
2.3.5 Python 字典創建與應用
2.3.6 Python 集合創建與應用
2.3.7 Python 數據類型的轉換
2.4 Python 運算符及其應用
2.4.1 Python 算術運算符與算術表達式
2.4.2 Python 賦值運算符與變量定義
2.4.3 Python 比較運算符與比較表達式
2.4.4 Python 邏輯運算符與邏輯表達式
2.4.5 Python 成員運算符
2.4.6 Python 運算符優先級
2.5 Python 基本結構及應用
2.5.1 順序結構與流程控制
2.5.2 Python 選擇結構及其應用
2.5.3 for 循環語句及其應用
2.5.4 while 循環語句及其應用
2.5.5 Python 循環結構中的跳轉語句
2.6 Python 常用內置函數及應用
2.6.1 Python 數學函數及應用
2.6.2 Python 輸入輸出函數及應用
2.6.3 Python 日期時間函數
2.7 Python 函數定義及應用
2.7.1 定義Python 函數
2.7.2 調用Python 函數
2.8 創建與導入Python 模塊
2.8.1 創建Python 模塊
2.8.2 導入Python 模塊
2.8.3 下載與安裝第三方模塊
2.9 創建與使用Python 包
【任務實戰】
【任務2-1】計算與輸出購買商品的優惠金額與應付金額
【任務2-2】自定義與應用實現要求功能的函數
【在線考核】
模塊3 NumPy 及其應用
【知識探析與技能訓練】
3.1 初識NumPy
3.1.1 NumPy 概述
3.1.2 安裝NumPy
3.2 使用多種方法創建NumPy 數組對象
3.2.1 初識ndarray 對象
3.2.2 熟悉與使用NumPy 數據類型
3.2.3 創建NumPy 一維數組對象
3.2.4 創建NumPy 二維數組對象
3.2.5 創建NumPy 多維數組對象
3.2.6 創建NumPy 區間數組對象
3.3 使用NumPy 對象ndarray 的屬性
3.3.1 使用size 屬性和dtype 屬性
3.3.2 使用shape 屬性
3.3.3 使用ndim 屬性
3.3.4 使用itemsize 屬性
3.3.5 使用nbytes 屬性
3.4 NumPy 數組對象基本操作
3.4.1 NumPy 數組索引與切片
3.4.2 NumPy 副本和視圖3
3.4.3 NumPy 數組高級索引
3.4.4 NumPy 數組遍歷
3.4.5 NumPy 數組變維操作
3.4.6 NumPy 數組轉置操作
3.4.7 連接與分割NumPy 數組操作
3.4.8 NumPy 數組元素增刪改查操作
3.4.9 NumPy 字符串處理
3.5 NumPy 數組算術運算與矩陣乘法
3.5.1 NumPy 數組廣播機制
3.5.2 NumPy 數組的算術運算
3.5.3 NumPy 數組的矩陣乘法運算
3.6 NumPy 統計計算與分析
3.6.1 NumPy 統計計算
3.6.2 NumPy 數組線性代數計算
3.6.3 NumPy 數組排序
3.6.4 NumPy 數組搜索
3.6.5 刪除NumPy 數組中的重復值
3.7 使用NumPy 讀寫文件
3.7.1 常見的數據文件格式
3.7.2 使用loadtxt()和savetxt()函數讀寫TXT 或CSV 文件
3.7.3 使用load()和save()函數讀寫NPY 或NPZ 文件
3.7.4 使用h5py 讀寫HDF5 文件
3.7.5 使用NumPy 的genfromtxt()函數從文本文件中讀取數據
【任務實戰】
【任務3-1】統計分析糧食播種面積和糧食產量數據
【在線考核】
模塊4 Pandas 數據結構與操作應用
【知識探析與技能訓練】
4.1 初識Pandas1
4.2 熟悉Pandas 的Series 結構
4.2.1 創建Series 對象
4.2.2 訪問Series 數據
4.2.3 使用Series 常用屬性
4.2.4 使用Series 常用方法與函數
4.3 熟悉Pandas 的DataFrame 結構
4.3.1 創建DataFrame 對象
4.3.2 使用列索引操作DataFrame
4.3.3 使用行索引操作DataFrame
4.3.4 使用DataFrame 的常用屬性和方法
4.4 Pandas 創建與操作索引
4.4.1 創建Pandas 的索引對象
4.4.2 獲取Pandas 的索引對象
4.4.3 熟知Pandas 索引對象的特性
4.4.4 Pandas 索引設置
4.5 Pandas 基本操作
4.5.1 Pandas 數據顯示格式設置
4.5.2 Pandas 字符串操作
4.5.3 Pandas 遍歷操作
4.5.4 Pandas 排序操作
4.5.5 Pandas 的元素值排名(rank)操作
4.5.6 Pandas 數據類型轉換
4.5.7 創建與使用Pandas 分類對象
4.6 Pandas 數據篩選
4.6.1 Series 對象的元素篩選
4.6.2 DataFrame 對象的元素篩選
4.7 Pandas 創建與操作多層索引
4.7.1 創建多層索引
4.7.2 多層索引操作
4.8 Pandas 讀寫文件中的數據
4.8.1 Pandas 讀取Excel 文件中的數據
4.8.2 使用to_excel()函數將DataFrame 中的數據寫入Excel 文件
4.8.3 Pandas 讀取CSV 文件中的數據
4.8.4 將DataFrame 數據寫入CSV 文件
4.8.5 Pandas 讀取JSON 文件中的數據
4.8.6 Pandas 讀取MySQL 數據庫中的數據
4.8.7 將DataFrame 中的數據存儲到MySQL 數據庫中
【任務實戰】
【任務4-1】藥品銷量數據導入與審閱
【在線考核】
模塊5 Pandas 數據預處理
【知識探析與技能訓練】
5.1 Pandas 數據清洗
5.1.1 Pandas 缺失值處理
5.1.2 Pandas 清洗無效數據
5.1.3 Pandas 重復值檢測與處理
5.1.4 Pandas 異常值檢測與處理
5.1.5 Pandas 刪除數據集中指定行或列的數據
5.2 Pandas 數據合並
5.2.1 使用merge()函數通過主鍵合並數據
5.2.2 使用join()函數通過索引或指定列合並數據
5.2.3 使用concat()函數沿軸連接數據
5.2.4 使用append()函數縱向連接DataFrame 對象
5.2.5 使用combine_first()函數合並重疊數據
5.3 Pandas 數據抽取
5.3.1 字段抽取
5.3.2 字段拆分
5.3.3 數據記錄抽取
5.3.4 日期轉換與日期抽取
5.4 Pandas 數據重塑
5.4.1 重塑層次化索引
5.4.2 使用pivot()函數實現軸向旋轉
5.4.3 使用melt()函數將DataFrame 從寬格式轉換為長格式
5.4.4 使用pivot_table()函數聚合與透視數據
5.4.5 使用crosstab()函數交叉分析頻數
5.5 Pandas 數據變換
5.5.1 重命名索引的標簽名稱
5.5.2 離散化連續數據
【任務實戰】
【任務5-1】藥品銷量數據預處理
【在線考核】
模塊6 Pandas 數據運算與統計分析
【知識探析與技能訓練】
6.1 Pandas 數據運算
6.1.1 Series 對象的運算
6.1.2 DataFrame 對象的運算
6.1.3 DataFrame 對象與Series 對象之間的運算
6.2 Pandas 統計分析
6.2.1 Pandas 數據分析的基本方法
6.2.2 Pandas 的統計函數及其應用
6.2.3 Pandas 窗口函數及其應用
6.2.4 Pandas 聚合函數及應用
6.2.5 Pandas 格式化函數及其應用
6.3 Pandas 數據聚合與分組運算
6.3.1 Pandas 數據分組
6.3.2 Pandas 數據聚合
6.3.3 Pandas 分組的轉換操作
6.3.4 Pandas 分組的數據過濾操作
【任務實戰】
【任務6-1】藥品銷量數據的統計與分析
【在線考核】
模塊7 Matplotlib 與數據可視化分析
【知識探析與技能訓練】
7.1 初識Matplotlib
7.1.1 Matplotlib 概述
7.1.2 認知Matplotlib 的Pyplot 模塊
7.1.3 使用Matplotlib 繪制圖形時實現中文顯示
7.1.4 熟悉Pyplot 模塊的plot()函數
7.1.5 使用plot()函數繪制圖形時設置輔助元素
7.2 應用Pyplot 模塊的函數繪制圖形
7.2.1 使用Pyplot 模塊的plot()函數繪制線性函數圖形與波形圖
7.2.2 使用Pyplot 模塊的plot()函數繪制折線圖
7.2.3 使用Pyplot 模塊的bar()函數繪制柱形圖
7.2.4 使用Pyplot 模塊的barh()函數繪制條形圖
7.2.5 使用Pyplot 模塊的scatter()函數繪制散點圖
7.2.6 使用Pyplot 模塊的pie()函數繪制餅圖
7.3 使用Pandas 的plot()方法繪制圖形
7.3.1 使用Series 對象的plot()方法繪制圖形
7.3.2 使用DataFrame 對象的plot()方法繪制圖形
【任務實戰】
【任務7-1】藥品銷量數據可視化展示與分析
【在線考核】
參考文獻