Python數據分析

唐新宇,劉興建

  • 出版商: 電子工業
  • 出版日期: 2025-03-01
  • 售價: $294
  • 語言: 簡體中文
  • 頁數: 280
  • ISBN: 7121479389
  • ISBN-13: 9787121479380
  • 相關分類: Python
  • 下單後立即進貨 (約4週~6週)

商品描述

本書基於Python 3.13.0,以項目教學的方式,循序漸進地講解Python 數據分析的基本原理和具體應用的方法與技巧。全書分為6個項目,具體內容為Python數據分析基礎、NumPy數據探索和預處理、Pandas數據處理與分析、Matplotlib 數據可視化、SciPy統計推斷與探索性分析、Scikit-learn庫模型與數據預處理。本書實例豐富、內容翔實、操作方法簡單易學,不僅適合作為職業院校計算機與軟件工程相關專業的教材,還可供從事數據分析相關工作的專業人士參考。

目錄大綱

項目一 Python數據分析基礎 1
任務一 認識Python數據分析工具 1
一、Python簡介 2
二、Python 內置函數 6
三、下載和安裝Python 7
四、安裝Python庫 11
任務二 PyCharm集成開發環境 13
一、下載和安裝 PyCharm 13
二、新建PyCharm項目文件 17
三、新建PyCharm文件 19
四、PyCharm的編輯環境 19
五、PyCharm加載和導入模塊 22
任務三 Python 數據類型 28
一、數據類型 28
二、輸入 / 輸出函數 32
三、運算符和基本數學函數 34
四、數據疊代輸出 37
五、數據類型的轉換 37
六、函數定義 40
任務四 Python 流程控制 41
一、表達式語句 42
二、順序結構 43
三、選擇結構 44
四、循環結構 47
五、條件表達式 48
六、流程控制命令 49
七、程序調試 50
項目思維導圖 52
項目實操 52
實操一 用戶輸入並計算兩數之和 52
實操二 打印正整數的階乘 53
項目二 NumPy數據探索和預處理 54
任務一 NumPy數組操作 55
一、數組的數據類型 55
二、創建數組 58
三、數組的屬性 62
四、數組的索引 63
任務二 NumPy數組運算 67
一、數值數組 67
二、數組的數學運算 72
三、深拷貝和淺拷貝 75
任務三 數據加載、統計與預處理 76
一、數據加載 76
二、數據統計 79
三、數據歸一化和標準化 81
項目總結 85
項目實操 86
實操一 某市超市月度銷售數據統計 86
實操二 分析城市PM2.5監測數據 88
項目三 Pandas數據處理與分析 91
任務一 Pandas數據采集 92
一、Series 對象 93
二、DataFrame 對象 97
三、電子表格文件 101
四、文本文件 106
五、數據集文件 108
任務二 Pandas 數據預處理與探索 112
一、數據清洗 112
二、數據轉換 121
三、數據合並 123
四、數據提取 125
五、數據分類 128
六、數據排序 129
七、統計分組 133
任務三 Pandas 描述性統計分析 137
一、集中趨勢分析 138
二、離散程度分析 139
三、相關性分析 140
四、頻數分析 142
項目總結 143
項目實操 143
實操一 各城市房源數據分析 143
實操二 航班乘客數據分析 147
項目四 Matplotlib數據可視化 151
任務一 認識圖表窗口 152
一、圖表的基本組成 152
二、創建圖形窗口 153
三、繪制折線圖 154
四、創建子圖 158
任務二 圖表通用屬性設置 160
一、圖表屬性參數 161
二、坐標系設置 162
三、圖形標註 165
任務三 核心繪圖函數 176
一、柱形圖 176
二、直方圖 179
三、餅圖 181
四、散點圖 183
五、面積圖 185
六、箱形圖 186
七、雷達圖 188
項目總結 189
項目實操 190
實操一 體檢數據可視化分析 190
實操二 人口統計數據可視化 192
項目五 SciPy統計推斷與探索性分析 194
任務一 相關性分析 195
一、正態分布的相關分析 196
二、非正態分布的相關分析 198
任務二 卡方檢驗 200
一、正態性檢驗 200
二、方差齊性檢驗 205
三、擬合優度卡方檢驗 206
任務三 t檢驗 207
一、單樣本t檢驗 208
二、獨立樣本t檢驗 209
三、配對樣本t檢驗 211
任務四 方差分析 213
一、單因素方差分析 213
二、多因素方差分析 214
項目總結 216
項目實操 216
實操一 遺失的信件數據分析 216
實操二 血液黏稠度影響因素分析 218
項目六 Scikit-learn庫模型與數據預處理 221
任務一 Scikit-learn庫數據集 221
一、數據集加載 222
二、UCI機器學習庫 225
三、數據集劃分 227
任務二 數據預處理 228
一、處理異常值 228
二、特征離散化 233
三、特征選擇 236
四、特征編碼 241
五、特征縮放 245
任務三 分類算法 248
一、生成分類數據集 248
二、分類算法模型 249
三、二進制編碼 251
四、評估分類模型的性能 253
任務四 回歸算法 256
一、生成回歸數據集 256
二、普通回歸模型 258
三、多項式回歸模型 262
項目總結 264
項目實操 264
實操一 葡萄酒數據集預處理分析 264