Python數據分析基礎教程(微課版)(第2版)

鄭丹青

  • 出版商: 人民郵電
  • 出版日期: 2025-06-01
  • 售價: $359
  • 語言: 簡體中文
  • ISBN: 7115657238
  • ISBN-13: 9787115657237
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

  • Python數據分析基礎教程(微課版)(第2版)-preview-1
  • Python數據分析基礎教程(微課版)(第2版)-preview-2
Python數據分析基礎教程(微課版)(第2版)-preview-1

相關主題

商品描述

本書詳細講解Python數據分析的相關內容,共10章,第1~9章分別講解數據分析概述、Python與數據分析、Python基礎、NumPy數組與矢量計算、用NumPy進行簡單的統計分析、數據可視化工具——Matplotlib、pandas數據分析基礎、用pandas進行數據預處理、機器學習庫scikit-learn入門;第10章用一個綜合案例——電影數據分析項目,帶領讀者靈活掌握本書所講內容。

本書可作為高等教育本、專科院校計算機相關專業的教材,也可作為Python數據分析愛好者的自學參考書。

作者簡介

鄭丹青,教授、高級工程師,湖南省計算機應用技術省級專業帶頭人,具有多年的計算機教學工作經驗,有著近20年的企業軟件項目開發經驗,獲得過株洲市科委的獎勵。

目錄大綱

第 1章 數據分析概述 1

1.1 數據 1

1.1.1 數據的概念 1

1.1.2 數據的類型 2

1.2 數據分析 2

1.2.1 數據分析的概念 2

1.2.2 數據分析的過程 3

1.2.3 數據分析的作用 5

1.2.4 數據分析的常用工具 6

本章小結 6

思考練習 7

第 2章 Python與數據分析 8

2.1 Python簡介 8

2.1.1 Python的特點 8

2.1.2 Python解釋器 9

2.2 Python與數據分析的關系 9

2.3 Python數據分析常用的庫 10

2.4 Python開發環境的搭建 11

2.5 Python集成開發環境的搭建 13

2.5.1 PyCharm的安裝與使用 13

2.5.2 Jupyter Notebook的安裝與使用 17

項目實踐 23

本章小結 24

思考練習 24

第3章 Python基礎 25

3.1 Python的基礎語法 25

3.1.1 Python的語法規則 25

3.1.2 常量、變量與標準數據類型 29

3.1.3 編寫Python程序 30

3.2 Python的數據類型 31

3.2.1 數字 31

3.2.2 字符串 32

3.2.3 Python的數據結構 36

3.2.4 列表 36

3.2.5 元組 41

3.2.6 字典 44

3.2.7 集合 49

3.3 Python的流程控制語句 51

3.3.1 if語句 51

3.3.2 while語句 52

3.3.3 for語句 53

3.3.4 range()函數的作用 54

3.3.5 break、continue、pass語句 55

3.4 Python的函數 56

3.4.1 自定義函數 56

3.4.2 設置函數參數 56

3.4.3 函數返回值 58

3.4.4 調用自定義函數 58

3.4.5 局部變量和全局變量 58

3.4.6 函數嵌套 60

3.4.7 匿名函數 61

項目實踐 61

本章小結 63

思考練習 63

第4章 NumPy數組與矢量運算 65

4.1 NumPy概述 65

4.1.1 NumPy簡介 65

4.1.2 NumPy的測試與安裝 66

4.1.3 SciPy簡介及其測試與安裝 67

4.1.4 NumPy的簡單應用:一維數組

相加 68

4.2 NumPy數組 69

4.2.1 創建數組 69

4.2.2 選取數組元素 70

4.2.3 數組的屬性 70

4.2.4 創建數組的其他方法 71

4.2.5 NumPy的數據類型 72

4.3 NumPy數組操作 73

4.3.1 數組的索引和切片 74

4.3.2 修改數組形狀 76

4.3.3 數組的展平 77

4.3.4 數組的轉置和軸對換 78

4.3.5 數組的連接 79

4.3.6 數組的分割 80

4.3.7 數組轉換 81

4.3.8 添加/刪除數組元素 81

4.4 NumPy數組的矢量運算 83

4.4.1 數組的運算 83

4.4.2 通用函數 85

4.5 NumPy矩陣的創建、運算及操作 87

4.6 隨機數的生成 89

項目實踐 91

本章小結 92

思考練習 92

第5章 用NumPy進行簡單的統計

分析 94

5.1 文件讀寫操作 94

5.1.1 使用NumPy讀寫文本文件 94

5.1.2 使用NumPy讀寫二進制文件 96

5.1.3 使用NumPy讀寫多維數據

文件 97

5.2 NumPy常用的統計函數 97

5.3 使用NumPy函數進行統計分析 102

5.3.1 NumPy的排序函數 102

5.3.2 NumPy的去重函數與重復函數 103

5.3.3 NumPy的搜索函數和計數函數 105

5.4 簡單的統計分析 106

項目實踐 109

本章小結 110

思考練習 110

第6章 數據可視化工具——

Matplotlib 112

6.1 Matplotlib概述 112

6.1.1 Matplotlib簡介 112

6.1.2 Matplotlib的測試、安裝與

導入 113

6.2 使用pyplot創建圖表 114

6.2.1 創建簡單的圖表 114

6.2.2 創建子圖 118

6.3 Matplotlib參數配置 119

6.3.1 matplotlibrc配置文件 119

6.3.2 設置動態rc參數 120

6.4 分析變量間關系 121

6.4.1 繪制散點圖 121

6.4.2 繪制折線圖 123

6.5 分析變量數據分布和分散狀況 125

6.5.1 繪制直方圖 125

6.5.2 繪制柱形圖 127

6.5.3 繪制餅圖 129

6.5.4 繪制箱線圖 131

項目實踐 132

本章小結 134

思考練習 135

第7章 pandas數據分析基礎 136

7.1 pandas概述 136

7.1.1 pandas簡介 136

7.1.2 pandas的測試、安裝與導入 137

7.2 pandas的數據結構及常用操作 138

7.2.1 Series對象及常用操作 138

7.2.2 DataFrame對象及常用操作 142

7.3 pandas的索引 149

7.3.1 Index對象 149

7.3.2 Index對象的屬性和方法 150

7.3.3 重新索引 152

7.3.4 層級索引 153

7.4 pandas數據結構之間的運算 156

7.4.1 算術運算和數據對齊 156

7.4.2 算術運算函數 158

7.4.3 DataFrame與Series對象之間的

運算 158

7.5 pandas的函數應用 159

7.5.1 數據篩選函數 159

7.5.2 apply()函數 160

7.5.3 統計函數 161

7.5.4 DataFrame格式化函數 162

7.5.5 排序和排名 162

7.6 數據的讀取與寫入 164

7.6.1 讀寫文本文件 164

7.6.2 讀寫Excel文件 166

7.6.3 讀寫數據庫文件 168

7.6.4 讀寫JSON文件 170

7.7 數據分析方法 171

7.7.1 描述性統計分析 172

7.7.2 分組分析 172

7.7.3 分布分析 173

7.7.4 交叉分析 174

7.7.5 結構分析 177

7.7.6 相關分析 178

項目實踐 179

本章小結 180

思考練習 180

第8章 用pandas進行數據

預處理 181

8.1 數據清洗 181

8.1.1 重復值的處理 181

8.1.2 缺失值的處理 182

8.1.3 異常值的處理 185

8.2 數據合並 187

8.2.1 按鍵合並數據 187

8.2.2 沿軸連接數據 189

8.2.3 合並重疊數據 192

8.3 數據抽取 193

8.3.1 字段抽取與拆分 193

8.3.2 記錄抽取 195

8.4 重塑層級索引 195

8.5 映射與數據處理 197

8.5.1 用映射替換元素 197

8.5.2 用映射添加元素 198

8.5.3 重命名軸索引 199

8.6 排列與隨機抽樣 200

8.7 日期轉換、日期格式化和日期

抽取 201

8.8 字符串處理 202

8.8.1 內置的字符串處理方法 203

8.8.2 正則表達式 205

8.8.3 矢量化的字符串函數 209

項目實踐 211

本章小結 212

思考練習 213

第9章 機器學習庫scikit-learn

入門 214

9.1 機器學習概述 214

9.2 scikit-learn概述 216

9.2.1 scikit-learn簡介 216

9.2.2 scikit-learn的測試、安裝和

導入 217

9.3 第 一個機器學習程序 218

9.4 使用scikit-learn進行機器

學習 219

9.4.1 Seaborn繪圖 219

9.4.2 準備數據集 224

9.4.3 選擇模型 229

9.4.4 調整參數並訓練和測試模型 232

項目實踐 235

本章小結 237

思考練習 237

第 10章 電影數據分析項目 239

10.1 項目描述 239

10.2 準備數據 240

10.3 數據清洗 241

10.4 數據分析與數據可視化 241

本章小結 247

思考練習 247

參考文獻 248