Python數據分析快速上手

王靖、商艷紅、張洪波、盧軍

  • 出版商: 清華大學
  • 出版日期: 2024-02-01
  • 售價: $534
  • 貴賓價: 9.5$507
  • 語言: 簡體中文
  • ISBN: 7302651752
  • ISBN-13: 9787302651758
  • 相關分類: Data Science
  • 立即出貨 (庫存 < 3)

  • Python數據分析快速上手-preview-1
  • Python數據分析快速上手-preview-2
  • Python數據分析快速上手-preview-3
Python數據分析快速上手-preview-1

商品描述

《Python數據分析快速上手》通過通俗易懂的語言、豐富多彩的實例,詳細介紹了使用Python進行數據分析應該掌握的各方面技術。本書內容包括Python基礎,用NumPy進行數據計算,用Pandas進行數據分析,用SciPy進行數據分析,用Scikit-learn進行數據分析、數據預處理、數據可視化,用Matplotlib進行可視化等內容。本書示例豐富,所有涉及的程序代碼都給出了詳細的註釋,讀者可以輕松學習,快速提升開發技能。除此之外,本書還附配了教學視頻、PPT課件和全書示例源碼。 《Python數據分析快速上手》適合數據分析的初學者、職場人士和所有對數據分析感興趣的人員閱讀,也適合作為大中專院校相關專業的教學用書。

目錄大綱

目    錄

第1章  構建Python開發環境 1

1.1  理解數據分析 1

1.1.1  數據分析是什麽 1

1.1.2  數據分析的步驟 2

1.2  安裝Python及開發工具 3

1.2.1  安裝Python 3 3

1.2.2  安裝第三方開發工具 5

1.2.3  認識Python程序 5

1.3  Python語言基礎 6

1.3.1  初識Python語法 6

1.3.2  保留字與標識符 9

1.3.3  變量 10

1.3.4  基本數據類型 11

1.3.5  運算符 14

1.3.6  基本輸入與輸出 18

1.4  從文件中讀取數據 19

1.4.1  Python讀取CSV文件 19

1.4.2  Python讀取JSON文件 20

1.4.3  Python讀取數據庫文件 21

1.4.4  Python保存數據文件 22

1.5  本章小結 24

1.6  動手練習 24

第2章  控制語句 25

2.1  程序結構 25

2.2  選擇語句 26

2.2.1  if語句 26

2.2.2  if…else語句 26

2.2.3  if…elif…else語句 27

2.2.4  if語句的嵌套 28

2.3  條件表達式 29

2.4  循環語句 30

2.4.1  while循環 30

2.4.2  for循環 30

2.4.3  循環嵌套 32

2.5  跳轉語句 33

2.5.1  continue語句 33

2.5.2  break語句 34

2.6  pass語句 35

2.7  本章小結 35

2.8  動手練習 35

第3章  序列 37

3.1  序列概述 37

3.1.1  索引 37

3.1.2  切片 38

3.1.3  序列相加 38

3.1.4  乘法 39

3.1.5  檢查某個元素是不是序列的成員 39

3.1.6  計算序列的長度、最大值和最小值 40

3.2  列表 40

3.2.1  創建與刪除列表 40

3.2.2  訪問列表元素 42

3.2.3  遍歷列表 42

3.2.4  添加、修改和刪除列表元素 44

3.2.5  對列表進行統計和計算 46

3.2.6  對列表進行排序 47

3.2.7  列表推導式 49

3.2.8  二維列表的使用 51

3.3  元組 52

3.3.1  創建與刪除元組 52

3.3.2  訪問元組元素 54

3.3.3  修改元組元素 55

3.3.4  元組推導式 55

3.3.5  元組和列表的區別 56

3.4  字典 56

3.4.1  字典的創建與刪除 57

3.4.2  通過“鍵-值對”訪問字典 59

3.4.3  遍歷字典 60

3.4.4  添加、修改和刪除字典元素 60

3.4.5  字典推導式 61

3.5  集合 61

3.5.1  創建集合 62

3.5.2  添加和刪除集合元素 63

3.5.3  集合的交集、並集和差集運算 64

3.5.4  列表、元組、字典和集合的區別 65

3.6  本章小結 65

3.7  動手練習 66

第4章  函數 67

4.1  創建和調用函數 67

4.1.1  創建函數 67

4.1.2  調用函數 69

4.2  函數的參數 69

4.2.1  形式參數和實際參數 69

4.2.2  位置參數 71

4.2.3  關鍵字參數 71

4.2.4  為參數設置默認值 72

4.2.5  可變參數 74

4.2.6  Python中參數的總結 75

4.3  返回值 76

4.4  變量的作用域 78

4.4.1  局部變量 78

4.4.2  全局變量 78

4.5  匿名函數 78

4.6  程序模塊化 80

4.6.1  模塊概述 80

4.6.2  自定義模塊 80

4.6.3  模塊的搜索目錄 83

4.7  Python中的包 84

4.7.1  python程序的包結構 84

4.7.2  創建和使用包 84

4.8  引用其他模塊 87

4.8.1  導入和使用模塊標準 87

4.8.2  第三方模塊的下載與安裝 87

4.9  本章小結 89

4.10  動手練習 90

第5章  字符串及正則表達式 91

5.1  字符串的常用操作 91

5.1.1  拼接字符串 91

5.1.2  計算字符串長度 92

5.1.3  截取字符串 93

5.1.4  分割、合並字符串 94

5.1.5  檢索字符串 96

5.1.6  字符串大小寫轉換 98

5.1.7  去除字符串中的空格和特殊字符 99

5.2  字符串編碼轉換 101

5.2.1  encode()方法對字符串編碼 102

5.2.2  decode()方法對字符串解碼 103

5.3  正則表達式基礎 103

5.3.1  元字符 104

5.3.2  行定位符 108

5.3.3  字符類 108

5.3.4  排除字符 108

5.3.5  選擇字符 109

5.3.6  轉義字符 109

5.3.7  分組 109

5.3.8  正則表達式語法 110

5.4  re模塊 110

5.4.1  匹配字符串 110

5.4.2  替換字符串 112

5.4.3  分割字符串 113

5.5  本章小結 113

5.6  動手練習 114

第6章  用NumPy進行數據計算 115

6.1  安裝NumPy 115

6.2  NumPy數組 117

6.2.1  ndarray數組基礎及實例 118

6.2.2  矩陣 125

6.2.3  NumPy線性代數相關函數 126

6.3  NumPy函數 129

6.3.1  字符串函數及實例 129

6.3.2  數學函數及實例 134

6.3.3  算術函數 137

6.3.4  統計函數 140

6.3.5  排序條件篩選函數 146

6.4  本章小結 152

6.5  動手練習 152

第7章  用Pandas進行數據處理 153

7.1  安裝Pandas 153

7.2  Pandas數據結構 154

7.2.1  Pandas數據結構—Series 154

7.2.2  Pandas數據結構—DataFrame 157

7.3  Pandas數據清洗 161

7.3.1  清洗空值 162

7.3.2  清洗格式錯誤數據 166

7.3.3  清洗錯誤數據 167

7.3.4  清洗重復數據 168

7.4  本章小結 170

7.5  動手練習 170

第8章  用SciPy進行科學計算 171

8.1  安裝SciPy 171

8.2  SciPy數學模塊 172

8.2.1  SciPy常量模塊 172

8.2.2  SciPy優化模塊 175

8.2.3  SciPy稀疏矩陣模塊 177

8.2.4  SciPy圖結構 180

8.2.5  SciPy插值模塊 188

8.3  SciPy工程模塊 191

8.3.1  SciPy Matlab數組 192

8.3.2  Scipy 顯著性檢驗 195

8.4  本章小結 200

8.5  動手練習 200

第9章  Matplotlib數據可視化 202

9.1  安裝Matplotlib 202

9.2  Matplotlib繪圖基礎 202

9.2.1  Matplotlib Pyplot模塊 203

9.2.2  Matplotlib繪圖標記 210

9.2.3  Matplotlib繪制圖線 215

9.2.4  Matplotlib軸標簽和標題 219

9.3  Matplotlib網格線 222

9.4  Matplotlib繪制圖形 225

9.4.1  Matplotlib繪制多個子圖 225

9.4.2  Matplotlib 散點圖及實例 230

9.4.3  Matplotlib柱形圖 237

9.4.4  Matplotlib餅圖 241

9.5  本章小結 243

9.6  動手練習 244

第10章  用Scikit-learn進行數據分析 246

10.1  Scikit-learn簡介 246

10.1.1  安裝 Scikit-learn 246

10.1.2  機器學習和Scikit-learn庫 247

10.2  利用Scikit-learn進行數據分析的方法 248

10.2.1  決策樹(Decision Trees (DTs)) 248

10.2.2  支持向量機 253

10.2.3  樸素貝葉斯 258

10.3  聚類 260

10.3.1  概述 260

10.3.2  K-means 260

10.3.3  層次聚類 262

10.4  時間序列 266

10.4.1  時間序列概念 266

10.4.2  ARMA模型預測案例 266

10.5  主成分分析 274

10.5.1  主成分分析的概念 274

10.5.2  主成分分析案例 274

10.6  本章小結 279

10.7  動手練習 280

第11章  數據分析案例 281

11.1  案例1:IMDB電影數據分析 281

11.1.1  案例描述 281

11.1.2  準備數據 282

11.1.3  數據清洗 283

11.1.4  數據分析與數據可視化 283

11.1.5  思考練習 290

11.2  案例2:二手房房價預測分析 290

11.2.1  案例描述 290

11.2.2  系統設計 291

11.2.3  技術準備 292

11.2.4  二手房數據分析 294

11.2.5  案例小結 302