Python數據分析原理與應用

王華清

  • 出版商: 機械工業
  • 出版日期: 2025-11-01
  • 售價: $534
  • 語言: 簡體中文
  • 頁數: 331
  • ISBN: 7111793188
  • ISBN-13: 9787111793182
  • 相關分類: Python
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書以Python為工具,以“理論為基、實踐為用”為宗旨,系統構建從基礎到進階、從工具到場景的數據分析知識體系,旨在幫助讀者掌握數據驅動的思維方法,並將其轉化為解決實際問題的能力。全書共7章,數據分析概述;數據分析的重要工具:Python;Python數組及矩陣處理:基於NumPy;Python數據可視化:基於Matplotlib;Python數據挖掘:基於Pandas;Python符號計算:基於SymPy;Python科學計算:基於SciPy。通過本書的學習,讀者將掌握數據分析的核心概念、技術與工具,能夠運用Python高效處理和分析數據,挖掘有價值的信息以支持決策和創新。同時,也能培養解決實際問題的能力,通過豐富的案例將理論知識應用於商業、科研等領域,積累實踐經驗。本書可作為高等院校人工智能類專業、大數據管理與應用專業及其他數據分析類專業的教材,也適合數據工程師、科學家、研究人員,以及對數據分析感興趣的讀者閱讀。

目錄大綱

前言
 
第1章  數據分析概述1
1.1  數據的含義及特征1
1.1.1  數據的基本含義1
1.1.2  數據的基本類型1
1.1.3  數據的基本特征2
1.2  數據分析思維3
1.3  數據分析的層次4
1.4  數據分析的流程與方法5
1.5  練習題6
第2章  數據分析的重要工具:
Python7
2.1  Python數據分析概述7
2.1.1  Python特點7
2.1.2  Python與其他數據分析工具的
對比7
2.1.3  Python數據分析常用庫8
2.2  Python數據分析環境配置9
2.2.1  Anaconda的安裝9
2.2.2  Anaconda的使用13
2.3  Python語言基礎15
2.3.1  Python語言中標識符與變量
賦值15
2.3.2  Python 語言的語法規範17
2.3.3  Python語言的數據結構18
2.3.4  Python語言的分支結構22
2.3.5  Python語言的循環結構24
2.3.6  Python語言的函數27
2.3.7  Python語言的類與實例28
2.4  Jupyter Notebook應用基礎32
2.4.1  Jupyter Notebook的安裝與
運行32
2.4.2  Jupyter Notebook的主界面及
工作目錄的設置34
2.4.3  Jupyter Notebook主界面功能
介紹35
2.4.4  Jupyter Notebook編輯界面功能
介紹36
2.4.5  魔法命令的使用37
2.5  練習題38
第3章  Python數組及矩陣處理:
基於NumPy40
3.1  NumPy簡介40
3.2  建立數組41
3.2.1  什麼是數組41
3.2.2  數據的類型42
3.2.3  數組的創建43
3.2.4  數組的屬性48
3.2.5  數組的覆制50
3.2.6  數組的存取51
3.3  數組操作57
3.3.1  數組的變形57
3.3.2  數組的拼接59
3.3.3  數組的分割62
3.3.4  數組的索引64
3.3.5  數組的切片66
3.3.6  替換數組值68
3.3.7  刪除行或列71
3.3.8  插入行或列72
3.4  數組運算74
3.4.1  數組的廣播原理74
3.4.2  數組的四則運算77
3.4.3  數組的覆合運算79
3.4.4  數組的邏輯運算81
3.4.5  數組的集合運算89
3.4.6  數組的數值排序93
3.5  通用函數100
3.5.1  初等函數100
3.5.2  隨機函數105
3.5.3  統計函數111
3.5.4  修約函數121
3.6  線性代數運算123
3.6.1  數組行列變換123
3.6.2  數組的行列式124
3.6.3  矩陣的乘積128
3.6.4  矩陣的秩和逆矩陣131
3.6.5  特征值和特征向量133
3.6.6  解線性方程組134
3.6.7  特征值分解135
3.7  案例:電影推薦分析138
3.7.1  問題理解140
3.7.2  數據探索140
3.7.3  代碼實現143
3.8  練習題144
第4章  Python數據可視化:基於
Matplotlib150
4.1  Matplotlib簡介150
4.1.1  Matplotlib的導入150
4.1.2  畫布與坐標軸設置150
4.1.3  顏色與線型的設置155
4.1.4  中文與負號顯示設置157
4.2  基本繪圖函數159
4.2.1  plot函數159
4.2.2  grid函數160
4.2.3  axhline函數162
4.2.4  axvspan函數164
4.2.5  annotate函數165
4.2.6  text函數167
4.2.7  title函數168
4.2.8  legend函數170
4.2.9  table函數172
4.3  繪制二維圖174
4.3.1  繪制柱狀圖174
4.3.2  繪制散點圖176
4.3.3  繪制直方圖178
4.3.4  繪制餅圖180
4.3.5  繪制棉棒圖181
4.3.6  繪制箱線圖183
4.3.7  繪制誤差棒圖186
4.3.8  繪制極坐標圖188
4.3.9  繪制多子圖190
4.4  繪制三維圖195
4.4.1  繪制三維柱狀圖196
4.4.2  繪制三維散點圖198
4.4.3  繪制三維折線圖200
4.4.4  繪制三維曲面圖202
4.4.5  繪制三維矢量圖204
4.5  數據可視化進階205
4.5.1  繪制動態圖205
4.5.2  響應鼠標事件207
4.5.3  圖像藝術處理209
4.6  案例:在線商品瀏覽量與
銷售量的可視化分析216
4.6.1  問題理解216
4.6.2  數據探索216
4.6.3  代碼實現224
4.7  練習題227
第5章  Python數據挖掘:基於
Pandas230
5.1  Pandas簡介230
5.2  Series基本操作231
5.2.1  Series的創建231
5.2.2  Series的索引操作232
5.2.3  Series的修改操作232
5.2.4  Series的刪除操作233
5.3  DataFrame的基本操作234
5.3.1  創建DataFrame235
5.3.2  DataFrame數據的檢索236
5.3.3  修改DataFrame數據237
5.3.4  刪除DataFrame數據238
5.3.5  DataFrame合並數據238
5.3.6  排序與排名242
5.3.7  重置行的索引或標簽244
5.3.8  多層級索引245
5.3.9  算術運算與廣播原理246
5.4  數據的讀寫247
5.4.1  CSV文件的讀寫247
5.4.2  Excel文件的讀寫249
5.4.3  其他文件的讀寫251
5.4.4  其他操作技巧253
5.5  數據預處理255
5.5.1  重覆值的處理256
5.5.2  缺失值的處理258
5.5.3  數據標準化259
5.6  數據分析260
5.6.1  描述性統計260
5.6.2  分組分析261
5.6.3  歸類統計262
5.6.4  交叉分析263
5.6.5  相關分析265
5.7  案例:電商平臺訂單數據
分析266
5.8  練習題276
第6章  Python符號計算:基於
SymPy279
6.1  SymPy簡介279
6.2  定義符號280
6.2.1  常規方式定義符號280
6.2.2  序列方式定義符號281
6.2.3  定義符號函數281
6.3  表達式282
6.3.1  表達式操作282
6.3.2  替換與求值284
6.4  微積分運算284
6.4.1  極限運算285
6.4.2  微分運算285
6.4.3  積分運算286
6.4.4  級數展開287
6.5  SymPy繪圖288
6.5.1  二維繪圖288
6.5.2  參數方程繪圖290
6.5.3  隱式方程繪圖291
6.5.4  三維繪圖291
6.6  練習題293
第7章  Python科學計算:基於
SciPy296
7.1  概述296
7.2  優化問題297
7.2.1  優化問題的分類297
7.2.2  單變量優化298
7.2.3  無約束的多變量優化301
7.2.4  非線性最小二乘問題306
7.2.5  有約束的優化問題307
7.3  插值處理311
7.3.1  概述311
7.3.2  應用場景312
7.3.3  多項式函數和類313
7.3.4  多項式插值316
7.3.5  樣條插值319
7.3.6  多變量插值321
7.4  練習題326