Python 數據分析與機器學習 (微課視頻版)

楊年華

  • 出版商: 清華大學
  • 出版日期: 2023-01-01
  • 定價: $660
  • 售價: 8.5$561
  • 語言: 簡體中文
  • ISBN: 7302611513
  • ISBN-13: 9787302611516
  • 相關分類: Data ScienceMachine Learning
  • 下單後立即進貨 (約4週~6週)

  • Python 數據分析與機器學習 (微課視頻版)-preview-1
  • Python 數據分析與機器學習 (微課視頻版)-preview-2
  • Python 數據分析與機器學習 (微課視頻版)-preview-3
Python 數據分析與機器學習 (微課視頻版)-preview-1

買這商品的人也買了...

商品描述

本書首先簡要介紹Python語言的基礎知識,為後續內容的學習提供基礎,接著介紹NumPy、Matplotlib和Pandas三個數據分析基礎模塊的用法,同時也為後面基於scikitlearn的機器學習提供基礎,最後介紹基於scikitlearn機器學習及其模型的評價方法、超參數調優方法。全書通過大量案例,希望能讓讀者快速提高實踐能力。 本書適合作為高校本科生或研究生數據分析、機器學習等相關課程的教材或參考書,也可作為數據分析和機器學習愛好者的自學教程,還可以作為相關科研工作者與工程實踐者的參考書。

目錄大綱

 

 

目錄

 

 

源碼下載

 

 

第1章Python語言與開發環境概述

 

1.1Python語言的特點

 

1.2Python的下載與安裝

 

1.3開始使用Python

 

1.3.1交互方式

 

1.3.2代碼文件方式

 

1.3.3代碼文件的打開

 

1.3.4代碼風格

 

1.4模塊與庫

 

1.4.1模塊及其導入方式

 

1.4.2標準模塊與第三方模塊

 

1.5使用幫助

 

1.6Anaconda簡介

 

1.6.1Anaconda模塊的安裝

 

1.6.2Spyder的使用

 

1.6.3Jupyter Notebook的使用

 

1.6.4Jupyter Notebook默認路徑的設置

 

1.6.5任意路徑下創建Jupyter Notebook文件

 

習題1

 

第2章Python語言基礎

 

2.1控制台的輸入與輸出

 

2.1.1數據的輸入

 

2.1.2數據的輸出

 

2.2標識符、變量與賦值語句

 

2.2.1標識符

 

2.2.2變量

 

2.2.3賦值語句

 

2.3常用數據類型

 

2.3.1數值類型

 

2.3.2布爾類型

 

2.3.3常用序列類型

 

2.3.4映射類型

 

2.3.5集合類型

 

2.4運算符與表達式

 

 

 

 

 

2.4.1運算符分類

 

2.4.2運算規則與表達式

 

2.4.3條件表達式

 

2.4.4復合賦值運算符

 

2.5分支結構

 

2.5.1單分支if語句

 

2.5.2雙分支if/else語句

 

2.5.3多分支if/elif/else語句

 

2.5.4分支結構的嵌套

 

2.5.5分支結構的三元運算

 

2.5.6match/case分支結構

 

2.6循環結構

 

2.6.1簡單的while循環結構

 

2.6.2簡單的for循環結構

 

2.6.3break語句和continue語句

 

2.6.4循環的嵌套

 

2.7常用組合類型

 

2.7.1列表

 

2.7.2元組

 

2.7.3列表與元組之間的相互生成

 

2.7.4字符串

 

2.7.5字典

 

2.7.6集合

 

2.7.7推導式

 

2.7.8常用的內置函數

 

2.8正則表達式

 

習題2

 

第3章函數

 

3.1函數的定義

 

3.2函數的調用

 

3.3形參與實參

 

3.4函數的返回

 

3.5位置參數與關鍵參數

 

3.6默認參數

 

3.7個數可變的參數

 

3.7.1以組合對象為形參接收多個實參

 

3.7.2以組合對象為實參給多個形參分配參數

 

3.7.3形參和實參均為組合類型

 

3.8參數與返回值類型註解

 

3.9lambda表達式

 

3.10函數式編程的常用類與函數

 

習題3

 

第4章自定義類與對象

 

4.1Python中的對象與方法

 

4.2類的定義與對象的創建

 

4.3類的繼承

 

4.3.1父類與子類

 

4.3.2繼承的語法

 

4.3.3子類繼承父類的屬性

 

4.3.4子類繼承父類的方法

 

習題4

 

第5章NumPy數據處理基礎

 

5.1數據結構

 

5.1.1利用numpy.array()函數創建數組

 

5.1.2訪問數組對象屬性

 

5.1.3數組對象的類型

 

5.1.4創建常用數組

 

5.2數據準備

 

5.2.1隨機數的生成

 

5.2.2NumPy數組在文本文件中的存取

 

5.3常用數組運算與函數

 

5.3.1數組的索引

 

5.3.2數組的切片

 

5.3.3改變數組的形狀

 

5.3.4數組對角線上替換新元素值

 

5.3.5用np.newaxis或None插入一個維度

 

5.3.6數組的基本運算

 

5.3.7數組的排序

 

5.3.8數組的組合

 

5.3.9數組的分割

 

5.3.10隨機打亂數組中的元素順序

 

5.3.11多維數組的展開

 

5.3.12其他常用函數與對象

 

5.4使用NumPy進行簡單統計分析

 

5.5數組在其他文件中的存取

 

5.5.1數組在無格式二進制文件中的存取

 

5.5.2數組在npy文件中的存取

 

5.5.3數組在npz文件中的存取

 

5.5.4數組在hdf5文件中的存取

 

習題5

 

第6章Matplotlib數據可視化基礎

 

6.1繪制基本圖形

 

6.1.1折線圖

 

6.1.2線條屬性的設置

 

6.1.3圖標題、坐標軸標題和坐標軸範圍的設置

 

6.1.4繪制多圖與圖例的設置

 

6.1.5散點圖

 

6.1.6直方圖

 

6.1.7餅圖

 

6.2繪制多軸圖

 

6.2.1用subplot()函數繪制多軸圖

 

6.2.2用subplot2grid()函數繪制多軸圖

 

6.2.3多軸圖的軸展開與遍歷

 

6.3坐標軸的刻度標簽

 

6.4坐標軸的主次刻度、網格設置

 

6.5移動坐標軸

 

6.6文字說明和註釋

 

6.7顯示圖片

 

6.8日期作為橫坐標

 

6.9繪制橫線與豎線作為輔助線

 

6.9.1使用hlines()和vlines()函數繪制輔助線

 

6.9.2使用axhline()和axvline()函數繪制輔助線

 

6.10繪制其他二維圖表

 

6.10.1箱線圖

 

6.10.2小提琴圖

 

6.10.3熱力圖

 

6.10.4填充圖

 

6.10.5等高線圖

 

6.11繪制三維圖表

 

6.11.1三維折線圖

 

6.11.2三維散點圖

 

6.11.3三維曲面圖

 

習題6

 

第7章Pandas數據處理與分析

 

7.1數據結構與基本操作

 

7.1.1Series基礎

 

7.1.2DataFrame基礎

 

7.2文件與數據庫中存取DataFrame對象

 

7.2.1csv文件中存取DataFrame對象

 

7.2.2Excel文件中存取DataFrame對象

 

7.2.3數據庫中存取DataFrame對象

 

7.3常用函數與方法

 

7.3.1用drop()刪除指定的行或列

 

7.3.2用append()添加元素

 

7.3.3用unique()去除重復元素

 

7.3.4用Series.map()實現數據替換

 

7.3.5用apply()將指定函數應用於數據

 

7.3.6用applymap()將指定函數應用於元素

 

7.3.7用replace()替換指定元素

 

7.3.8用align()對齊兩個對象的行列

 

7.3.9用groupby()實現分組

 

7.3.10用assign()添加新列

 

7.3.11用where()篩選與替換數據

 

7.3.12用value_counts()統計元素出現的次數或頻率

 

7.3.13用pivot()按指定列值重新組織數據

 

7.3.14用pivot_table()創建數據透視圖

 

7.3.15用idxmax()/idxmin()獲取最大值/最小值所在的行或列

標簽

 

7.4DataFrame對象的數據清洗與處理

 

7.4.1用concat()根據行列標簽合並數據

 

7.4.2數據排序

 

7.4.3記錄排名

 

7.4.4記錄抽取

 

7.4.5重建索引

 

7.4.6根據新索引填充新位置的值

 

7.4.7缺失值處理

 

7.4.8重復值處理

 

7.4.9數據轉換與替代

 

7.4.10數據計算

 

7.4.11用merge()根據列內容或行標簽合並數據對象

 

7.4.12combine()基於指定函數合並數據

 

7.4.13combine_first()用一個對象更新另一個對象中的空值

 

7.5時間處理

 

7.5.1Python標準庫中的時間處理

 

7.5.2用dateutil解析字符串格式的日期

 

7.5.3Pandas中的時間數據處理

 

7.5.4時間作為行或列的標簽

 

7.5.5根據時間頻率重新採樣

 

7.6移動數據與時間索引

 

7.7統計分析

 

7.7.1基本統計分析

 

7.7.2相關分析

 

7.8Pandas中的繪圖方法

 

7.8.1繪圖基本接口plot()

 

7.8.2其他繪圖函數

 

習題7

 

第8章機器學習方法概述與數據加載

 

8.1機器學習概述

 

8.1.1用有監督學習做預測

 

8.1.2用無監督學習發現數據之間的關系

 

8.2scikitlearn的簡介與安裝

 

8.2.1scikitlearn的安裝

 

8.2.2scikitlearn中的數據表示

 

8.2.3scikitlearn中的機器學習基本步驟

 

8.3加載數據

 

8.3.1加載scikitlearn中的小數據集

 

8.3.2下載並加載scikitlearn中的大數據集

 

8.3.3用scikitlearn構造模擬數據集

 

8.3.4加載scikitlearn中的其他數據集

 

8.3.5通過pandasdatareader導入金融數據

 

8.3.6通過第三方平臺API加載數據

 

8.4劃分數據分別用於訓練和測試

 

8.5scikitlearn中機器學習的基本步驟示例

 

8.5.1有監督分類學習步驟示例

 

8.5.2有監督回歸學習步驟示例

 

8.5.3無監督聚類學習步驟示例

 

8.6scikitlearn編程接口的風格

 

習題8

 

第9章數據預處理

 

9.1特徵的離散化

 

9.1.1使用NumPy中的digitize()函數離散化

 

9.1.2使用Pandas中的cut()函數離散化

 

9.2識別與處理異常值

 

9.3特徵值的MinMax縮放

 

9.4特徵值的標準化

 

9.5特徵值的穩健縮放

 

9.6無序分類數據的熱編碼

 

9.7有序分類數據編碼

 

9.8每個樣本特徵值的正則化

 

習題9

 

第10章模型評估與軌道

 

10.1模型評估的基本方法

 

10.1.1監督學習下的泛化、過擬合與欠擬合

 

10.1.2模型評估指標

 

10.1.3交叉驗證

 

10.2軌道的創建與使用

 

10.2.1創建和使用軌道

 

10.2.2交叉驗證中使用軌道

 

習題10

 

第11章有監督學習之分類與回歸

 

11.1分類與回歸概述

 

11.2線性回歸

 

11.2.1普通線性回歸

 

11.2.2嶺回歸使用l2正則化減小方差

 

11.2.3Lasso回歸使用l1正則化減小特徵個數

 

11.2.4同時使用l1和l2正則化的彈性網絡

 

11.2.5多項式回歸

 

11.3邏輯回歸與嶺回歸實現線性分類

 

11.3.1單標簽二分類

 

11.3.2單標簽多分類

 

11.3.3通過正則化降低過擬合

 

11.4支持向量機用於分類和回歸

 

11.4.1支持向量機線性分類

 

11.4.2支持向量機非線性分類

 

11.4.3支持向量機回歸模型

 

11.5樸素貝葉斯分類

 

11.6決策樹用於分類和回歸

 

11.6.1決策樹用於分類

 

11.6.2決策樹用於回歸

 

習題11

 

第12章集成學習

 

12.1投票法集成

 

12.1.1投票分類器

 

12.1.2投票回歸器

 

12.2bagging/pasting法集成

 

12.2.1bagging/pasting分類器

 

12.2.2bagging/pasting回歸器

 

12.2.3隨機森林

 

12.2.4極端隨機樹集成

 

12.3提升法集成

 

12.3.1AdaBoost

 

12.3.2梯度提升

 

12.3.3XGBoost

 

12.3.4基於直方圖的梯度提升

 

12.4堆疊法集成

 

12.4.1StackingClassifer集成分類

 

12.4.2StackingRegressor集成回歸

 

習題12

 

第13章無監督學習之聚類與降維

 

13.1用k均值算法基於相似性聚類

 

13.2層次聚類

 

13.3基於密度的聚類

 

13.4聚類性能的評估

 

13.4.1數據帶真實標簽的聚類評估

 

13.4.2數據不帶真實標簽的聚類評估

 

13.5無監督的降維

 

13.5.1主成分分析

 

13.5.2核主成分分析

 

習題13

 

第14章超參數調優與模型選擇

 

14.1搜索超參數來選擇模型

 

14.1.1基於循環語句的網格搜索

 

14.1.2劃分驗證集避免過擬合

 

14.1.3帶交叉驗證的網格搜索

 

14.1.4帶交叉驗證的隨機搜索

 

14.1.5搜索多個不同特徵的空間

 

14.2對軌道中的超參數進行搜索

 

14.3搜索算法和超參數

 

習題14

 

參考文獻