Python 數據分析與數據挖掘

王潔,李曉

  • 出版商: 清華大學
  • 出版日期: 2023-10-01
  • 定價: $359
  • 售價: 8.5$305
  • 語言: 簡體中文
  • 頁數: 314
  • ISBN: 7302625727
  • ISBN-13: 9787302625728
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

  • Python 數據分析與數據挖掘-preview-1
  • Python 數據分析與數據挖掘-preview-2
  • Python 數據分析與數據挖掘-preview-3
Python 數據分析與數據挖掘-preview-1

買這商品的人也買了...

商品描述

本書採用理論知識與全過程案例解析相結合的方式,深入淺出地介紹運用Python進行數據分析與挖掘的基本概念與方法。全書共13章,分為四部分: Python基礎知識、數據分析相關庫、數據挖掘理論與算法應用、綜合案例。全書本著循序漸進、理論聯系實際的原則,每個知識點及每章均選擇了接近實際應用並具有典型性的豐富案例,引導讀者更好地理解數據分析與挖掘的知識,並能快速開展編程實踐,是一本實踐性極強、深淺適度、重在應用、著重實戰能力培養的教材。 本書可作為高等學校大數據管理與應用、數據科學與大數據技術、電腦科學與技術等相關專業的教材,也可作為數據分析與挖掘相關從業人員的參考書。

目錄大綱

目錄

 

 

 

 

源碼下載

 

 

第一部分Python基礎知識

 

第1章Python概述

 

1.1Python簡介

 

1.2Python的特點和應用領域

 

1.2.1Python的特點

 

1.2.2Python的應用領域

 

1.3Python開發環境的搭建

 

1.3.1Python的下載

 

1.3.2Python的安裝

 

1.4Anaconda的下載與安裝

 

1.5Anaconda中的Python開發環境

 

1.5.1Jupyter的使用

 

1.5.2Spyder的使用

 

1.5.3使用Conda管理包

 

1.5.4第三方包管理的例子

 

1.6使用百度AI Studio雲計算編程環境

 

1.6.1登錄AI Studio平臺

 

1.6.2創建項目

 

1.6.3啟動並運行項目

 

1.7Python的運行原理

 

1.8Python的編寫規範

 

1.8.1行和縮進

 

1.8.2多行語句

 

1.8.3Python引號

 

1.8.4Python註釋

 

1.9本章小結

 

第2章Python基礎語法

 

2.1標識符與變量

 

2.1.1Python標識符

 

2.1.2Python關鍵字

 

2.1.3變量與賦值

 

2.2輸入與輸出

 

2.2.1數據的輸入

 

2.2.2數據的輸出

 

2.2.3輸入和輸出實戰例題

 

2.3Python數據結構

 

2.3.1標量——基本數據類型

 

2.3.2序列類型——列表、元組和字符串

 

2.3.3映射類型——字典

 

2.3.4集合類型

 

2.3.5Python數據結構實戰例題

 

2.4運算符與表達式

 

2.5Python流程控制

 

2.5.1順序結構

 

2.5.2選擇結構

 

2.5.3循環結構

 

2.6本章實戰例題

 

2.7本章小結

 

2.8本章習題

 

第3章函數

 

3.1函數概述

 

3.1.1模塊和包

 

3.1.2什麽是函數

 

3.2函數的定義

 

3.3參數傳遞

 

3.3.1實參變量指向不可變對象

 

3.3.2實參變量指向可變對象

 

3.4函數參數的設置

 

3.4.1函數參數的類型

 

3.4.2位置參數

 

3.4.3默認參數

 

3.4.4關鍵字參數

 

3.4.5可變參數

 

3.5匿名函數

 

3.6遞歸函數

 

3.7本章實戰例題

 

3.8本章小結

 

3.9本章習題

 

第4章類與對象

 

4.1面向對象

 

4.2類與對象的聯系

 

 

4.3類的定義與使用

 

4.4屬性

 

4.4.1實例屬性和類屬性

 

4.4.2公有屬性和私有屬性

 

4.5方法

 

4.5.1實例方法

 

4.5.2類方法

 

4.5.3靜態方法

 

4.6繼承

 

4.6.1隱性繼承

 

4.6.2覆蓋

 

4.6.3super繼承

 

4.6.4多重繼承

 

4.7運算符重載

 

4.8本章實戰例題

 

4.9本章小結

 

4.10本章習題

 

第二部分數據分析相關庫

 

第5章NumPy基礎與應用

 

5.1NumPy簡介

 

5.2NumPy數組基礎

 

5.2.1數組的屬性

 

5.2.2創建數組

 

5.2.3數組的數據類型

 

5.2.4數組的迭代

 

5.2.5數組的索引和切片

 

5.2.6數組的合並與拆分

 

5.3數組的相關操作

 

5.3.1統計相關操作

 

5.3.2形狀相關操作

 

5.3.3數組的四則運算、點乘與比較操作

 

5.4數組的讀/寫

 

5.4.1數組的讀取

 

5.4.2數組的寫入

 

5.5本章實戰例題

 

5.6本章小結

 

5.7本章習題

 

第6章Pandas基礎與應用

 

6.1Pandas簡介

 

6.1.1Pandas的主要特點

 

 

6.1.2Pandas的安裝

 

6.2Pandas中的數據結構

 

6.2.1Series

 

6.2.2DataFrame

 

6.3Pandas中數據的基本操作

 

6.3.1數據的導入和導出

 

6.3.2數據的選取

 

6.3.3數據的編輯

 

6.3.4數據的合並

 

6.4數據運算與分析

 

6.4.1數據的算術運算和比較運算

 

6.4.2數據排序

 

6.4.3統計分析

 

6.4.4分組與聚合

 

6.4.5透視表與交叉表

 

6.5本章實戰例題

 

6.6本章小結

 

6.7本章習題

 

第7章Matplotlib 基礎及應用

 

7.1Matplotlib簡介

 

7.1.1Matplotlib的主要特點

 

7.1.2Matplotlib的安裝

 

7.2Matplotlib的基礎知識

 

7.2.1導入Matplotlib

 

7.2.2Matplotlib中圖形(Figure)的構成

 

7.2.3Matplotlib的中文設置

 

7.3Pyplot的使用

 

7.3.1plt.plot()函數的使用

 

7.3.2子圖

 

7.4Pyplot中的常用圖形

 

7.4.1散點圖

 

7.4.2柱狀圖

 

7.4.3直方圖

 

7.4.4餅圖

 

7.4.53D圖

 

7.5本章實戰例題

 

7.6本章小結

 

7.7本章習題

 

第三部分數據挖掘理論與算法應用

 

第8章分類

 

8.1分類概述

 

8.1.1分類的基本概念

 

8.1.2常用的分類算法

 

8.1.3分類算法的評價指標

 

8.2分類的理論知識

 

8.2.1信息熵

 

8.2.2信息增益

 

8.2.3基尼系數

 

8.3決策樹

 

8.3.1決策樹的基本概念

 

8.3.2決策樹的算法過程

 

8.3.3scikitlearn中決策樹的應用

 

8.4樸素貝葉斯分類器

 

8.4.1樸素貝葉斯分類器的基本介紹

 

8.4.2樸素貝葉斯分類器的算法過程

 

8.4.3scikitlearn中樸素貝葉斯分類器的應用

 

8.5支持向量機

 

8.5.1支持向量機簡介

 

8.5.2支持向量機的算法過程

 

8.5.3scikitlearn中支持向量機的應用

 

8.6梯度提升決策樹

 

8.6.1梯度提升決策樹的基本概念

 

8.6.2梯度提升決策樹的算法過程

 

8.6.3scikitlearn中梯度提升決策樹的應用

 

8.7Python中分類預測模型的小結

 

8.8本章實戰例題

 

8.9本章小結

 

8.10本章習題

 

第9章聚類

 

9.1聚類概述

 

9.1.1聚類的基本概念

 

9.1.2聚類中距離的度量

 

9.1.3聚類的常用算法

 

9.1.4聚類的評估

 

9.2基於劃分的KMeans聚類算法

 

9.2.1KMeans的基本概念

 

9.2.2KMeans的算法過程

 

9.2.3scikitlearn中KMeans的應用

 

9.3基於層次分析的聚類

 

9.3.1基於層次分析的聚類的基本原理

 

9.3.2基於層次分析的聚類過程

 

9.3.3scikitlearn中Birch的應用

 

9.4基於密度的聚類

 

9.4.1基於密度的聚類的基本原理

 

9.4.2基於密度的聚類過程

 

9.4.3scikitlearn中DBSCAN的應用

 

9.5本章實戰例題

 

9.6本章小結

 

9.7本章習題

 

第10章回歸分析

 

10.1回歸概述

 

10.1.1常用的回歸模型

 

10.1.2回歸分析的步驟

 

10.1.3回歸的相關系數

 

10.1.4回歸模型的評價指標

 

10.2線性回歸

 

10.2.1線性回歸的原理

 

10.2.2線性回歸的應用

 

10.2.3一元線性回歸

 

10.2.4多元線性回歸

 

10.3邏輯回歸

 

10.3.1邏輯回歸的原理

 

10.3.2LogisticRegression的應用

 

10.3.3邏輯回歸的應用

 

10.4其他回歸

 

10.4.1多項式回歸

 

10.4.2嶺回歸

 

10.4.3Lasso回歸

 

10.5本章實戰例題

 

10.6本章小結

 

10.7本章習題

 

第四部分綜 合 案 例

 

第11章實戰案例:  電商消費者數據分析

 

11.1案例背景

 

11.2數據加載和預處理

 

11.2.1加載需要的庫及讀入數據

 

11.2.2數據信息初步分析

 

11.2.3數據預處理

 

 

11.3探索性數據分析

 

11.3.1各國訂單情況分析

 

11.3.2客戶情況分析

 

11.3.3產品情況分析

 

11.3.4按時間分析銷售數據

 

11.4本章小結

 

第12章實戰案例:  乳腺癌數據分析與預測

 

12.1案例背景

 

12.2數據加載和預處理

 

12.2.1加載需要的庫及讀入數據

 

12.2.2數據信息初步分析

 

12.2.3數據預處理

 

12.3探索性數據分析

 

12.3.1診斷結果列的分佈

 

12.3.2數據分佈的可視化分析

 

12.3.3相關性分析

 

12.4分類模型

 

12.4.1LogisticRegression模型

 

12.4.2決策樹模型

 

12.4.3SVM模型

 

12.5提升預測準確率的策略

 

12.5.1數據標準化或規範化

 

12.5.2特徵選擇

 

12.5.3參數調優

 

12.6本章小結

 

第13章實戰案例:  鑽石數據分析與預測

 

13.1案例背景

 

13.2數據加載和預處理

 

13.2.1加載需要的庫及讀入數據

 

13.2.2數據信息初步分析

 

13.2.3數據預處理

 

13.3探索性數據分析

 

13.3.1類別特徵分析

 

13.3.2數值特徵分析

 

13.3.3相關性分析

 

13.4回歸模型的預測

 

13.5本章小結

 

參考文獻