Python數據分析
相關主題
商品描述
"全書共分為9章,主要內容包括數據分析的基礎概念、操作環境以及數據預處理的基本知識和技能,數據分析中最重要的手段與方法,如描述性分析、可視化分析、分類分析、回歸分析以及預測模型,幾種評價方法以及過擬合與欠擬合問題,如精準度與召回率、ROC曲線與AUC值、F1分數與MSE/RMSE等,數據分析方法在各領域中的典型應用案例,為讀者提供思路和參考,幫助讀者更好地理解和應用數據分析方法。 "
目錄大綱
目錄
第1章Python數據分析概述00
1.1數據分析概述00
1.1.1什麼是數據分析00
1.1.2數據分析的流程00
1.1.3數據分析的應用場景00
1.2數據分析方法00
1.3數據分析工具00
1.3.1數據分析常用工具00
1.3.2Python數據分析的優勢00
1.4搭建Python開發環境00
1.4.1Python簡介00
1.4.2Python數據處理常用庫介紹00
1.4.3搭建IDLE開發環境0
1.4.4Anaconda環境0
課程思政0
習題0
第2章數據獲取0
2.1數據及其類型0
2.2數據獲取渠道0
2.3網絡數據采集工具——八爪魚采集器0
2.3.1八爪魚采集器概述0
2.3.2八爪魚數據采集的過程0
2.4Python網絡爬蟲數據采集0
2.4.1網絡爬蟲概述0
2.4.2Python網絡爬蟲庫0
2.4.3Requests庫0
2.4.4網頁解析0
2.5從文件中讀取數據0
2.5.1從數據庫中讀取數據0
2.5.2從文本文件中讀取數據0
2.5.3從Excel文件中讀取數據0
2.6數據訪問權限與合規性0
2.6.1數據訪問權限0
2.6.2數據合規性0
課程思政0
習題0
第3章數據預處理0
3.1數據預處理的目的0
3.2數據清洗0
3.2.1缺失值處理0
3.2.2異常值處理0
3.2.3重復數據處理0
3.3數據變換0
3.3.1數據替換0
3.3.2虛擬變量處理0
3.3.3數據離散化0
3.4數據集成0
3.5數據規範化0
3.6數據降維0
3.6.1數據歸約0
3.6.2主成分分析0
3.6.3線性判別分析0
3.6.4t-SNE0
3.7時間序列處理0
3.7.1日期數據0
3.7.2時期數據0
課程思政0
習題0
第4章描述性分析0
4.1單特征描述性分析0
4.1.1頻數分析0
4.1.2統計分析0
4.1.3可視化分析0
4.1.4數據分布分析0
4.1.5數據分組與聚合0
4.2雙特征描述性分析0
4.2.1協方差0
4.2.2相關系數0
4.2.3可視化分析0
4.3比較分析0
4.3.1對比分析0
4.3.2同比、定比和環比分析0
4.3.3貢獻度分析0
4.3.4差異化分析0
4.4時間序列分析
課程思政
習題
第5章可視化分析
5.1為什麼要進行數據可視化
5.2繪圖基礎
5.3Matplotlib可視化
5.3.1常用設置
5.3.2常用圖形的繪制
5.3.3復雜圖形的繪制
5.4Seaborn可視化
5.4.1基本設置
5.4.2單一特征可視化
5.4.3多特征可視化
5.5可視化分析綜合案例
課程思政
習題
第6章分類分析
6.1分類概述
6.1.1分類的基本概念
6.1.2分類的基本步驟
6.1.3常用分類方法簡介
6.2決策樹分類
6.2.1決策樹概述
6.2.2決策樹特征選擇
6.2.3剪枝方法
6.2.4決策樹實現過程
6.3k-近鄰分類
6.3.1k-近鄰算法原理與流程
6.3.2k值的選擇
6.3.3KNN常用的距離度量
6.3.4k-近鄰實現過程
6.4貝葉斯分類
6.4.1概率基礎
6.4.2貝葉斯分類原理
6.4.3樸素貝葉斯分類
6.5支持向量機
6.5.1支持向量機算法原理
6.5.2線性支持向量機
6.5.3核函數選擇
6.5.4Python實現支持向量機
課程思政
習題
第7章回歸分析
7.1回歸分析概述
7.1.1回歸分析的含義
7.1.2常用回歸方法
7.2線性回歸分析
7.2.1線性回歸模型與基本假設
7.2.2模型估計與檢驗
7.2.3共線性分析
7.2.4回歸預測和模型診斷
7.2.5Python實現線性回歸
7.2.6嶺回歸分析
7.2.7套索回歸分析
7.3邏輯回歸分析
7.3.1邏輯回歸模型原理與假設
7.3.2Logistic回歸模型的估計與檢驗
7.3.3Python實現邏輯回歸
7.4支持向量機回歸分析
7.4.1支持向量機概述
7.4.2回歸型支持向量機
7.4.3Python實現SVR模型
7.5KNN回歸分析
7.5.1KNN回歸算法原理
7.5.2距離度量與k值選擇方法
7.5.3Python實現KNN回歸
7.6過擬合與欠擬合問題
7.6.1過擬合
7.6.2欠擬合
7.6.3過擬合和欠擬合示例
7.7模型提升
7.7.1使用交叉驗證評估模型的泛化能力
7.7.2使用網格搜索確定模型最佳參數
課程思政
習題
第8章聚類分析
8.1聚類分析概述
8.2聚類分析的算法
8.3k-means聚類分析
8.3.1k-means算法
8.3.2聚類模型的評估
8.3.3Python實現k-means算法
8.4AGNES聚類分析
8.4.1AGNES聚類方法
8.4.2Python實現AGNES
8.5DBSCAN聚類分析
8.5.1DBSCAN概述
8.5.2Python實現DBSCAN算法
8.6高斯混合模型
8.6.1高斯混合模型概述
8.6.2Python實現GMM聚類
課程思政
習題
第9章數據分析綜合分析案例
9.1二手房房價分析與預測
9.1.1工作準備
9.1.2數據可視化
9.1.3二手房價格預測與評價
9.2文本分析
9.2.1文本分析概述
9.2.2jieba庫
9.2.3文本可視化
9.2.4文本分類
9.3糖尿病預測
9.3.1加載數據
9.3.2相關性分析
9.3.3降維
9.3.4回歸分析
課程思政
習題
參考文獻



