Python數據挖掘
洪金珠,徐藹婷,陳宜治,張子天,蔣獻,汪盈,諸葛斌
- 出版商: 清華大學
- 出版日期: 2025-06-01
- 語言: 簡體中文
- ISBN: 7302691908
- ISBN-13: 9787302691907
-
相關分類:
Data-mining
下單後立即進貨 (約4週~6週)
相關主題
商品描述
作者簡介
目錄大綱
目錄
下載源碼
第1章緒論
1.1數據挖掘基礎
1.1.1數據挖掘概述
1.1.2數據挖掘演進脈絡
1.1.3數據挖掘應用領域
1.2基於Python的數據挖掘
1.2.1本地環境安裝
1.2.2簡單案例實踐
1.2.3本書常用方法
1.3天池平臺操作概述
1.3.1天池AI實訓平臺介紹
1.3.2課程配套環境操作
1.3.3天池數據集介紹
習題1
第2章數據可視化
2.1數據可視化概述
2.1.1數據可視化的概念
2.1.2數據可視化的作用
2.1.3Python數據可視化實戰準備
2.2matplotlib繪制簡單圖表
2.2.1matplotlib簡介
2.2.2繪圖屬性設置
2.2.3簡單圖形的繪制
2.3高級圖表繪制
2.3.1subplot子區
2.3.2Seaborn
2.3.3詞雲圖
2.3.4mplot3d模塊
習題2
第3章數據預處理
3.1數據預處理概述
3.1.1數據預處理的概念
3.1.2數據預處理在數據挖掘中的作用
3.1.3數據預處理的主要任務
3.2數據清洗
3.2.1缺失值處理
3.2.2噪聲數據處理
3.2.3異常值處理
3.3數據集成
3.3.1數據源識別與整合
3.3.2數據格式統一化
3.3.3數據冗余與相關性分析
3.4數據變換
3.4.1數據變換概述
3.4.2數據編碼應用示例
3.4.3規範化應用示例
3.5數據預處理應用案例
習題3
第4章回歸分析
4.1回歸分析基本問題
4.1.1回歸分析介紹
4.1.2回歸分析的種類
4.1.3回歸分析的發展史
4.2線性回歸模型
4.2.1模型的相關概念
4.2.2一元線性回歸分析
4.2.3多元線性回歸分析
4.2.4實戰準備
4.2.5模型案例分析
4.3其他回歸模型
4.3.1Lasso回歸模型
4.3.2嶺回歸模型
4.3.3邏輯回歸模型
4.3.4實戰準備
4.3.5模型案例分析
習題4
第5章關聯規則分析
5.1關聯規則分析概述
5.1.1概念
5.1.2原理步驟
5.1.3應用領域
5.2Apriori算法
5.2.1基本原理
5.2.2算法流程
5.2.3實戰準備
5.2.4Apriori算法案例
5.3FPgrowth算法
5.3.1基本原理
5.3.2算法流程
5.3.3實戰準備
5.3.4FPgrowth算法案例
5.4關聯規則分析案例
習題5
第6章聚類分析
6.1聚類分析概述
6.1.1聚類分析的基本概念
6.1.2聚類分析的原理和步驟
6.2基於劃分的聚類
6.2.1kmeans算法
6.2.2kmeans++算法
6.2.3實戰準備
6.2.4劃分聚類案例
6.3基於層次的聚類
6.3.1層次聚類的基本概念
6.3.2凝聚層次算法: AGNES算法
6.3.3分裂層次算法: DIANA算法
6.3.4實戰準備
6.3.5層次聚類案例
6.4基於密度的聚類
6.4.1密度聚類的基本概念
6.4.2DBSCAN 算法
6.4.3實戰準備
6.4.4密度聚類案例
習題6
第7章隨機森林
7.1隨機森林概述
7.1.1決策樹概論
7.1.2隨機森林概論
7.1.3決策樹與隨機森林
7.2決策樹
7.2.1sklearn中的決策樹模型
7.2.2分類決策樹
7.2.3回歸決策樹
7.3隨機森林實踐
7.3.1隨機森林實踐準備
7.3.2隨機森林案例分析
7.3.3隨機森林的應用案例
習題7
第8章神經網絡
8.1神經網絡概述
8.1.1概念
8.1.2發展歷程
8.1.3應用領域
8.2長短期記憶網絡算法
8.2.1基本原理
8.2.2算法流程
8.2.3LSTM算法案例
8.3BP反向傳播算法
8.3.1基本原理
8.3.2算法流程
8.3.3BP算法案例
習題8
第9章貝葉斯分類
9.1貝葉斯分類概述
9.1.1貝葉斯定理
9.1.2貝葉斯分類步驟及優點
9.1.3應用領域
9.2樸素貝葉斯算法
9.2.1基本原理
9.2.2算法分類
9.2.3實戰準備
9.2.4樸素貝葉斯算法案例
9.3貝葉斯網絡
9.3.1基本原理
9.3.2算法流程及實戰準備
9.3.3貝葉斯網絡算法案例
習題9
第10章文本挖掘
10.1文本挖掘概述
10.1.1基本介紹
10.1.2應用領域
10.1.3基本流程
10.2文本預處理
10.2.1文本清洗
10.2.2分詞和詞性標註
10.2.3特征選取
10.2.4詞向量表示方法
10.3文本挖掘方法實現
10.3.1文本分類
10.3.2文本聚類
10.4文本挖掘結果可視化
10.4.1知識圖譜
10.4.2詞雲圖
10.5文本挖掘算法案例
習題10
第11章綜合案例實戰
11.1代碼自動生成
11.2租房案例概述
11.2.1案例背景
11.2.2案例研究目的
11.3數據采集及預處理
11.3.1選取及提取網頁
11.3.2使用Scrapy解析頁面內容
11.3.3數據清理及存儲
11.4數據分析與可視化
11.4.1房源租金可視化分析
11.4.2區域租金均價分布可視化
11.5代碼自動生成的租房決策實現
11.5.1找準區域
11.5.2找準商圈
11.5.3找準戶型
11.5.4找準朝向
11.5.5找準設施
11.5.6得出結果
11.6數據挖掘應用發布和實踐
11.6.1基於Web服務器的應用發布
11.6.2基於釘釘低代碼的應用發布