Python 數據分析與挖掘 (微課視頻版)
王麗麗、戎麗霞、於學鬥、鄭文艷、蔣勇、裴霞
- 出版商: 清華大學
- 出版日期: 2023-05-01
- 定價: $359
- 售價: 8.5 折 $305
- 語言: 簡體中文
- 頁數: 280
- 裝訂: 平裝
- ISBN: 7302631875
- ISBN-13: 9787302631873
-
相關分類:
Data Science
立即出貨 (庫存 < 3)
商品描述
本書在介紹Python語言基本知識的基礎上,著重介紹了Python語言在數據獲取、數據分析與數據挖掘等方面的應用。本書設置一個實戰項目貫穿全書內容,每章引導讀者綜合運用本章知識點解決或改進本項目的某些任務,從數據的獲取、處理、分析、可視化到知識的挖掘,逐步完成一個數據分析與挖掘項目。這是一本適應新工科、應用型人才培養的數據分析與挖掘的案例式圖書。 本書共9章,包括Python語言概述、Python編程基礎、Python爬蟲技術、科學計算庫(Numpy)、數據分析處理庫(Pandas)、數據展示庫(Matplotlib)、數據挖掘基礎、Scikitlearn數據挖掘實戰、初識深度學習等內容。本書體系完整,重點突出,資源豐富。 本書適合電腦科學與技術、數據科學與大數據技術、人工智能以及相關理工專業的本科生、研究生使用,也適合從事數據咨詢、研究或分析等人士參考使用。
目錄大綱
目錄
第1章Python語言概述1
1.1Python簡介1
1.1.1Python語言的特點2
1.1.2Python語言的應用2
1.2Python開發工具3
1.2.1Python代碼編輯器3
1.2.2Python集成開發環境3
1.3Python編程規範4
1.4使用Spyder創建 Python 程序5
1.4.1Anaconda5
1.4.2標準庫、擴展庫的安裝和升級7
1.4.3標準庫、擴展庫對象的導入7
1.4.4編寫第一個Python程序8
1.5綜合實戰項目介紹10
1.6本章知識要點11
1.7習題11
第2章Python編程基礎12
2.1變量及數據類型14
2.1.1數字14
2.1.2字符串14
2.1.3列表、元組、字典、集合15
2.2運算符、表達式和內置函數16
2.3列表20
2.3.1列表的創建20
2.3.2列表的基本操作21
2.3.3切片操作24
2.3.4列表推導式24
2.4元組26
2.4.1元組的創建26
2.4.2元組的基本操作26
2.4.3序列解包27
2.4.4生成器表達式27
2.5字典28
2.5.1字典的創建28
2.5.2字典的基本操作28
2.5.3字典推導式30
2.6集合31
2.6.1集合的創建31
2.6.2集合的基本操作31
2.6.3集合的運算32
2.6.4集合推導式33
2.7字符串34
2.7.1字符串的格式化34
2.7.2字符串的常用方法36
2.8選擇結構、循環結構39
2.8.1選擇結構39
2.8.2循環結構41
2.9函數43
2.9.1函數的定義與調用44
2.9.2函數的參數傳遞45
2.9.3lambda表達式47
2.10本章知識要點48
2.11習題48
第3章Python爬蟲技術50
3.1案例導入51
3.2認識爬蟲51
3.2.1爬蟲的基本概念51
3.2.2爬蟲的工作流程53
3.2.3爬蟲的合法性與robots協議53
3.3網頁下載器54
3.3.1HTTP的請求信息54
3.3.2Requests庫的安裝56
3.3.3Requests庫的請求和響應56
3.4網頁解析器59
3.4.1lxml庫的安裝59
3.4.2XPath常用語法60
3.4.3lxml庫應用實例62
3.5案例實現63
3.6多線程數據獲取70
3.7本章知識要點72
3.8習題73
第4章科學計算庫(Numpy)74
4.1數組對象ndarray75
4.1.1數組的創建75
4.1.2數組的屬性77
4.1.3索引與切片77
4.2ndarray數組的操作78
4.2.1數組元素的修改78
4.2.2數組形狀的修改79
4.2.3數組的排序80
4.2.4數組的合並與分割81
4.3ndarray數組的運算82
4.3.1數組與標量的運算82
4.3.2數組與數組的運算83
4.3.3統計函數84
4.3.4布爾運算85
4.3.5分段函數85
4.3.6數組的集合運算86
4.4矩陣的常用操作87
4.4.1矩陣的生成87
4.4.2矩陣的統計方法87
4.4.3矩陣的轉置88
4.4.4計算逆矩陣89
4.4.5計算方差、協方差及相關系數矩陣89
4.5Numpy應用案例90
4.5.1案例說明90
4.5.2案例分析91
4.5.3線性插值91
4.5.4實現代碼91
4.6本章知識要點93
4.7習題93
第5章數據分析處理庫(Pandas)95
5.1案例導入97
5.2Pandas常用數據類型97
5.2.1Series類型97
5.2.2DataFrame類型101
5.3讀寫外部數據102
5.3.1CSV文件的讀取102
5.3.2CSV文件的寫入104
5.4數據查看與篩選105
5.5統計分析109
5.6數據預處理111
5.6.1重復值處理112
5.6.2缺失值處理113
5.6.3異常值處理117
5.6.4類型轉換120
5.6.5標準化數據121
5.6.6數據合並與連接122
5.7排序與分組125
5.7.1排序125
5.7.2分組與匯總127
5.8透視表與交叉表129
5.8.1透視表129
5.8.2交叉表130
5.9案例實現131
5.10本章知識要點136
5.11習題136
第6章數據展示庫(Matplotlib)138
6.1案例導入139
6.2Matplotlib簡介140
6.3使用Matplotlib庫繪制各種圖形140
6.3.1繪制折線圖140
6.3.2繪制柱狀圖142
6.3.3繪制散點圖143
6.3.4繪制餅圖144
6.3.5繪制箱線圖146
6.3.6繪制六邊形分箱圖148
6.4切分繪圖區域149
6.5設置圖例樣式151
6.6保存繪圖結果153
6.7詞雲圖154
6.8案例實現156
6.9本章知識要點158
6.10習題159
第7章數據挖掘基礎160
7.1數據挖掘的基本概念161
7.1.1數據挖掘的常用術語162
7.1.2數據挖掘的流程164
7.2Scikitlearn簡介165
7.2.1Scikitlearn常用方法165
7.2.2Scikitlearn常用數據集170
7.3本章知識要點172
7.4習題173
第8章Scikitlearn數據挖掘實戰174
8.1構建並評估回歸模型175
8.1.1案例導入——房屋租金回歸分析175
8.1.2線性回歸算法原理176
8.1.3線性回歸算法評估177
8.1.4Scikitlearn實現線性回歸177
8.1.5案例實現180
8.2構建並評估分類模型186
8.2.1案例導入——鳶尾花分類186
8.2.2KNN算法原理187
8.2.3決策樹算法原理188
8.2.4分類算法評估190
8.2.5Scikitlearn實現KNN和決策樹分類191
8.2.6案例實現194
8.3構建並評估聚類模型198
8.3.1案例導入——客戶聚類198
8.3.2Kmeans聚類算法原理199
8.3.3DBSCAN算法原理200
8.3.4聚類算法評估201
8.3.5Scikitlearn實現Kmeans和DBSCAN聚類201
8.3.6案例實現207
8.4構建並評估關聯規則模型212
8.4.1案例導入——超市購物籃分析212
8.4.2Apriori算法原理213
8.4.3關聯規則的評價指標215
8.4.4案例實現216
8.5本章知識要點222
8.6習題223
第9章初識深度學習225
9.1案例導入226
9.2捲積神經網絡228
9.2.1人工神經網絡228
9.2.2捲積230
9.2.3池化231
9.2.4激活函數231
9.2.5損失函數233
9.3經典捲積神經網絡模型234
9.3.1LeNet234
9.3.2AlexNet235
9.3.3VGGNet235
9.3.4GoogLeNet236
9.3.5ResNet237
9.3.6DenseNet239
9.4Keras框架及其應用示例240
9.4.1TensorFlow的安裝240
9.4.2Keras的安裝243
9.4.3Keras常用模塊及應用示例244
9.5案例實現250
9.6本章知識要點256
9.7習題257
附錄A常用Python標準庫和擴展庫及其方法258
附錄B綜合實訓項目參考265
參考文獻267