Python 數據科學指南 (Python Data Science Cookbook)

薩伯拉曼尼安 (Gopi Subramanian)

買這商品的人也買了...

商品描述

<內容簡介>

Python作為一種高級程序設計語言,憑藉其簡潔、易讀及可擴展性日漸成為程序設計領域備受推崇的語言,並成為數據科學家的必讀之一。
本書詳細介紹了Python在數據科學中的應用,包括數據探索、數據分析與挖掘、機器學習、大規模機器學習等主題。每一章都為讀者提供了足夠的數學知識和代碼示例來理解不同深度的算法功能,幫助讀者更好地掌握各個知識點。
本書內容結構清晰,示例完整,無論是數據科學領域的新手,還是經驗豐富的數據科學家都將從中獲益。

<章節目錄>

第1章Python在數據科學中的應用1
1.1簡介2
1.2使用字典對象2
1.2.1準備工作2
1.2.2操作方法2
1.2.3工作原理3
1.2.4更多內容4
1.2.5參考資料6
1.3使用字典的字典6
1.3.1準備工作6
1.3.2操作方法6
1.3.3工作原理7
1.3.4參考資料7
1.4使用元組7
1.4.1準備工作7
1.4.2操作方法8
1.4. 3工作原理9
1.4.4更多內容12
1.4.5參考資料12
1.5使用集合13
1.5.1準備工作13
1.5.2操作方法13
1.5.3工作原理14
1.5.4更多內容15
1.6寫一個列表16
1.6.1準備工作16
1.6.2操作方法16
1.6.3工作原理18
1.6.4更多內容19
1.7從另一個列表創建列表——列表推導20
1.7.1準備工作20
1.7.2操作方法20
1.7.3工作原理20
1.7.4更多內容21
1.8使用迭代器22
1.8.1準備工作22
1.8.2操作方法23
1.8.3工作原理23
1.8.4更多內容24
1.9生成一個迭代器和生成器24
1.9.1準備工作25
1.9.2操作方法25
1.9.3工作原理25
1.9.4更多內容25
1.10使用可迭代對象26
1.10.1準備工作26
1.10.2操作方法26
1.10.3工作原理27
1.10.4參考資料27
1.11將函數作為變量傳遞28
1.11.1準備工作28
1.11.2操作方法28
1.11.3工作原理28
1.12在函數中嵌入函數28
1.12.1準備工作29
1.12.2操作方法29
1.12.3工作原理29
1.13將函數作為參數傳遞29
1.13.1準備工作29
1.13.2操作方法29
1.13.3工作原理30
1.14返回一個函數30
1.14.1準備工作31
1.14.2操作方法31
1.14 .3工作原理31
1.14.4更多內容32
1.15使用裝飾器改變函數行為32
1.15.1準備工作32
1.15.2操作方法32
1.15.3工作原理33
1.16使用lambda創造匿名函數34
1.16.1準備工作34
1.16.2操作方法35
1.16.3工作原理35
1.17使用映射函數35
1.17.1準備工作36
1.17.2操作方法36
1.17.3工作原理36
1.17.4更多內容36
1.18使用過濾器37
1.18. 1準備工作37
1.18.2操作方法37
1.18.3工作原理38
1.19使用zip和izip函數38
1.19.1準備工作38
1.19.2操作方法38
1.19.3工作原理38
1.19.4更多內容39
1.19. 5參考資料40
1.20從表格數據使用數組40
1.20.1準備工作40
1.20.2操作方法41
1.20.3工作原理41
1.20.4更多內容42
1.21對列進行預處理43
1.21.1準備工作44
1.21 .2操作方法44
1.21.3工作原理45
1.21.4更多內容45
1.22列表排序46
1.22.1準備工作46
1.22.2操作方法46
1.22.3工作原理46
1.22.4更多內容47
1.23採用鍵排序47
1.23.1準備工作48
1.23.2操作方法48
1.23.3工作原理49
1.23.4更多內容49
1.24使用itertools 52
1.24.1準備工作52
1.24.2操作方法52
1.24.3工作原理53
第2章Python環境55
2.1簡介55
2.2使用NumPy庫55
2.2.1準備工作55
2.2.2操作方法56
2.2.3工作原理58
2.2.4更多內容64
2.2.5參考資料64
2.3使用matplotlib進行繪畫64
2.3.1準備工作64
2.3.2操作方法64
2.3.3工作原理66
2.3.4更多內容72
2.4使用scikit-learn進行機器學習73
2.4.1準備工作73
2.4.2操作方法73
2.4.3工作原理75
2.4.4更多內容81
2.4.5參考資料82
第3章數據分析——探索與爭鳴83
3.1簡介84
3.2用圖表分析單變量數據85
3.2.1準備工作85
3.2.2操作方法86
3.2 .3工作原理87
3.2.4參考資料92
3.3數據分組和使用位圖92
3.3.1準備工作93
3.3.2操作方法93
3.3.3工作原理95
3.3.4參考資料97
3.4為多變量數據繪製散位圖97
3.4.1準備工作98
3.4.2操作方法98
3.4.3工作原理99
3.4.4參考資料100
3.5使用熱圖101
3.5.1準備工作101
3.5.2操作方法101
3.5.3工作原理102
3.5.4更多內容104
3.5.5參考資料105
3.6實施概要統計及繪圖105
3.6.1準備工作105
3.6.2操作方法106
3.6.3工作原理107
3.6.4參考資料110
3.7使用箱須圖110
3.7.1準備工作110
3.7.2操作方法110
3.7.3工作原理111
3.7.4更多內容112
3.8修補數據113
3.8.1準備工作113
3.8.2操作方法113
3.8.3工作原理114
3.8 .4更多內容115
3.8.5參考資料116
3.9實施隨機採樣116
3.9.1準備工作116
3.9.2操作方法117
3.9.3工作原理117
3.9.4更多內容118
3.10縮放數據118
3.10.1準備工作118
3.10.2操作方法118
3.10.3工作原理119
3.10.4更多內容119
3.11數據標準化121
3.11.1準備工作121
3.11.2操作方法121
3.11.3工作原理122
3.11.4更多內容122
3.12實施分詞化123
3.12.1準備工作123
3.12.2操作方法123
3.12.3工作原理124
3.12.4更多內容125
3.12.5參考資料127
3.13刪除停用詞127
3.13.1操作方法128
3.13. 2工作原理129
3.13.3更多內容130
3.13.4參考資料130
3.14詞提取130
3.14.1準備工作131
3.14.2操作方法132
3.14.3工作原理132
3.14.4更多內容133
3.14.5參考資料133
3.15執行詞形還原134
3.15.1準備工作134
3.15.2操作方法134
3.15.3工作原理135
3.15.4更多內容135
3.15.5參考資料135
3.16詞袋模型表示文本136
3.16.1準備工作136
3.16.2操作方法136
3.16.3工作原理138
3.16.4更多內容140
3.16.5參考資料141
3.17計算詞頻和反文檔頻率142
3.17.1準備工作142
3.17.2操作方法142
3.17.3工作原理144
3.17.4更多內容145
第4章數據分析——深入理解146
4.1簡介146
4.2抽取主成分147
4.2.1準備工作148
4.2.2操作方法149
4.2.3工作原理151
4.2.4更多內容152
4.2.5參考資料154
4.3使用核PCA 154
4.3.1準備工作154
4.3.2操作方法154
4.3.3工作原理156
4.3.4更多內容159
4.4使用奇異值分解抽取特徵160
4.4.1準備工作161
4.4.2操作方法161
4.4.3工作原理162
4.4.4更多內容163
4.5用隨機映射給數據降維164
4.5.1準備工作164
4.5.2操作方法165
4.5.3工作原理166
4.5 .4更多內容167
4.5.5參考資料168
4.6用NMF分解特徵矩陣168
4.6.1準備工作169
4.6.2操作方法170
4.6.3工作原理172
4.6.4更多內容175
4.6.5參考資料176
第5章數據挖掘——海底撈針177
5.1簡介177
5.2使用距離度量178
5.2.1準備工作178
5.2.2操作方法179
5.2.3工作原理180
5.2.4更多內容183
5.2.5參考資料184
5.3學習和使用核方法184
5.3.1準備工作184
5.3.2操作方法185
5.3.3工作原理186
5.3.4更多內容187
5.3.5參考資料187
5.4用k-means進行數據聚類188
5.4. 1準備工作188
5.4.2操作方法190
5.4.3工作原理191
5.4.4更多內容192
5.4.5參考資料193
5.5學習向量量化193
5.5.1準備工作193
5.5.2操作方法194
5.5.3工作原理197
5.5.4更多內容199
5.5.5參考資料199
5.6在單變量數據中找出異常點200
5.6.1準備工作200
5.6.2操作方法202
5.6.3工作原理203
5.6.4更多內容205
5.6.5參考資料207
5.7使用局部異常因子方法發現異常點207
5.7.1準備工作207
5.7.2操作方法208
5.7.3工作原理210
5.7.4更多內容216
第6章機器學習1 217
6.1簡介217
6.2為建模準備數據218
6.2.1準備工作218
6.2.2操作方法218
6.2.3工作原理221
6.2.4更多內容222
6.3查找最近鄰223
6.3.1準備工作224
6.3.2操作方法226
6.3.3工作原理227
6.3.4更多內容229
6.3.5參考資料230
6.4用樸素貝葉斯分類文檔230
6.4.1準備工作232
6.4.2操作方法232
6.4.3工作原理238
6.4.4更多內容242
6.4.5參考資料242
6.5構建決策樹解決多類問題243
6.5.1準備工作244
6.5.2操作方法247
6.5.3工作原理249
6.5.4更多內容251
6.5.5參考資料252
第7章機器學習2 253
7.1簡介253
7.2回歸方法預測實數值254
7.2.1準備工作255
7.2.2操作方法256
7.2.3工作原理259
7.2.4更多內容263
7.2.5參考資料267
7.3學習L2縮減回歸——嶺回歸267
7.3.1準備工作268
7.3.2操作方法268
7.3.3工作原理271
7.3.4更多內容273
7.3.5參考資料276
7.4學習L1縮減回歸——LASSO 276
7.4. 1準備工作277
7.4.2操作方法277
7.4.3工作原理280
7.4.4更多內容283
7.4.5參考資料283
7.5 L1和L2縮減交叉驗證迭代283
7.5.1準備工作284
7.5.2操作方法284
7.5.3工作原理288
7.5.4更多內容294
7.5.5參考資料295
第8章集成方法296
8.1簡介296
8.2理解集成——掛袋法297
8.2.1準備工作298
8.2.2操作方法298
8.2 .3工作原理300
8.2.4更多內容304
8.2.5參考資料305
8.3理解集成——提升法305
8.3.1準備工作307
8.3.2操作方法307
8.3.3工作原理312
8.3.4更多內容319
8.3.5參考資料319
8.4理解集成——梯度提升320
8.4.1準備工作321
8.4.2操作方法321
8.4.3工作原理325
8.4.4更多內容330
8.4.5參考資料330
第9章生長樹331
9.1簡介331
9.2從生長樹到生長森林——隨機森林332
9.2.1準備工作333
9.2.2操作方法333
9.2.3工作原理336
9.2.4更多內容340
9.2.5參考資料342
9.3生成超隨機樹342
9.3.1準備工作343
9.3.2操作方法343
9.3.3工作原理345
9.3.4更多內容349
9.3.5參考資料349
9.4生成旋轉森林349
9.4.1準備工作350
9.4.2操作方法350
9.4.3工作原理353
9.4.4更多內容358
9.4.5參考資料358
第10章大規模機器學習——在線學習359
10.1簡介359
10.2用感知器作為在線學習算法360
10.2.1準備工作361
10.2.2操作方法362
10.2.3工作原理363
10.2.4更多內容366
10.2.5參考資料367
10.3用隨機梯度下降解決回歸問題367
10.3.1準備工作369
10.3.2操作方法369
10.3.3工作原理370
10.3.4更多內容373
10.3.5參考資料375
10.4用隨機梯度下降解決分類問題375
10.4.1準備工作376
10.4.2操作方法376
10.4.3工作原理377
10.4.4更多內容379
10.4.5參考資料380