Python編程與數據分析(微課版)
余本國
相關主題
商品描述
這是一本零基礎學習Python並進行數據處理和分析的學習指導用書。這是一本零基礎學習Python並進行數據處理和分析的學習指導用書。本書共9章,主要內容包括:Python語法基礎、Python數據結構、函數和類、正則表達式與格式化輸出、Numpy和Pandas、數據處理與分析、網絡爬蟲、數據可視化、應用案例分析。本書前八章是基礎知識,並在每章末尾給出了應用案例,第九章則是綜合應用案例,屬於項目實戰。 本書內容豐富、簡單易懂,零基礎入門。適合本科生、研究生以及對 Python 語言感興趣和擬使用 Python 語言進行數據分析的讀者。
作者簡介
余本國,博士,碩士研究生導師。於中北大學理學系任教,主講線性代數、微積分、Python語言、大數據分析基礎等課程。2012年到加拿大York University做訪問學者。出版有《Python數據分析基礎》等著作。
目錄大綱
第 1 章 語法基礎
1.1 Python 概述.................................................. 1
1.2 編輯器........................................................... 2
1.2.1 安裝 Anaconda ....................................3
1.2.2 Anaconda 相關命令行.......................5
1.2.3 Spyder ...................................................5
1.2.4 Jupyter Notebook...............................6
1.3 語法規範....................................................... 9
1.4 程序結構................................................ 14
1.4.1 順序結構............................................. 14
1.4.2 分支結構............................................. 16
1.4.3 循環結構............................................. 17
1.5 異常處理.....................................................20
1.6 實戰體驗:一行代碼能幹什麼....................23
第 2 章 數據類型
2.1 字符串.........................................................24
2.2 列表.............................................................28
2.3 元組.............................................................31
2.4 字典.............................................................31
2.5 集合.............................................................33
2.6 實戰體驗:提取特定的字符.......................36
第 3 章 函數和類
3.1 函數.............................................................38
3.1.1 函數結構..............................................38
3.1.2 函數的參數 .........................................40
3.1.3 函數的遞歸與嵌套.............................42
3.2 特殊函數......................................................44
3.2.1 匿名函數..............................................44
3.2.2 map()、filter()......................................44
3.2.3 eval()函數 ............................................45
3.3 類.................................................................46
3.3.1 類的創建..............................................46
3.3.2 類的方法和屬性.................................48
3.4 函數和類的調用..........................................50
3.4.1 函數的調用 .........................................50
3.4.1 類的調用..............................................50
3.5 實戰體驗:編寫計算階乘的函數................51
第 4 章 正則表達式與格式化輸出
4.1 正則表達式基礎知識...................................53
4.2 re 模塊.........................................................55
4.2.1 判斷匹配..............................................56
4.2.2 切分字符串 .........................................56
4.2.3 分組......................................................57
4.3 貪婪匹配......................................................57
4.4 編譯............................................................. 58
4.5 正則函數..................................................... 58
4.5.1 re.compile() 函數.............................. 58
4.5.2 re.match() 函數................................. 59
4.5.3 re.search()函數................................... 61
4.5.4 re.findall()函數.................................... 62
4.5.5 字符串的替換和修改......................... 63
4.6 格式化輸出................................................. 63
4.6.1 使用%格式化輸出............................. 63
4.6.2 使用 format()方法格式化輸出.......... 64
4.6.3 使用 f 方法格式化輸出..................... 65
4.7 實戰體驗:驗證信息的正則表達式............ 65
第 5 章 NumPy 和 pandas
5.1 NumPy 庫................................................... 68
5.1.1 數組的創建......................................... 69
5.1.2 數組的操作......................................... 74
5.1.3 數組的計算......................................... 84
5.1.4 統計函數............................................. 85
5.1.5 矩陣運算............................................. 88
5.2 pandas 庫................................................... 90
5.2.1 pandas 庫常用數據類型................... 90
5.2.2 pandas 庫常用數據結構................... 91
5.2.3 數據導入........................................... 101
5.2.4 數據導出........................................... 104
5.3 實戰體驗:輸出符合條件的內容.............. 106
第 6 章 數據處理與分析
6.1 數據清洗與操作........................................ 109
6.1.1 異常值處理....................................... 109
6.1.2 數據抽取........................................... 115
6.1.3 插入記錄........................................... 126
6.1.4 修改記錄............................................127
6.1.5 交換行或列........................................129
6.1.6 索引排序............................................131
6.1.7 數據合並與分組...............................135
6.1.8 數據運算............................................141
6.1.9 日期處理............................................141
6.2 數據標準化 ...............................................145
6.2.1 最小-最大標準化..............................145
6.2.2 Z-score 標準化 .................................146
6.3 數據分析...................................................147
6.3.1 基本統計分析....................................147
6.3.2 分組分析............................................150
6.3.3 分布分析............................................151
6.3.4 交叉分析............................................153
6.3.5 結構分析............................................154
6.3.6 相關分析............................................155
6.4 實戰體驗:股票統計分析.........................156
第 7 章 網絡爬蟲
7.1 urllib 庫.....................................................162
7.2 Beautiful Soup 庫....................................164
7.3 實戰體驗:爬取豆瓣小說數據..................167
第 8 章 數據可視化
8.1 使用 Matplotlib 可視化數據.....................172
8.1.1 Matplotlib 的設置............................172
8.1.2 Matplotlib 繪圖示例........................174
8.2 無向圖與有向圖........................................183
8.2.1 模塊安裝............................................183
8.2.2 無向圖................................................184
8.2.3 有向圖................................................185
8.3 plotnine ....................................................186
8.3.1 plotnine 的安裝與導入................... 186
8.3.2 基本繪圖模式框架........................... 187
8.3.3 繪圖................................................... 188
8.3.4 堆積條形圖....................................... 194
8.3.5 分組折線圖....................................... 194
8.3.6 擬合曲線圖....................................... 194
8.3.7 夾層填充面積圖............................... 195
8.3.8 保存圖片........................................... 197
8.4 實戰體驗:《紅樓夢》部分
人物關系圖................................................198
第 9 章 應用案例分析
9.1 案例 1:社會考試數據分析......................200
9.1.1 背景介紹........................................... 200
9.1.2 數據的獲取與處理........................... 201
9.1.3 數據分析........................................... 209
9.2 案例 2:航班數據分析..............................219
9.2.1 需求介紹........................................... 219
9.2.2 預備知識............................................219
9.2.3 航班數據處理...................................222
9.2.4 完整代碼............................................227
9.3 案例 3:豆瓣小說數據分析......................229
9.3.1 數據處理............................................229
9.3.2 計算平均星級...................................231
9.3.3 計算均價............................................233
9.3.4 完整代碼............................................237
附錄
附錄 A 常用函數與註意事項...........................240
附錄 B 數據操作與分析函數速查手冊............244
附錄 C 操作 MySQL 庫...................................247
C.1 對 MySQL 的連接與訪問..................247
C.2 對 MySQL 的增、刪、改、查..........247
C.3 創建數據庫表......................................250
參考文獻 ............................................................251

