程式菜鳥學Python數據分析

紀賀元著

  • 出版商: 機械工業
  • 出版日期: 2024-03-01
  • 定價: $534
  • 售價: 8.5$454
  • 語言: 簡體中文
  • 頁數: 252
  • 裝訂: 平裝
  • ISBN: 7111746619
  • ISBN-13: 9787111746614
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

商品描述

本書分為兩篇。
Python基礎篇(第1-7章)主要介紹了Python的工作環境、程式設計基礎、Excel資料檔的操作、pandas資料包的應用等。
對於Python初學者,這部分內容是必學的。
學完這部分內容,讀者不僅可以快速掌握Python程式設計基礎,
還能快速入門資料分析操作,進而應付大部分初級的Python資料分析類別工作。
Python資料分析高階篇(第8-15章)著重介紹了Python在諸多資料分析模型中的應用,
包括資料預處理、相關與迴歸、分類、決策樹、關聯分析、降維等重要且經典的資料模型,也介紹了爬蟲的許多實踐案例。

目錄大綱

前 言
Python是基礎篇
第1章 學習Python的優勢  2
1.1 Python的特色  2
1.1.1 程式碼簡單易懂  3
1.1.2 包羅萬象的Python包  5
1.1.3 超高的知名度和廣泛的應用面  6
1.2 學習Python的收穫  7
1.2.1 工作效率的提升  7
1.2.2 工作能力的增強  7
1.2.3 職場競爭力的提升  8
1.3 如何有效率地學習Python  8
1.3.1 打好程式設計基礎  8
1.3.2 多「攢」代碼  8
1.3.3 精通程式碼調試  9
1.3.4 面向實際工作場景  10
第2章 Python的工作環境  11
2.1 Python工作環境的構成  11
2.1.1 核心的Python軟體  11
2.1.2 Anaconda  12
2.1.3 IDE  13
2.2 安裝過程中常見的問題  14
2.3 Python的兩種解釋器  14
2.4 包的安裝  22
2.4.1 線上安裝  22
2.4.2 離線安裝  23
2.5 PyCharm中的解釋器配置  26
2.5.1 兩種解譯器的配置  27
2.5.2 Anaconda中第三方包的配置  31
2.6 編譯.py檔生成.exe檔  33
第3章 Python程式設計基礎  38
3.1 與檔案系統相關的5個常見問題  38
3.2 編碼格式  43
3.3 Python編程中的特殊性  45
3.4 Python中的資料結構  46
3.4.1 序列  47
3.4.2 列表  49
3.4.3 元組  51
3.4.4 字典  52
3.4.5 集合  57
3.5 Python基礎語句  59
第4章 Python程式調試  62
4.1 程序調試的常識  62
4.2 Python程式碼的常見錯誤類型  63
4.3 程序調試方法  64
4.3.1 程序調試的基本操作  64
4.3.2 程式調試的基本方法  77
第5章 Excel和Text檔案的讀寫操作  79
5.1 Text文件讀寫包  79
5.2 Excel讀寫的四重循環  81
5.3 openpyxl包  83
5.4 xlsxwriter包  87
第6章 資料處理神器pandas  90
6.1 pandas的安裝  90
6.2 pandas的資料結構  91
6.3 pandas資料處理  96
6.3.1 從Excel檔案讀取資料  96
6.3.2 切片  97
6.3.3 排序、篩選與分類總結  100
6.3.4 資料合併  105
6.4 pandas統計分析  111
6.4.1 統計分析指標  111
6.4.2 pandas繪圖  116
6.5 其他pandas功能  117
第7章 Matplotlib圖形呈現包  118
7.1 Matplotlib包介紹  118
7.2 利用Matplotlib包繪圖  119
7.2.1 折線圖  119
7.2.2 散點圖  125
7.2.3 長條圖  126
7.2.4 餅圖  126
7.2.5 直方圖  131
7.3 圖形部件繪製代碼  132
7.4 綜合繪圖範例  135
Python資料分析進階篇
第8章 資料預處理  140
8.1 資料預處理的目標與方法  140
8.1.1 縮放法  141
8.1.2 分段轉換  144
8.1.3 定性資料定量化  144
8.1.4 資料填入  145
8.2 Python資料預處理的方法  147
第9章 資料分析的常見問題與方法  150
9.1 資料分析的常見問題  150
9.1.1 資料擷取問題  150
9.1.2 資料描述問題  151
9.1.3 資料間關係的界定與挖掘問題  151
9.1.4 時間序列(預測)問題  152
9.2 資料分析的常見方法  152
9.2.1 標識分析法  152
9.2.2 排序分析法  154
9.2.3 漏斗分析法  154
9.2.4 二八分析法  156
9.2.5 異常值分析法  158
9.2.6 對比分析法  164
9.2.7 分組(類)分析法  166
9.2.8 因果關係判斷法  166
9.2.9 假設排除分析法  167
9.2.10 趨勢分析法  167
第10章 相關與回歸  169
10.1 相關  169
10.1.1 相關分析的涵義  169
10.1.2 相關分析在Excel軟體中實現的  171
10.1.3 相關分析在Python中的實現  176
10.2 回歸  178
10.2.1 線性迴歸  180
10.2.2 非線性迴歸  183
10.2.3 多元線性迴歸  186
10.2.4 Logistic回歸  187
第11章 分類  192
11.1 KNN演算法  193
11.2 聚類原理  196
11.3 聚類在Python中的實作  198
第12章 決策樹  202
12.1 決策樹原理  203
12.2 決策樹程式碼解析  204
第13章 關聯分析  210
13.1 關聯分析原理  211
13.2 關聯分析的資料預處理  215
13.3 關聯分析程式碼解析  216
第14章 降維  220
14.1 為什麼要降維  221
14.2 用Python實現主成分分析  223
第15章 透過爬蟲獲取資料的方法與實務  227
15.1 爬蟲基本原理  228
15.2 爬蟲爬取的內容  228
15.3 爬蟲實踐  229
15.3.1