Python數據分析實戰——從Excel輕松入門Pandas

曾賢志

  • 出版商: 清華大學
  • 出版日期: 2022-05-01
  • 定價: $474
  • 售價: 8.5$403
  • 語言: 簡體中文
  • ISBN: 7302602816
  • ISBN-13: 9787302602811
  • 相關分類: ExcelData Science
  • 立即出貨 (庫存 < 4)

  • Python數據分析實戰——從Excel輕松入門Pandas-preview-1
  • Python數據分析實戰——從Excel輕松入門Pandas-preview-2
  • Python數據分析實戰——從Excel輕松入門Pandas-preview-3
Python數據分析實戰——從Excel輕松入門Pandas-preview-1

買這商品的人也買了...

相關主題

商品描述

本書從零開始系統講解了使用Pandas導入Excel數據,然後使用Pandas技術對數據做整理和分析,最後導出為不同形式的Excel文件。完整實現了數據的導入、處理、輸出的處理流程。 全書共10章。第1章為Pandas數據處理環境的搭建,第2章為使用Pandas對Excel數據讀取與保存,第3章介紹與Pandas底層數據相關的NumPy庫,第4章介紹了Pandas中DataFrame表格的增、刪、改、查等常用操作,第5章介紹了對Series與DataFrame兩種數據的運算、分支、遍歷等處理,第6章介紹了字符串的各種清洗技術,第7章介紹時間戳與時間差數據的處理,第8章介紹Pandas中分層索引及與索引相關的操作,第9章介紹了對數據的分組處理及做數據透視表處理,第10章介紹了表格的數據結構轉換,以及多表讀取與保存。書中包含相應示例,不僅可以學會理論知識還可以靈活應用。 本書可作為Excel愛好者和數據分析初學者的入門書籍,以及想提高數據分析效率,拓展數據分析手段相關人員的參考書籍。

目錄大綱

目錄

第1章Pandas數據處理環境搭建

1.1Pandas環境配置

1.1.1安裝Python發行版本Anaconda

1.1.2程序編寫工具Jupyter Notebook

1.2Python基礎操作

1.2.1變量

1.2.2註釋

1.2.3代碼縮進

1.2.4數據結構

1.2.5控制語句

1.2.6函數

第2章Pandas中數據的存取

2.1讀取Excel文件數據

2.2讀取CSV文件數據

2.3保存為Excel文件格式

2.4保存為CSV文件格式

2.5Pandas中表格的結構

2.5.1DataFrame數據結構

2.5.2Series數據結構

第3章NumPy數據處理基石

3.1NumPy的定義

3.2NumPy數組的創建與轉換

3.2.1普通數組

3.2.2序列數組

3.2.3隨機數組

3.2.4轉換數組

3.3NumPy數組的預處理

3.3.1類型轉換

3.3.2缺失值處理

3.3.3重復值處理

3.4NumPy數組維度轉換

3.4.1數組維度轉換

3.4.2數組合並

3.5Series數據的創建

3.6DataFrame表格的創建

3.6.1使用NumPy數組創建DataFrame表格

3.6.2使用Python列表創建DataFrame表格

3.6.3使用Python字典創建DataFrame表格

第4章表格管理技術

4.1表格屬性獲取與修改

4.1.1表格屬性的獲取

4.1.2表格屬性修改

4.2表格的切片選擇

4.2.1切片法

4.2.2篩選法

4.2.3loc切片法

4.2.4iloc切片法

4.3添加表格的行和列

4.3.1添加行

4.3.2添加列

4.4刪除表格的行和列

4.4.1刪除行

4.4.2刪除列

4.4.3刪除有缺失值的行和列

4.5表格數據的修改

4.6鞏固案例

第5章數據處理基礎

5.1數據運算處理

5.1.1運算符與運算函數

5.1.2Series與單值的運算

5.1.3DataFrame與單值運算

5.1.4Series與Series運算

5.1.5DataFrame與DataFrame運算

5.1.6DataFrame與Series運算

5.1.7數據運算時的對齊特性

5.2數據分支判斷

5.2.1條件判斷處理1(mask()與where())

5.2.2條件判斷處理2(np.where())

5.3數據遍歷處理

5.3.1遍歷Series元素(map())

5.3.2遍歷DataFrame行和列(apply())

5.3.3遍歷DataFrame元素(applymap())

5.4數據統計處理

5.4.1聚合統計

5.4.2邏輯統計

5.4.3極值統計

5.4.4排名統計

5.5鞏固案例

5.5.1根據不同蔬菜的採購數量統計每天採購金額

5.5.2篩選出成績表中各科目均大於或等於100的記錄

5.5.3篩選出成績表中各科目的和大於或等於300的記錄

5.5.4統計每個人各科目總分之和的排名

5.5.5統計每個人所有考試科目的最優科目

第6章字符串清洗技術

6.1正則

6.1.1正則表達式的導入與創建

6.1.2正則表達式處理函數

6.1.3正則表達式編寫規則

6.2拆分

6.2.1普通拆分

6.2.2正則拆分

6.2.3拆分次數

6.2.4拆為表格

6.2.5實例應用

6.3提取

6.3.1將數據提取到列方向

6.3.2將數據提取到行方向

6.3.3實例應用

6.4查找

6.4.1查找位置

6.4.2查找判斷

6.4.3查找數據

6.4.4實例應用

6.5替換

6.5.1Series數據替換

6.5.2DataFrame表格替換

6.5.3實例應用

6.6長度

6.7重復

6.8修剪

6.9填充

6.9.1元素填充

6.9.2字符填充

6.10去重

6.10.1重復項判斷

6.10.2重復項刪除

6.11排序

6.11.1單列排序

6.11.2多列排序

6.11.3自定義排序

6.12合並

6.12.1Series數據自身元素合並

6.12.2Series數據與其他數據合並

6.13擴展

6.14鞏固案例

6.14.1篩選出分數中至少有3個大於或等於90分的記錄

6.14.2兩表查詢合並應用

6.14.3給關鍵信息加掩碼

6.14.4提取文本型單價後與數量做求和統計

6.14.5提取不重復名單

6.14.6對文本中的多科目成績排序

第7章日期和時間處理技術

7.1時間戳

7.1.1單個時間戳

7.1.2時間戳序列

7.1.3時間戳轉換

7.1.4時間戳信息獲取

7.2時間差

7.2.1單個時間差

7.2.2時間差序列

7.2.3時間差信息獲取

7.2.4時間差偏移

7.3鞏固案例

7.3.1根據出生日期計算年齡

7.3.2將不規範日期整理為標準日期

7.3.3根據開始時間到結束時間的時長計算金額

7.3.4根據借書起始時間及租借天數計算歸還日期

第8章高級索引技術

8.1Pandas索引

8.1.1Series索引

8.1.2DataFrame索引

8.2分層索引的設置

8.2.1Series的分層索引設置

8.2.2DataFrame的分層索引設置

8.3分層索引設置的4種方法

8.4文件導入導出時分層索引設置

8.5行索引與列數據的相互轉換

8.5.1列數據設置為行索引

8.5.2行索引設置為列數據

8.6分層索引切片

8.6.1選擇單行

8.6.2選擇單列

8.6.3選擇單值

8.6.4選擇多行多列

8.6.5選擇指定級別數據

8.6.6篩選索引

8.7索引的修改

8.7.1索引重命名

8.7.2索引重置

8.7.3索引排序

8.7.4索引層級交換

8.7.5索引刪除

8.8鞏固案例

8.8.1篩選出下半年總銷量大於上半年的記錄

8.8.2對文本型數字月份排序

8.8.3根據分數返回等級設置索引

第9章數據匯總技術

9.1分組處理

9.1.1分組

9.1.2聚合

9.1.3轉換

9.1.4過濾

9.1.5高級分組

9.2數據透視表

9.2.1指定索引方向分組聚合

9.2.2多列執行單種聚合

9.2.3單列執行多種聚合

9.2.4多列執行多種聚合

9.2.5指定列做指定聚合

9.2.6行索引和列索引分組聚合

9.2.7跟列數據長度相同的數組做分組

9.2.8數據透視表缺失值處理

9.2.9數據透視表的行和列總計設置

9.3鞏固案例

9.3.1提取各分組的前兩名記錄

9.3.2按條件篩選各分組的記錄

9.3.3提取各分組下的唯一值

9.3.4分組批量拆分表格到Excel文件

9.3.5將數據透視表拆分為Excel文件

第10章表格轉換技術

10.1表格方向轉換

10.1.1列索引數據轉換成行索引數據

10.1.2將行索引數據轉換成列索引數據

10.2表格縱橫拼接

10.2.1表格縱向拼接(初級)

10.2.2表格縱向拼接(進階)

10.2.3表格橫向拼接(初級)

10.2.4表格橫向拼接(進階)

10.3表格數據存取

10.3.1批量讀取

10.3.2批量保存

10.4鞏固案例

10.4.1多個工作表數據合並

10.4.2工資條製作

10.4.3特殊的縱向表格拼接

10.4.4多工作表合並與聚合處理

10.4.5跨表查詢後再聚合匯總

10.4.6將匯總結果分發到不同工作表