Pandas 數據分析實戰 Pandas in Action
Boris Paskhaver 殷海英 譯
- 出版商: 清華大學
- 出版日期: 2022-08-01
- 定價: $768
- 售價: 7.9 折 $607
- 語言: 簡體中文
- ISBN: 7302612714
- ISBN-13: 9787302612711
-
相關分類:
Python
- 此書翻譯自: Pandas in Action
立即出貨
買這商品的人也買了...
-
金融科技實戰:Python 與量化投資$650$507 -
Windows 黑客編程技術詳解$648$616 -
精通 OpenCV 3 (Mastering OpenCV 3, 2/e)$500$390 -
分散式系統設計 (Designing Distributed Systems: Patterns and Paradigms for Scalable, Reliable Services)$480$379 -
實戰 Web:Bit|創客體驗x運算思維x物聯網實作$380$300 -
$709遷移學習 -- TRANSFER LEARNING (楊強教授新作) -
$422Python 機器學習系統構建 (原書第3版) -
架構師的自我修煉:技術、架構和未來$534$507 -
巨型服務架構:分布式/資料庫優化/記憶體快取設計/IO模型$690$545 -
Excel VBA 最強入門邁向辦公室自動化之路王者歸來 -- 上冊 (全彩印刷)$620$490 -
Excel VBA 最強入門邁向辦公室自動化之路王者歸來 -- 下冊 (全彩印刷) (過版書特價)$620$399 -
Python 大數據專案 X 工程 X 產品 資料工程師的升級攻略$700$553 -
Python for Excel|自動化與資料分析的現代開發環境 (Python for Excel: A Modern Environment for Automation and Data Analysis)$580$458 -
TensorFlow.js 學習手冊 (Learning Tensorflow.Js: Powerful Machine Learning in JavaScript)$580$458 -
超高效!Python × Excel 資料分析自動化:輕鬆打造你的完美工作法!$600$468 -
比 VBA 更強的 RPA 來了!Power Automate Desktop 零程式打造辦公室流程自動化$560$476 -
AWS 職場實戰手冊 - 企業架站、安全防護、費用監控,用最省錢的方式紮實學會!$620$527 -
影像辨識實務應用 -- 使用 C#【暢銷回饋版】$500$390 -
從機器學習到人工智慧|寫給 Android/iOS 程式師的 ML/AI 開發指南 (AI and Machine Learning for On-Device Development: A Programmer's Guide)$620$490 -
$512前端架構師:基礎建設與架構設計思想 -
AI策略|人與企業的數位轉型 (AI for People and Business: A Framework for Better Human Experiences and Business Success)$400$316 -
$403Flutter 跨平臺移動開發實戰 -
演算法:圖解邏輯思維 + Python 程式實作 王者歸來, 3/e$720$569 -
Python 視窗 GUI 設計 活用 tkinter 之路 -- 王者歸來, 4/e$720$569 -
$848圖神經網絡:基礎、前沿與應用
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
主要內容 ●對數據集進行組織、 分組、合並、分割以及連接 ●發現基於文本和時間的數據的趨勢 ●對數據進行排序、過濾、樞軸化、優化,並得出結論 ●應用聚合操作
目錄大綱
目 錄
第Ⅰ部分 Pandas核心基礎
第1章 Pandas概述 2
1.1 21世紀的數據 2
1.2 Pandas介紹 3
1.2.1 Pandas與圖形電子表格應用程序 4
1.2.2 Pandas與它的競爭對手 5
1.3 Pandas之旅 6
1.3.1 導入數據集 6
1.3.2 操作DataFrame 8
1.3.3 計算Series中的值 11
1.3.4 根據一個或多個條件篩選列 12
1.3.5 對數據分組 14
1.4 本章小結 17
第2章 Series對象 18
2.1 Series概述 18
2.1.1 類和實例 19
2.1.2 用值填充Series對象 19
2.1.3 自定義Series索引 21
2.1.4 創建有缺失值的Series 24
2.2 基於其他Python對象創建Series 24
2.3 Series屬性 26
2.4 檢索第一行和最後一行 28
2.5 數學運算 30
2.5.1 統計操作 30
2.5.2 算術運算 36
2.5.3 廣播 38
2.6 將Series傳遞給Python的
內置函數 40
2.7 代碼挑戰 42
2.7.1 問題描述 42
2.7.2 解決方案 42
2.8 本章小結 44
第3章 Series方法 46
3.1 使用read_csv函數導入數據集 46
3.2 對Series進行排序 51
3.2.1 使用sort_values方法按值排序 51
3.2.2 使用sort_index方法按索引
排序 53
3.2.3 使用nsmallest和nlargest方法
檢索最小值和最大值 55
3.3 使用inplace參數替換原有Series 56
3.4 使用value_counts方法計算值的
個數 57
3.5 使用apply方法對每個Series值
調用一個函數 62
3.6 代碼挑戰 65
3.6.1 問題描述 65
3.6.2 解決方案 65
3.7 本章小結 67
第4章 DataFrame對象 68
4.1 DataFrame概述 69
4.1.1 通過字典創建DataFrame 69
4.1.2 通過NumPy ndarray創建
DataFrame 70
4.2 Series和DataFrame的相似之處 72
4.2.1 使用read_csv函數導入
DataFrame 72
4.2.2 Series和DataFrame的共享與
專有屬性 73
4.2.3 Series和DataFrame的共有方法 75
4.3 對DataFrame進行排序 78
4.3.1 按照單列進行排序 78
4.3.2 按照多列進行排序 80
4.4 按照索引進行排序 81
4.4.1 按照行索引進行排序 82
4.4.2 按照列索引進行排序 82
4.5 設置新的索引 83
4.6 從DataFrame中選擇列 84
4.6.1 從DataFrame中選擇單列 84
4.6.2 從DataFrame中選擇多列 85
4.7 從DataFrame中選擇行 86
4.7.1 使用索引標簽提取行 87
4.7.2 按索引位置提取行 89
4.7.3 從特定列中提取值 90
4.8 從Series中提取值 93
4.9 對行或列進行重命名 93
4.10 重置索引 94
4.11 代碼挑戰 96
4.11.1 問題描述 96
4.11.2 解決方案 96
4.12 本章小結 99
第5章 對DataFrame進行過濾 100
5.1 優化數據集以提高內存
使用效率 100
5.2 按單個條件過濾 106
5.3 按多個條件過濾 109
5.3.1 AND條件 109
5.3.2 OR條件 110
5.3.3 ~條件 111
5.3.4 布爾型方法 112
5.4 按條件過濾 112
5.4.1 isin方法 113
5.4.2 between方法 113
5.4.3 isnull和notnull方法 115
5.4.4 處理空值 117
5.5 處理重復值 119
5.5.1 duplicated方法 119
5.5.2 drop_duplicates方法 121
5.6 代碼挑戰 123
5.6.1 問題描述 123
5.6.2 解決方案 124
5.7 本章小結 127
第Ⅱ部分 應用Pandas
第6章 處理文本數據 130
6.1 字母的大小寫和空格 130
6.2 字符串切片 134
6.3 字符串切片和字符替換 135
6.4 布爾型方法 137
6.5 拆分字符串 139
6.6 代碼挑戰 143
6.6.1 問題描述 143
6.6.2 解決方案 143
6.7 關於正則表達式的說明 145
6.8 本章小結 146
第7章 多級索引DataFrame 147
7.1 MultiIndex對象 148
7.2 MultiIndex DataFrame 151
7.3 對MultiIndex進行排序 156
7.4 通過MultiIndex提取列或行 159
7.4.1 提取一列或多列 160
7.4.2 使用loc提取一行或多行 162
7.4.3 使用iloc提取一行或多行 166
7.5 交叉選擇 168
7.6 索引操作 169
7.6.1 重置索引 169
7.6.2 設置索引 172
7.7 代碼挑戰 174
7.7.1 問題描述 174
7.7.2 解決方案 175
7.8 本章小結 177
第8章 數據集的重塑和透視 178
8.1 寬數據和窄數據 178
8.2 由DataFrame創建數據透視表 180
8.2.1 pivot_table方法 180
8.2.2 數據透視表的其他選項 184
8.3 對索引級別進行堆疊和取消
堆疊 186
8.4 融合數據集 188
8.5 展開值列表 191
8.6 代碼挑戰 193
8.6.1 問題描述 193
8.6.2 解決方案 194
8.7 本章小結 197
第9章 GroupBy對象 198
9.1 從頭開始創建GroupBy對象 198
9.2 從數據集中創建GroupBy對象 200
9.3 GroupBy對象的屬性和方法 202
9.4 聚合操作 206
9.5 將自定義操作應用於所有組 209
9.6 按多列分組 210
9.7 代碼挑戰 211
9.7.1 問題描述 211
9.7.2 解決方案 212
9.8 本章小結 214
第10章 合並與連接 215
10.1 本章使用的數據集 216
10.2 連接數據集 218
10.3 連接後的DataFrame中的
缺失值 220
10.4 左連接 222
10.5 內連接 223
10.6 外連接 225
10.7 合並索引標簽 228
10.8 代碼挑戰 229
10.8.1 問題描述 231
10.8.2 解決方案 231
10.9 本章小結 233
第11章 處理日期和時間 235
11.1 引入Timestamp對象 235
11.1.1 Python如何處理日期時間型
數據 235
11.1.2 Pandas 如何處理日期時間型
數據 238
11.2 在DatetimeIndex中存儲多個
時間戳 240
11.3 將列或索引值轉換為日期
時間類型數據 242
11.4 使用DatetimeProperties對象 243
11.5 使用持續時間進行加減 247
11.6 日期偏移 249
11.7 Timedelta對象 251
11.8 代碼挑戰 255
11.8.1 問題描述 256
11.8.2 解決方案 257
11.9 本章小結 260
第12章 導入和導出 261
12.1 讀取和寫入JSON文件 262
12.1.1 將JSON文件加載到
DataFrame中 263
12.1.2 將DataFrame導出到
JSON文件 269
12.2 讀取和寫入CSV文件 270
12.3 讀取和寫入Excel工作簿 272
12.3.1 在Anaconda環境中安裝
xlrd和openpyxl庫 272
12.3.2 導入Excel工作簿 272
12.3.3 導出Excel工作簿 275
12.4 代碼挑戰 277
12.4.1 問題描述 278
12.4.2 解決方案 278
12.5 本章小結 279
第13章 配置Pandas 280
13.1 獲取和設置Pandas選項 280
13.2 精度 284
13.3 列的最大寬度 285
13.4 截斷閾值 286
13.5 上下文選項 286
13.6 本章小結 287
第14章 可視化 289
14.1 安裝Matplotlib 289
14.2 折線圖 290
14.3 條形圖 294
14.4 餅圖 296
14.5 本章小結 297
附錄A 安裝及配置 298
附錄B Python速成課程 314
附錄C NumPy速成教程 346
附錄D 用Faker生成模擬數據 353
附錄E 正則表達式 359



