零基礎入門 Pandas — Python 數據分析 Pandas for Everyone: Python Data Analysis
[美]丹尼爾·陳(Daniel Y. Chen)著 高慧敏 王斌 呂勇 譯
- 出版商: 清華大學
- 出版日期: 2025-02-01
- 定價: $774
- 售價: 8.5 折 $658
- 語言: 簡體中文
- 頁數: 367
- ISBN: 7302678863
- ISBN-13: 9787302678861
-
相關分類:
Python
- 此書翻譯自: Pandas for Everyone: Python Data Analysis (Paperback)
立即出貨
買這商品的人也買了...
-
Python 最強入門邁向頂尖高手之路 -- 王者歸來 (全彩版)$1,000$790 -
$469數據可視化之道:數據分析中的圖表製作思路與方法(全彩) -
UiPath RPA 開發:入門、實戰與進階$774$735 -
Python for Excel|自動化與資料分析的現代開發環境 (Python for Excel: A Modern Environment for Automation and Data Analysis)$580$458 -
Python 資料分析必備套件!Pandas 資料清理、重塑、過濾、視覺化 (Pandas 1.x Cookbook, 2/e)$780$663 -
$359ITIL 4 與 DevOps 服務管理認證指南, 2/e -
深度強化學習算法與實踐:基於 PyTorch 的實現$648$616 -
PyTorch 開發入門:深度學習模型的構建與程序實現$474$450 -
$458PyTorch 深度學習簡明實戰 -
$407Redis 數據庫從入門到實踐 -
$774利用 FastAPI 構建 Python 微服務 -
集成學習實戰$768$730 -
LangChain 大模型應用開發$479$455 -
讓 AI 好好說話!從頭打造 LLM (大型語言模型) 實戰秘笈$680$537 -
$469AI Agent 開發與應用:基於大模型的智能體構建 -
PyTorch 深度學習與大模型部署及微調$479$455 -
LLM 工程師開發手冊 (LLM Engineer's Handbook: Master the art of engineering large language models from concept to production)$1,250$988
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
"基於實用、易學的原則,從功能、使用、原理等多個維度對Pandas做了全方位的詳細講解。本書是Python數據分析入門書,每個概念都通過簡單實例來闡述,便於讀者理解與上手。具體內容包括:Python及Pandas基礎知識,加載和查看數據集,Pandas的DataFrame對象和Series對象,使用matplotlib、seaborn和Pandas提供的繪圖方法為探索性數據分析作圖,連接與合並數據集,處理缺失數據,清理數據,轉換數據類型,處理字符串,應用函數,分組操作,擬合及評估模型,正則化方法與聚類技術等。 "
作者簡介
丹尼爾·陳(Daniel Y.Chen),Lander Analytics公司數據科學家,Software Carpentry和Data Carpentry的講師和課程維護人員,DataCamp的課程講師。目前他在弗尼吉亞理工大學社會與決策分析實驗室從事政策決策數據分析。
目錄大綱
目錄
第一部分引言
第1章Pandas DataFrame基礎知識
1.1引言
1.2加載第一個數據集
1.3查看列、行和單元格
1.3.1根據列名選擇列並進行子集化
1.3.2對行進行子集化
1.3.3根據行號子集化行
1.3.4混合
1.3.5子集化行和列
1.4分組和聚合計算
1.4.1分組方式
1.4.2分組頻率計數
1.5基本繪圖
本章小結
第2章Pandas的數據結構
2.1創建數據
2.1.1創建Series
2.1.2創建DataFrame
2.2Series
2.2.1類似於ndarray的Series
2.2.2布爾型子集: Series
2.2.3自動對齊並向量化(廣播)
2.3DataFrame
2.3.1DataFrame的組成
2.3.2布爾子集化DataFrames
2.3.3自動對齊和向量化(廣播)
2.4更改Series和DataFrame
2.4.1添加列
2.4.2直接更改列
2.4.3使用.assign()方法修改列
2.4.4刪除值
2.5導出和導入數據
2.5.1Pickle
2.5.2逗號分隔值
2.5.3Excel
2.5.4Feather文件格式
2.5.5Arrow
2.5.6Dictionary
2.5.7JavaScript對象表示法
2.5.8其他數據的輸出類型
本章小結
第3章繪圖入門
3.1為什麼要將數據可視化
3.2Matplotlib基礎
3.2.1圖對象和坐標軸子圖
3.2.2圖形剖析
3.3使用Matplotlib繪制統計圖
3.3.1單變量數據
3.3.2雙變量數據
3.3.3多變量數據
3.4Seaborn
3.4.1單變量數據
3.4.2雙變量數據
3.4.3多變量數據
3.4.4分面
3.4.5Seaborn的樣式和主題
3.4.6如何瀏覽Seaborn文檔
3.4.7下一代Seaborn接口
3.5Pandas繪圖方法
3.5.1直方圖
3.5.2密度圖
3.5.3散點圖
3.5.4蜂巢圖
3.5.5箱線圖
本章小結
第4章整潔數據
4.1包含值而非變量的列
4.1.1固定一列
4.1.2固定多列
4.2包含多個變量的列
4.2.1單獨拆分和添加列
4.2.2在單個步驟中進行拆分和組合
4.3行與列中的變量
本章小結
第5章函數的應用
5.1函數入門
5.2函數應用基礎
5.2.1Series的.apply()方法
5.2.2DataFrame的.apply()方法
5.3向量化函數
5.3.1使用NumPy
5.3.2使用Numba庫
5.4Lambda函數
本章小結
第二部分數據處理
第6章數據組合
6.1組合數據集
6.2連接
6.2.1查看DataFrame的組成
6.2.2添加行
6.2.3添加列
6.2.4不同索引下的連接操作
6.3跨多張表的觀測單元
6.3.1使用循環加載多個文件
6.3.2使用列表解析加載多個文件
6.4合並多個數據集
6.4.1一對一合並
6.4.2多對一合並
6.4.3多對多合並
6.4.4使用assert語句進行檢查
本章小結
第7章數據規範化
7.1一張表中的多個觀測單元
7.2數據規範化過程
本章小結
第8章分組操作: 分割應用組合
8.1聚合
8.1.1基本的單變量分組聚合
8.1.2Pandas內置的聚合方法
8.1.3聚合函數
8.1.4同時傳入多個函數
8.1.5在.agg()方法中使用dict
8.2轉換
8.2.1zscore示例
8.2.2缺失值示例
8.3過濾器
8.4pandas.core.groupby.DataFrameGroupBy對象
8.4.1分組
8.4.2涉及多個變量的分組計算
8.4.3選擇分組
8.4.4遍歷分組
8.4.5多個分組
8.4.6平鋪結果
8.5使用多級索引
本章小結
第三部分數據類型
第9章缺失數據
9.1何為NaN值
9.2缺失值從何而來
9.2.1加載數據
9.2.2合並數據
9.2.3用戶輸入值
9.2.4重建索引
9.3處理缺失數據
9.3.1查找和統計缺失數據
9.3.2清理缺失數據
9.3.3缺失值計算
9.4Pandas內置的NA缺失值
本章小結
第10章數據類型
10.1常見的數據類型
10.2類型轉換
10.2.1轉換為字符串對象
10.2.2轉換為數值類型
10.3分類數據
10.3.1轉換為category類型
10.3.2操作分類數據
本章小結
第11章字符串和文本數據
11.1字符串
11.1.1子集化和字符串切片
11.1.2獲取字符串的最後一個字符
11.2字符串方法
11.3更多字符串方法
11.3.1.join()方法
11.3.2.splitlines()方法
11.4字符串格式化
11.4.1格式化的文字字符串
11.4.2格式化數字
11.5正則表達式
11.5.1匹配模式
11.5.2記住RegEx模式
11.5.3查找模式
11.5.4替換模式
11.5.5編譯模式
11.6regex庫
本章小結
第12章日期和時間
12.1Python的datetime對象
12.2轉換為datetime
12.3加載包含日期的數據
12.4提取日期的各個部分
12.5日期運算和timedeltas
12.6datetime方法
12.7獲取股票數據
12.8基於日期子集化數據
12.8.1DatetimeIndex對象
12.8.2TimedeltaIndex對象
12.9日期範圍
12.9.1頻率
12.9.2偏移量
12.10日期變動
12.11重新採樣
12.12時區
12.13arrow庫
本章小結
第四部分數據建模
第13章線性回歸
13.1簡單線性回歸
13.1.1使用statsmodels庫
13.1.2使用Scikitlearn庫
13.2多元回歸
13.2.1使用statsmodels庫
13.2.2使用Scikitlearn庫
13.3包含分類變量的模型
13.3.1statsmodels中的分類變量
13.3.2Scikitlearn中的分類變量
13.4帶Transformer Pipelines的Scikitlearn中的onehot編碼
本章小結
第14章廣義線性模型
14.1邏輯回歸
14.1.1使用statsmodels庫
14.1.2使用Scikitlearn庫
14.1.3註意Scikitlearn默認值
14.2泊松回歸
14.2.1使用statsmodels
14.2.2負二項回歸
14.3更多的GLM
本章小結
第15章生存分析
15.1生存數據
15.2KaplanMeier曲線
15.3Cox比例風險模型
本章小結
第16章模型診斷
16.1比較單個模型
16.1.1殘差
16.1.2QQ圖
16.2比較多個模型
16.2.1比較線性模型
16.2.2比較GLM模型
16.3K折交叉驗證
本章小結
第17章正則化
17.1為什麼要正則化
17.2LASSO回歸
17.3嶺回歸
17.4彈性網
17.5交叉驗證
本章小結
第18章聚類
18.1K均值聚類
18.2層次聚類
18.2.1Complete聚類算法
18.2.2Single聚類算法
18.2.3Average聚類算法
18.2.4Centroid聚類算法
18.2.5Ward聚類算法
18.2.6手動設置閾值
本章小結
第五部分附錄
附錄A概念圖
附錄B安裝和設置
B.1安裝Python
B.1.1Anaconda
B.1.2Miniconda
B.1.3卸載Anaconda或Miniconda
B.1.4Pyenv
B.2安裝Python包
B.3下載本書數據
附錄C命令行
C.1安裝
C.1.1Windows系統
C.1.2macOS
C.1.3Linux系統
C.2基礎
附錄D項目模板
附錄EPython代碼編寫工具
E.1命令行和文本編輯器
E.2Python和iPython
E.3Jupyter
E.4集成開發環境
附錄F工作目錄
附錄G環境
G.1Conda環境
G.2Pyenv+Pipenv
附錄H安裝程序包
H.1使用Conda安裝Python庫
H.2更新程序包
附錄I導入庫
附錄J代碼風格
附錄K容器: 列表、元組和dict
K.1列表
K.2元組
K.3dict
附錄L切片值
附錄M循環
附錄N推導式
附錄O函數
O.1默認參數
O.2任意參數
O.2.1*args
O.2.2**kwargs
附錄P範圍和生成器
附錄Q多重賦值
附錄Rnumpy.ndarray
附錄S類
附錄TCopyWarning設置
T.1修改數據子集
T.2替換值
T.3更多的資源
附錄U方法鏈
附錄V計時代碼
附錄W字符串格式化
W.1C語言風格
W.2字符串格式化: .format()方法
W.3格式化數字
附錄X條件語句(ifelifelse)
附錄Y紐約ACS邏輯回歸示例
Y.1準備數據
Y.2使用Scikitlearn庫
附錄Z復制R語言中的結果
Z.1線性回歸
Z.2邏輯回歸
Z.3泊松回歸



