利用 Python 進行數據分析 (Python for Data Analysis)
麥金尼 (Wes McKinney)
- 出版商: 機械工業
- 出版日期: 2014-01-01
- 定價: $534
- 售價: 8.5 折 $454
- 語言: 簡體中文
- 頁數: 451
- 裝訂: 平裝
- ISBN: 7111436733
- ISBN-13: 9787111436737
-
相關分類:
Python、資料科學
- 此書翻譯自: Python for Data Analysis (Paperback)
-
其他版本:
利用 Python 進行數據分析 (Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2/e)
已絕版
此書已有新版 ↗️買這商品的人也買了...
-
$620$490 -
$2,090$1,986 -
$294$279 -
$880$748 -
$454Python 自然語言處理 (Natural Language Processing with Python)
-
$540$486 -
$650$553 -
$780$616 -
$360$306 -
$345$328 -
$352Python 資料分析與挖掘實戰
-
$560$437 -
$301Python 數據挖掘入門與實踐 (Learning Data Mining with Python)
-
$580$452 -
$580$458 -
$300$285 -
$580$458 -
$354$336 -
$590$502 -
$500$425 -
$360$180 -
$590$460 -
$390$371 -
$1,400$1,330 -
$780$616
相關主題
商品描述
<內容簡介>
由於作者麥金尼是pandas庫的主要作者,所以本書也可以作為利用Python實現數據密集型應用的科學計算實踐指南。《利用Python進行數據分析》適合剛剛接觸Python的分析人員以及剛剛接觸科學計算的Python程序員。將IPython這個交互式Shell作為你的首要開發環境。
《利用Python進行數據分析》:
學習NumPy(NumericalPython)的基礎和高級知識。
從pandas庫的數據分析工具開始。
利用高性能工具對數據進行加載、清理、轉換、合併以及重塑。
利用matpIotlib創建散點圖以及靜態或交互式的可視化結果。
利用pandas的groupby功能對數據集進行切片、切塊和匯總操作。
處理各種各樣的時間序列數據。
通過詳細的案例學習如何解決Web分析、社會科學、金融學以及經濟學等領域的問題。
<目錄>
第1章 準備工作
本書主要內容
為什麼要使用Python進行數據分析
重要的Pvthon庫
安裝和設置
社區和研討會
使用本書
致謝
第2章 引言
來自bit.1y的1usagov數據
MovieLens 1M數據集
1880一2010年間全美嬰兒姓名
小結及展望
第3章 IPython:一種交互式計算和開發環境
IPvthon基礎
內省
使用命令歷史
與操作系統交互
軟件開發工具
IPython HTML NOtebOOk
利用IPython提高代碼開發效率的幾點提示
高級IPython功能
致謝
第4章 NumPy基礎:數組和矢量計算
NumPy的ndarray:一種多維數組對象
通用函數快速的元素級數組函數
利用數組進行數據處理
用於數組的文件輸入輸出
線性代數
隨機數生成
範例:隨機漫步
第5章 pandas入f]
pandas的數據結構介紹
基本功能
匯總和計算描述統計
處理缺失數據
層次化索引
其他有關Pandas的話題
第6章 數據加載、存儲與文件格式
讀寫文本格式的數據
二進制數據格式
使用HTML和web API
使用數據庫
第7章 數據規整化:清理、轉換、合併、重塑
合併數據集
重塑和軸向旋轉
數據轉換
字符串操作
示例usDA食品數據庫
第8章 繪圖和可視化
matDlotlib API入門
pandas中的繪圖函數
繪製地圖 圖形化顯示海地地震危機數據
Python圖形化工具生態系統
第9章 數據聚合與分組運算
GroupBy技術
數據聚合
分組級運算和轉換
透視表和交叉表
示例:2012聯邦選舉委員會數據庫
第10章 時間序列
日期和時間數據類型及工具
時間序列基礎
日期的範圍頻率以及移動
時區處理
時期及其算術運算
重採樣及頻率轉換
時間序列繪圖
移動窗口函數
性能和內存使用方面的註意事項
第11章 金融和經濟數據應用
數據規整化方面的話題
分組變換和分析
更多示例應用
第12章 NumPy高級應用
ndarray對象的內部機理
高級數組操作
廣播
ufunc高級應用
結構化和記錄式數組
更多有關排序的話題
NumPy的matrix類
高級數組輸入輸出
性能建議
附錄A Python語言精要