Python數據科學入門 (Data Science Essentials in Python: Collect - Organize - Explore - Predict - Value) Python数据科学入门

[俄]德米特裡·齊諾維耶夫

買這商品的人也買了...

商品描述

《Python數據科學入門》以Python 語言講解數據科學基礎知識,涵蓋了數據採集、清洗、存儲、檢索、轉換、可視化、高級數據分析(網絡分析)、統計和機器學習等內容。

具體內容包括:數據科學的Python 核心特性,文本數據、數據庫、表格形式的數值數據、series 和frame、網絡數據的使用,數據的繪制,概率與統計,機器學習。

適合研究生和本科生、數據科學教員、剛入門的數據科學專業人員,以及那些想擁有一本參考手冊來幫助記住所有Python 函數及參數的開發人員。

作者簡介

Dmitry Zinoviev 

計算機科學教授,自2001年起一直在薩福克大學任教。研究興趣包括計算機模擬與建模、網絡科學、社交網絡分析以及數字人文。擁有莫斯科國立大學物理學碩士學位和紐約州立大學石溪分校計算機科學博士學位。

目錄大綱

第1章什麼是數據科學1 
第1單元數據分析步驟2 
第2單元數據獲取途徑3 
第3單元報告的結構4 
輪到你了5 

第2章數據科學的Python核心6 
第4單元理解基本的字符串函數6 
第5單元選擇合適的數據結構8 
第6單元通過列表推導式理解列表9 
第7單元使用計數器10 
第8單元使用文件11 
第9單元上網12 
第10單元使用正則表達式實現模式匹配13 
第11單元globbing文件名與其他字符串17 
第12單元Pickling和Unpickling數據18 
輪到你了18 

第3章使用文本數據20 
第13單元處理HTML文件20 
第14單元處理CSV文件24 
第15單元讀取JSON文件25 
第16單元處理自然語言中的文本27 
輪到你了31 

第4章使用數據庫33 
第17單元設置MySQL數據庫33 
第18單元使用MySQL數據庫:命令行36 
第19單元使用MySQL數據庫:pymysql 39 
第20單元改善文檔存儲:MongoDB 41
輪到你了44 

第5章使用表格形式的數值數據45 
第21單元創建數組46 
第22單元轉置和重排48 
第23單元索引和切片49 
第24單元廣播51 
第25單元揭秘通用函數52 
第26單元理解條件函數54 
第27單元數組的聚合與排序54 
第28單元將數組用作集合56 
第29單元數組的保存和讀取57 
第30單元生成合成正弦波57 
輪到你了59 

第6章使用series和frame 61 
第31單元pandas數據結構62 
第32單元數據重塑67 
第33單元處理缺失數據72 
第34單元組合數據75 
第35單元數據的排序和描述78 
第36單元數據轉換82 
第37單元掌握pandas的文件讀寫功能87 
輪到你了90 

第7章使用網絡數據91 
第38單元概念剖析91 
第39單元網絡分析序列94 
第40單元使用networkx 95 
輪到你了101 

第8章繪圖103 
第41單元使用PyPlot進行基本繪圖104
第42單元了解其他繪圖類型106 
第43單元精通繪圖裝飾107 
第44單元用pandas繪圖109 
輪到你了111 

第9章概率與統計113 
第45單元回顧概率分佈113 
第46單元回顧統計度量115 
第47單元以Python的方式完成統計117 
輪到你了120 

第10章機器學習122 
第48單元設計預測實驗122 
第49單元線性回歸擬合124 
第50單元用k均值聚類實現數據分組129 
第51單元在隨機決策森林中生存131 
輪到你了133 

附錄1擴展閱讀135 
附錄2單星項目的解決方案137 
參考文獻146