Python數據科學實踐

常象宇//曾智億//李春艷//程茜著

  • 出版商: 北京大學
  • 出版日期: 2020-07-01
  • 定價: $414
  • 售價: 7.9$327
  • 貴賓價: 7.5$311
  • 語言: 簡體中文
  • 頁數: 270
  • 裝訂: 平裝
  • ISBN: 7301313195
  • ISBN-13: 9787301313190
  • 相關分類: Data Science
  • 立即出貨

買這商品的人也買了...

商品描述

本書是由狗熊會推出的一本利用Python介紹數據科學基本過程的著作。
本書以Python語言為基礎,介紹利用Python進行數據科學研究與商業分析的全貌。
其核心的設計理念是通過經典的商業應用案例對數據爬取、數據存儲、
數據清洗、數據建模的核心Python模塊做相應的介紹。 

本書的特點是強調數據科學帶來的商業價值理念,所以其可以作為高等學校數據科學、
大數據管理與應用、統計或相關的教材,也適合從事數據分析的工作者和愛好者閱讀

作者簡介

常象宇

西安交通大學管理學院副教授,西安交通大學應用數學係與加州大學伯克利分校統計系聯合培養博士,
華盛頓大學西雅圖分校工業與工程系客座副教授,狗熊會聯合創始人
負責歐亞·狗熊會數據科學研究院的工作。對人工智能、統計機器學習、深度學習等有深入研究。


曾智億

畢業於西南交通大學金融學,曾參與西南交通大學智慧營銷實驗室、平安證券、
建設銀行、榮耀電商、三一重工等實習或駐場項目,對爬蟲數據採集、
數據分析、自然語言處理等有深入研究。

李春艷

西安交通大學工業工程碩士在讀,曾參與狗熊會火鍋系列精品案例的編寫,
以及參與新浪微博和百詞斬等項目實踐,對商務統計分析有深入研究。

程茜

西安歐亞學院金融學院教師。
2015年進入狗熊會數據分析研究院,2017年開始承擔金融學院數據科學與大數據技術教學工作,
教授課程有編程和程序設計、回歸分析和數據挖掘等。

目錄大綱

第1章基於Python的數據科學環境搭建 1 
1.1 Python是數據科學 “大勢所趨”2 
1.2 Anaconda入門 ——工欲善其事,必先利其器 4 
1.3 Jupyter Notebook入門 15 
1.4 Markdown單元格的使用 25 
1.5 Spyder入門 34 
1.6 小結 38 

第2章Python基礎 39 
2.1 “火鍋團購數據”簡介 40 
2.2 讀寫數據 41 
2.3 Python數據類型與結構 44 
2.4 控制流、函數與模塊 58 
2.5 面向對象編程的基本概念 66 
2.6 Numpy簡介 72 
2.7 小結 77 

第3章Python的數據處理模塊 78 
3.1 初級篇 ——相遇 Pandas79 
3.2 進階篇 ——相識 Pandas90 
3.3 小結 99 

第4章Python的繪圖模塊 100 
4.1 為什麼需要數據可視化 101 
4.2 初級篇 ——Matplotlib基礎 102 
4.3篇 ——Plotly基礎 121 
4.4 小結 139 

第5章Python的統計建模模塊 141 
5.1 Statsmodels簡介 142 
5.2 數據接入 143 
5.3 統計模型參數估計 145 
5.4 統計假設檢驗 153 
5.5 探索分析 159 
5.6 小結 165 

第6章Python的機器學習模塊 166 
6.1 機器學習的定義 167 
6.2 使用 scikit -learn169 
6.3 小結 182 

第7章Python的爬蟲模塊 183 
7.1 爬蟲的定義 184 
7.2 初級篇 ——單頁面靜態爬蟲 185 
7.3 中級篇 ——多頁面靜態爬蟲 197 
7.4篇 ——爬蟲的偽裝 205 
7.5 終級篇 ——動態爬蟲 212 
7.6 爬蟲注意事項 217 
7.7 小結 217 

第8章Python的文本分析模塊 218 
8.1 準備 :理解文本分析流程 219 
8.2 實戰 224 
8.3 小結 232 

第9章Python的數據庫模塊 233 
9.1 為什麼需要數據庫 234 
9.2 初級篇 ——SQLAlchemy的基本使用 235 
9.3篇 244 
9.4 小結 248 

第10章精品案例——火鍋團購分析 249 
10.1 背景介紹 250  
10.2 數據描述 252 
10.3 建模分析 264 
10.4 小結 269