Python 數據挖掘方法及應用

王斌會

  • 出版商: 電子工業
  • 出版日期: 2019-03-01
  • 定價: $294
  • 售價: 8.5$250
  • 語言: 簡體中文
  • 頁數: 216
  • 裝訂: 其他
  • ISBN: 7121344955
  • ISBN-13: 9787121344954
  • 相關分類: Python
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

商品描述

本書重點介紹Python語言在數據處理與數據挖掘方面的應用技巧,主要包括數據分析基礎知識(數據收集與分析軟件、數據挖掘的分析基礎、簡單數據的統計分析),數據分析高級方法(多元數據的綜合分析、時序數據的模型分析),大數據基本處理方法(大數據分析基礎應用、文獻計量與科研評價、社會網絡分析方法、數據分析編程平臺)等內容。附錄中還提供了Python數據分析相關方法和函數等,方便讀者隨時查看。本書內容豐富,圖文並茂,可操作性強且便於查閱,主要面向數據分析的讀者,能有效幫助讀者提高數據處理與分析的水平,提升工作效率。書中的例子數據、習題數據及相關代碼都可在作者的學習博客http://blog.leanote.com/DaPy下載使用,也可登錄華信教育資源網http://www.hxedu.com.cn免費下載。 本書適合各層次的數據分析用戶,既可作為初學者的入門指南,又可作為中高級用戶的參考手冊,同時也可作為各大中專院校和培訓班的數據分析教材。

作者簡介

暨南大學教授,中國統計學會會員,廣東省統計學會常務理事,暨南大學統計學專業博士生導師。著有多部統計學教材或專著。

目錄大綱

目錄


第一部分數據分析基礎知識


第1章數據收集與分析軟件2 
  1.1數據收集過程2 
1.1.1數據的類型2 
1.1.2數據的收集3 
1.1.3數據的管理8 
  1.2數據分析軟件9 
1.2.1數據分析軟件簡介9 
1.2.2 Python語言介紹10 
1.2.3 Python在線平台13 
  1.3 Python編程基礎18 
1.3.1 Python編程入門18 
1.3.2 Python數據類型20 
1.3.3數值分析包numpy 24 
1.3.4數據分析包pandas 25 
1.3.5 Python編程運算34 
  數據及練習1 38 


第2章數據挖掘的分析基礎41 
  2.1數據的描述分析41 
2.1.1基本統計量41 
2.1.2基本繪圖函數46 
  2.2數據的透視分析55 
2.2.1一維頻數分析56 
2.2.2二維集聚分析57 
2.2.3多維透視分析60 
  數據及練習2 62 


第3章簡單數據的統計分析64 
  3.1隨機變量及其分佈64
3.1.1均勻分佈64 
3.1.2正態分佈65 
  3.2隨機模擬及其應用67 
3.2.1隨機模擬方法67 
3.2.2模擬大數定律68 
3.2.3模擬方法求積分69 
  3.3單變量統計分析模型70 
3.3.1單變量線性相關模型71 
3.3.2單變量線性回歸模型73 
  數據及練習3 75 


第二部分數據分析高級方法


第4章多元數據的綜合分析78 
  4.1多元線性相關與回歸79 
4.1.1多元線性相關79 
4.1.2多元線性回歸模型81 
  4.2綜合評價方法91 
4.2.1綜合評價指標體系91 
4.2.2綜合評價分析方法93 
  4.3數據壓縮方法99 
4.3.1主成分分析的基本思想99 
4.3.2主成分的基本分析101 
  4.4聚類分析方法105 
4.4.1聚類分析的概念105 
4.4.2系統聚類方法108 
  數據與練習4 113 


第5章時序數據的模型分析116 
  5.1時間序列簡介116 
5.1. 1時間序列的概念116 
5.1.2時間序列的模擬116
5.1.3時間序列的讀取118 
  5.2時間序列分析模型119 
5.2.1 AR模型120 
5.2.2 MR模型120 
5.2.3 ARMA模型121 
5.2.4 ARIMA模型122 
  5.3 ARMA模型的構建124 
5.3.1序列的相關性檢驗124 
5.3.2 ARMA模型的建立與檢驗127 
5.3.3序列的平穩性檢驗131 
  5.4股票指數預測模型的構建133 
5.4.1模型的預處理134 
5.4.2參數的估計與檢驗135 
5.4. 3模型的預測136 
  數據與練習5 137 


第三部分大數據基本處理方法


第6章大數據分析基礎應用140 
  6.1大數據的概念140 
6.1.1大數據的含義140 
6.1.2大數據應用舉例141 
6.1 .3大數據分析方法142 
  6.2 Python文本預處理144 
6.2.1字符串的基本操作144 
6.2.2字符串查詢與替換146 
  6.3網絡爬蟲及應用146 
6.3.1網頁的基礎知識147 
6.3.2 Python爬蟲步驟148
6.3.3爬蟲方法的應用149 
  6.4數據庫技術及應用154 
6.4.1 Python中數據庫的使用154 
6.4.2數據庫的建立與使用155 
  數據及練習6 156 


第7章文獻計量與科研評價159 
  7.1文獻計量研究的框架159 
  7.2文獻數據的獲取與分析161 
7.2.1文獻數據的獲取161 
7.2.2文獻數據的分析163 
  7.3科研數據的管理與評價166 
7.3.1科研單位與項目分析167 
7.3.2科研期刊與作者分析169 
  數據及練習7 171 


第8章社會網絡分析方法172 
  8.1社會網絡的初步印象172 
8.1.1社會網絡分析概念172 
8.1.2社會網絡分析包174 
  8.2社會網絡圖的構建174 
8.2.1社會網絡數據形式174 
8.2.2社會網絡統計量177 
8.2.3網絡圖之知識圖譜180 
  數據及練習8 183 


第9章數據分析編程平台185 
  9.1 Anaconda科學計算發行包185 
9.1.1 Anaconda下載與安裝185 
9.1 .2 Anaconda啟動與運行186
  9.2 Jupyter編輯平台188 
9.2.1 Jupyter Notebook 188 
9.2.2 Jupyter Lab 193 
9.2.3在Jupyter中使用R語言196 
  9.3 Spyder分析平台197 
9.3.1 Spyder平台簡介197 
9.3.2 Spyder平台使用198 


附錄A本書的學習網站200 
附錄B書中的例子數據201 
附錄C書中自定義函數202 
參考文獻205