買這商品的人也買了...
-
$352面向機器智能的 TensorFlow 實踐
-
$454Python 數據分析基礎
-
$280自製 AI 圖像搜索引擎
-
$254商務數據可視化(全彩微課版)
-
$356Python 數據科學基礎與實踐
-
$398集成學習入門與實戰:原理、算法與應用
-
$301自然語言處理實踐
-
$611Python 進階:實際應用開發實戰
-
$507時間序列預測 : 基於機器學習和 Python 實現 (Machine Learning for Time Series Forecasting with Python)
-
$509Python 工匠 案例、技巧與工程實踐
-
$398從0到1 ES6快速上手
-
$305圖解量子電腦
-
$341數據分析與可視化 (基於AWS雲平臺)(微課版)
-
$534$507 -
$235雲計算應用開發(初級)
-
$811統計計算與智能分析理論及其Python實踐
-
$709Python 統計可視化之 Altair 探索分析實踐指南
-
$551雲端架構:基於雲平臺的 41種可復用的架構最佳實踐
-
$849非線性系統, 3/e (Nonlinear Systems, 3/e)
-
$383數據科學方法與實踐 ——基於 Python 技術實現
-
$403虛擬偶像 AI 實現
-
$556TensorFlow Lite 移動端深度學習
-
$450動手學 PyTorch 深度學習建模與應用
-
$518深度強化學習算法與實踐:基於 PyTorch 的實現
-
$509智能前端技術與實踐
商品描述
本書重點介紹Python語言在數據處理與數據挖掘方面的應用技巧,主要包括數據分析基礎知識(數據收集與分析軟件、數據挖掘的分析基礎、簡單數據的統計分析),數據分析高級方法(多元數據的綜合分析、時序數據的模型分析),大數據基本處理方法(大數據分析基礎應用、文獻計量與科研評價、社會網絡分析方法、數據分析編程平臺)等內容。附錄中還提供了Python數據分析相關方法和函數等,方便讀者隨時查看。本書內容豐富,圖文並茂,可操作性強且便於查閱,主要面向數據分析的讀者,能有效幫助讀者提高數據處理與分析的水平,提升工作效率。書中的例子數據、習題數據及相關代碼都可在作者的學習博客http://blog.leanote.com/DaPy下載使用,也可登錄華信教育資源網http://www.hxedu.com.cn免費下載。 本書適合各層次的數據分析用戶,既可作為初學者的入門指南,又可作為中高級用戶的參考手冊,同時也可作為各大中專院校和培訓班的數據分析教材。
作者簡介
暨南大學教授,中國統計學會會員,廣東省統計學會常務理事,暨南大學統計學專業博士生導師。著有多部統計學教材或專著。
目錄大綱
目錄
第一部分數據分析基礎知識
第1章數據收集與分析軟件2
1.1數據收集過程2
1.1.1數據的類型2
1.1.2數據的收集3
1.1.3數據的管理8
1.2數據分析軟件9
1.2.1數據分析軟件簡介9
1.2.2 Python語言介紹10
1.2.3 Python在線平台13
1.3 Python編程基礎18
1.3.1 Python編程入門18
1.3.2 Python數據類型20
1.3.3數值分析包numpy 24
1.3.4數據分析包pandas 25
1.3.5 Python編程運算34
數據及練習1 38
第2章數據挖掘的分析基礎41
2.1數據的描述分析41
2.1.1基本統計量41
2.1.2基本繪圖函數46
2.2數據的透視分析55
2.2.1一維頻數分析56
2.2.2二維集聚分析57
2.2.3多維透視分析60
數據及練習2 62
第3章簡單數據的統計分析64
3.1隨機變量及其分佈64
3.1.1均勻分佈64
3.1.2正態分佈65
3.2隨機模擬及其應用67
3.2.1隨機模擬方法67
3.2.2模擬大數定律68
3.2.3模擬方法求積分69
3.3單變量統計分析模型70
3.3.1單變量線性相關模型71
3.3.2單變量線性回歸模型73
數據及練習3 75
第二部分數據分析高級方法
第4章多元數據的綜合分析78
4.1多元線性相關與回歸79
4.1.1多元線性相關79
4.1.2多元線性回歸模型81
4.2綜合評價方法91
4.2.1綜合評價指標體系91
4.2.2綜合評價分析方法93
4.3數據壓縮方法99
4.3.1主成分分析的基本思想99
4.3.2主成分的基本分析101
4.4聚類分析方法105
4.4.1聚類分析的概念105
4.4.2系統聚類方法108
數據與練習4 113
第5章時序數據的模型分析116
5.1時間序列簡介116
5.1. 1時間序列的概念116
5.1.2時間序列的模擬116
5.1.3時間序列的讀取118
5.2時間序列分析模型119
5.2.1 AR模型120
5.2.2 MR模型120
5.2.3 ARMA模型121
5.2.4 ARIMA模型122
5.3 ARMA模型的構建124
5.3.1序列的相關性檢驗124
5.3.2 ARMA模型的建立與檢驗127
5.3.3序列的平穩性檢驗131
5.4股票指數預測模型的構建133
5.4.1模型的預處理134
5.4.2參數的估計與檢驗135
5.4. 3模型的預測136
數據與練習5 137
第三部分大數據基本處理方法
第6章大數據分析基礎應用140
6.1大數據的概念140
6.1.1大數據的含義140
6.1.2大數據應用舉例141
6.1 .3大數據分析方法142
6.2 Python文本預處理144
6.2.1字符串的基本操作144
6.2.2字符串查詢與替換146
6.3網絡爬蟲及應用146
6.3.1網頁的基礎知識147
6.3.2 Python爬蟲步驟148
6.3.3爬蟲方法的應用149
6.4數據庫技術及應用154
6.4.1 Python中數據庫的使用154
6.4.2數據庫的建立與使用155
數據及練習6 156
第7章文獻計量與科研評價159
7.1文獻計量研究的框架159
7.2文獻數據的獲取與分析161
7.2.1文獻數據的獲取161
7.2.2文獻數據的分析163
7.3科研數據的管理與評價166
7.3.1科研單位與項目分析167
7.3.2科研期刊與作者分析169
數據及練習7 171
第8章社會網絡分析方法172
8.1社會網絡的初步印象172
8.1.1社會網絡分析概念172
8.1.2社會網絡分析包174
8.2社會網絡圖的構建174
8.2.1社會網絡數據形式174
8.2.2社會網絡統計量177
8.2.3網絡圖之知識圖譜180
數據及練習8 183
第9章數據分析編程平台185
9.1 Anaconda科學計算發行包185
9.1.1 Anaconda下載與安裝185
9.1 .2 Anaconda啟動與運行186
9.2 Jupyter編輯平台188
9.2.1 Jupyter Notebook 188
9.2.2 Jupyter Lab 193
9.2.3在Jupyter中使用R語言196
9.3 Spyder分析平台197
9.3.1 Spyder平台簡介197
9.3.2 Spyder平台使用198
附錄A本書的學習網站200
附錄B書中的例子數據201
附錄C書中自定義函數202
參考文獻205