統計分析:以R語言為工具

朱雪寧 等

商品描述

本書圍繞經典的統計方法與 R 語言工具,從基本的統計描述分析方法出發,講解了參數估計與假設檢驗、線性回歸、邏輯回歸、降維分析方法,每一章重點介紹一種經典方法或統計模型,對其基本定義、模型形式、統計方法的推導與解讀等都給出了細致的講解。此外,為了將理論與實踐緊密結合,本書每一章均提供了不同業務場景下的R語言編程實例,幫助讀者練習鞏固。本書適合相關學科本科生及研究生,以及對數據分析及建模感興趣的讀者。

作者簡介

2017年獲得北京大學光華管理學院商務統計與經濟系,2019年度上海市青年科技英才帆計劃,主要參與國家自然科學研究。 為網絡數據及商務應用等,在文章分析期刊發表論文二十餘餘篇,有《R語言:從數據思維到數據實戰》。


任怡萌,倫敦政治經濟學院博士


張桂維,復旦大學大數據學院碩士


米汶權,復旦大學大數據學院碩士

目錄大綱

統計分析與R語言1
1.1 統計分析簡介 1
1.1.1了解數據及業務問題002
1.1.2數據預處理與調整003
1.1.3數據描述及探索性分析003
1.1.4模型構建及解讀004
1.2 R語言簡介 006
1.2.1為什麼要使用R語言 006
1.2.2 R語言的下載與安裝 007
1.2.3 R語言的使用 010
1.2.4工具包014
1.3島嶼小結015
1.4 習題016

R語言中的數據管理及調整
2.1 基本數據類型 019
2.1.1數值型019
2.1.2字符型020
2.1.3 邏輯型 020
2.1.4 實體型 021
2.1.5時間型022
2.2 數據結構 022
2.2.1 正交 022
2.2.2矩陣028
2.2.3數組031
2.2.4數據框033
2.2.5列表036
2.3 數據的讀入及寫出 042
2.3.1直接輸入數據042
2.3.2從帶傷害符的文本文件中導入數據 042
2.3.3導入Excel數據044
2.3.4逐行讀入數據044
2.3.5 數據的寫出 045
2.4 數據集管理及改造046
2.4.1 了解數據概況 047
2.4.2 變量類型轉換 048
2.4.3 時間型數據的操作 050
2.4.4數據集合併051
2.4. 5數據數據、異常 052
2.5島嶼小結053
2.6 習題053

基本統計分析 54
3.1基本描述統計量056
3.1.1頻數統計056
3.1.2均值057
3.1.3 分貝057
3.1.4方差、標準差058
3.1.5 協方差與相關係數059
3.1.6大值、小值061
3.1.7 峰度和偏度 062
3.2匯總分析063
3.2.1 交叉列聯表 063
3.2.2描述統計量的表現統計065
3.3島嶼小結066
3.4 習題067

數據描述與可視化 68
4.1 統計表格 070
4.1.1 變量說明表070
4.1.2狀態統計表071
4.2 數據可視化基礎 072
4.2.1 統計圖形 072
4.2.2柱狀圖073
4.2.3 餅圖 076
4.2.4直方圖077
4.2.5折線圖078
4.2.6 箱線圖 079
4.2.7散點圖081
4.2.8 相關係數圖 083
4.3 數據可視化進階084
4.3.1ggplot2包084
4.3.2 交互可視化 090
4.4島嶼小結094
4.5 習題094

參數估計與真實檢驗 96
5.1總體、樣本和样本量 099
5.1.1總體099
5.1.2樣本100
5.1.3統計量100
5.2 參數估計 101
5.2.1 估計估計101
5.2.2 大似然估計102
5.2.3 區間估計 104
5.3真實檢驗109
5.3.1真實檢驗的基本步驟109
5.3.2假檢驗的p值112
5.3.3假設檢驗問題的基本類型 114
5.3.4正態觀的真實檢驗115
5.4 單因素方差分析 123
5.4.1單因素方差分析的基本思路
5.4.2實例分析125
5.5島嶼小結127
5.6 習題128

線性回歸129
6.1模型形態133
6.2 模型理解 134
6.2.回歸1係數的理解134
6.2.2定性變量及解析解析135
6.2.3 交互項的解讀136
6.2.4σ2 的理解 136
6.3基本相信 136
6.4回歸參數的估計138
6.4.1 普通小二乘估計 138
6.4.2 大似然估計 139
6.5真實檢驗139
6.5.回歸1係數的t檢驗140
6.5.2回歸熱的F檢驗140
6.6模型評價141
6.7回歸診斷141
6.7.1異方142
6.7.2 強影響點 143
6.7.3多重共線性143
6.7.4正態性144
6.8 變量選擇 144
6.8.1逐步法 144
6.8.2 信息規範 145
6.9模型實現146
6.9.1 R語言中的基本函數146
6.9.2實例分析147
6.10小結154
6.11 山區習題154

邏輯回歸155
7.1模型形態159
7.2 模型估計 160
7.2.1 參數估計 160
7.3模型評價161
7.3.1.準確率、率及成交率 162
7.3.2ROC曲線和AUC值163
7.4實例分析164
7.5島嶼小結167
7.6 習題167

降維分析 169
8.1 主要成分分析 172
8.1.1主成分分析原理172
8.1.2 主要成分個數選擇 174
8.1.3個樣本的主成分及主成分評分175
8.1.4R語言中的主成分分析176
8.2 因素分析 180
8.2.1 升數係數模型 180
8.2.2 模型估計 181
8.2.3 學生成績 187
8.2.4 同成分分析和主成分分析的異
8.2 因素分析 180
8.2.1 變量係數模型 180
8.2.2 模型估計 181
8.3小結190
8.4 習題191