統計分析:以 R 與 Excel 為分析工具

(英)康拉德·卡爾伯格(Conrad Carlberg)

買這商品的人也買了...

商品描述

本書由知名統計學專家、暢銷書作者 Conrad Carlberg傾情撰寫,循序漸進系統講解Excel與R統計分析的各種實用技術、方法及技巧。通過Excel和R兩種軟件的比較,圍繞描述性統計、回歸分析、方差分析、logistic回歸、主成分分析幾大模塊,詳細舉出所需函數及代碼,能有效幫助你掌握R語言,實現從Excel到R的過渡。

本書共分6章:第1章詳細介紹如何順利從Excel過渡到R,包括用戶界面、特殊字符、R的安裝、擴展包、腳本運行,以及數據的導入、導出等;第2章講解如何使用R與Excel進行描述性統計分析;第3章介紹如何用Excel和R進行回歸分析;第4章介紹如何用Excel和R進行方差和協方差分析;第5章介紹如何用Excel和R進行Logistic回歸;第6章介紹在Excel和R中進行主成分分析的過程。

Microsoft Excel可以用來完成很多統計分析,但成千上萬的用戶和分析師卻正在遭遇瓶頸。而作為一種功能強大的開源編程語言,R包含豐富的軟件包和繪圖技術,可以幫助我們更好地完成統計分析。本書作者融合自己多年的實踐經驗,全面、系統闡釋使用Excel和R進行統計分析的實用技術、方法及技巧,準確展示瞭如何從Excel和R中收穫更多。
  在本書中,作者首先回顧如何在Excel中完成重要的任務,然後指導你在R中完成相同的任務——包括軟件包的選擇、獲取和安裝。除此之外,書中還講解了在哪種情況下以及如何使用Excel和R,並比較了每種工具的優劣。
  本書表述清晰易懂,將基本統計理論和反映真實世界挑戰的相關實例結合起來。讀完此書,你將能夠得心應手地用R解決各種問題——包括很多Excel無法處理的問題。
  ·輕鬆過渡到R和其截然不同的用戶界面
  ·列舉R中豐富的軟件包
  ·在Excel和R間高效移動數據
  ·使用R描述性統計分析工具DescTools,包括二值變量分析
  ·在R和Excel中完成回歸分析與統計推斷
  ·分析方差和協方差,包括單因子和因子化ANOVA
  ·對Solver的logistic回歸使用R的mlogit軟件包和glm函數
  ·用R和Excel分析時間序列和主成分

目錄大綱

譯者序
作者簡介
前言
第1章 從Excel到R的過渡1
1.1 調整預期2
1.1.1 分析數據:軟件包3
1.1.2 存儲和排列數據:數據框3
1.2 用戶界面4
1.3 特殊字符5
1.3.1 使用波浪線5
1.3.2 使用賦值運算符<-8
1.4 獲取R11
1.5 擴展包13
1.6 運行腳本14
1.7 從Excel向R導入數據16
1.8 從R向Excel導出數據24
1.8.1 導出為CSV文件25
1.8.2 直接導出25
第2章 描述性統計29
2.1 Excel中的描述性統計29
2.1.1 使用描述性統計工具31
2.1.2 理解結果32
2.1.3 對R中的Pizza文件使用Excel描述性統計工具36
2.2 使用R的DescTools軟件包40
2.3 輸入一些有用的命令41
2.3.1 控制符號類型41
2.3.2 報告統計量44
2.3.3 對名義變量運行Desc函數53
2.4 用Desc運行雙變量分析54
2.4.1 兩個數值型變量55
2.4.2 按因子劃分數值型變量60
2.5 用一個因子分析另一個因子:列聯表70
2.5.1 Pearson卡方74
2.5.2 似然比76
2.5.3 Mantel-Haenszel卡方檢驗78
2.5.4 估計關係的強弱80
第3章 用Excel和R做回歸分析82
3.1 工作表函數82
3.1.1 CORREL()函數83
3.1.2 COVARIANCE.P()函數84
3.1.3 SLOPE()函數85
3.1.4 INTERCEPT()函數87
3.1.5 RSQ()函數90
3.1.6 LINEST()函數92
3.1.7 TREND()函數95
3.2 統計推斷函數96
3.2.1 T.DIST函數97
3.2.2 F.DIST函數99
3.3 Excel中的其他回歸分析資源101
3.3.1 回歸工具101
3.3.2 圖的趨勢線105
3.4 R中的回歸分析106
3.4.1 相關和一元回歸106
3.4.2 分析多元回歸模型110
3.4.3 R中的模型比較113
第4章 用Excel和R進行方差和協方差分析118
4.1 單因子方差分析118
4.1.1 使用Excel的工作表函數119
4.1.2 使用ANOVA:單因子工具120
4.1.3 對ANOVA使用回歸方法122
4.2 使用R進行單因子ANOVA124
4.2.1 設置數據124
4.2.2 安排ANOVA表125
4.2.3 帶缺失值的單因子ANOVA128
4.3 因子化ANOVA130
4.3.1 Excel中的平衡雙因子設計131
4.3.2 平衡的雙因子設計和ANOVA工具133
4.3.3 使用回歸進行雙因子ANOVA設計135
4.3.4 用R分析平衡因子化設計141
4.4 分析Excel和R中的不平衡雙因子設計144
4.4.1 區分三種情況148
4.4.2 效應的指定方法153
4.5 Excel和R中的多元比較程序154
4.5.1 Tukey的HSD方法155
4.5.2 Newman-Keuls方法158
4.5.3 在Excel和R中使用Scheffé程序161
4.6 Excel和R中的協方差分析165
4.6.1 在Excel中用回歸進行ANCOVA165
4.6.2 用R進行ANCOVA168
第5章 用Excel和R進行logistic回歸173
5.1 線性回歸和名義變量中的問題174
5.1.1 概率問題175
5.1.2 用機率代替概率177
5.1.3 使用機率的對數178
5.2 從對數機率到概率180
5.2.1 重新編碼文本變量180
5.2.2 定義名稱181
5.2.3 計算logit182
5.2.4 計算機率182
5.2.5 計算概率183
5.2.6 得到對數似然183
5.3 配置Solver185
5.3.1 安裝Solver185
5.3.2 用Solver進行logistic回歸185
5.4 logistic回歸中的統計檢驗189
5.4.1 logistic回歸中的R2和t189
5.4.2 似然比檢驗190
5.4.3 約束條件和自由度193
5.5 用R的mlogit軟件包進行logistic回歸195
5.5.1 運行mlogit軟件包195
5.5.2 比較模型和mlogit200
5.6 用R中的glm函數201
第6章 主成分分析203
6.1 用Excel進行主成分分析204
6.1.1 瀏覽對話框205
6.1.2 主成分工作表:R矩陣及逆矩陣207
6.1.3 主成分工作表:特徵值和特徵向量210
6.1.4 變量的公因子方差212
6.1.5 因子得分213
6.2 Excel中的旋轉因子215
6.3 用R語言進行主成分分析217
6.3.1 準備數據217
6.3.2 調用函數219
6.3.3 R中的最大方差法旋轉222