R語言醫學數據分析實戰

趙軍著

  • 出版商: 人民郵電
  • 出版日期: 2020-08-01
  • 售價: $599
  • 貴賓價: 9.5$569
  • 語言: 簡體中文
  • 頁數: 278
  • 裝訂: 平裝
  • ISBN: 7115539154
  • ISBN-13: 9787115539151
  • 相關分類: R 語言Data Science
  • 立即出貨(限量) (庫存=4)

買這商品的人也買了...

商品描述

本書以醫學數據為例,講解如何使用R進行數據分析,
結合大量精選的實例對常用分析方法進行了深入淺出的介紹,
以幫助讀者解決醫學數據分析中的實際問題。
本書共分為14章,
第1章~第3章介紹了R語言的基本用法;
第4章介紹了數據可視化;
第5章介紹了基本的統計分析方法;
第6章~第8章介紹了醫學研究中最常用的三種回歸模型;
第9章介紹了生存分析的基本方法;
第10章~第12章介紹了幾種常用的多元統計分析方法;
第13章介紹了臨床診斷試驗的統計評價指標和計算方法;
第14章介紹了在醫學科研實踐中常用的Meta分析方法。
本書適用於臨床醫學、公共衛生及其他醫學相關專業的本科生和研究生使用,
亦可作為其他專業的學生和科研工作者學習數據分析的參考書。
閱讀本書,讀者不僅能掌握使用R及相關包快速解決實際問題的方法,還能更深入地理解數據分析。

作者簡介

趙軍

泰國宋卡王子大學流行病學博士,湖北醫藥學院公共衛生與管理學院副教授、碩士研究生導師。
講授醫藥數理統計方法、醫學統計學、高級統計學等課程。
近三年以第一作者身份發表SCI論文5篇,研究方向為臨床流行病學、醫學統計學。

目錄大綱

目錄
第1章R語言介紹1
1.1什麼是R語言1
1.2為什麼使用R分析數據1
1.3 R的下載與安裝2
1.4啟動和退出R 2
1.5 RStudio 3
1.6 R包4
1.6.1什麼是包4
1.6.2包的安裝5
1.6.3包的使用和更新5
1.7開始使用R 5
1.7.1獲取幫助5
1.7. 2把R當作一個計算器6
1.7.3 R對象8
1.8工作空間管理11
1.9小結12
1.10習題12

第2章創建數據集14
2.1 R的數據結構14
2 . 1.1向量14
2.1.2因子16
2.1.3矩陣17
2.1.4數組19
2.1.5列表20
2.1.6數據框21
2.1.7數據類型的轉換22
2.2用R獲取數據23
2.2.1獲取內置數據集23
2.2.2模擬特定分佈的數據24
2.2.3獲取其他格式的數據25
2.2.4導出數據26
2.2.5用rio包導入和導出數據26
2.3數據錄入27
2.4小結28
2.5習題30

第3章數據框的操作31
3.1用基本包處理數據框31
3.1.1查看數據框裡的內容31
3.1.2選取數據框的子集34
3.1.3將數據框按照某個變量的值排序35
3.1.4查找和刪除重複數據36
3.1.5在數據框中添加和刪除變量37
3.1.6把數據框添加到搜索路徑38
3.2用dplyr包處理數據框39
3.2.1使用filter()和slice()篩選行40
3.2.2使用arrange()排列行41
3.2.3使用select()選擇列42
3.2.4使用mutate()添加新變量43
3.2.5使用summarise()計算統計量43
3.2.6使用group_by()拆分數據框44
3.2. 7使用傳遞符“%>%”組合多個操作45
3.3數據框的合併46
3.3.1縱向合併46
3.3.2橫向合併47
3.3.3按照某個共有變量合併47
3.4數據框的長寬格式的轉換48
3.5缺失值的處理50
3.5.1識別缺失值50
3.5.2探索數據框裡的缺失值51
3.5.3填充缺失值52
3.6處理大型數據集的策略55
3.6.1清理工作空間55
3.6.2快速讀取. csv文件55
3.6.3模擬一個大型數據集56
3.6.4剔除不需要的變量57
3.6.5選取數據集的一個隨機樣本58
3.7小結58
3.8習題60

第4章數據可視化62
4.1用R的基礎繪圖系統作圖62
4.1.1函數plot() 62
4.1.2直方圖和密度曲線圖63
4.1.3條形圖65
4.1 . 4餅圖67
4.1.5箱線圖和小提琴圖67
4.1.6克利夫蘭點圖68
4.1.7導出圖形69
4.2用ggplot2包作圖70
4.2.1初識ggplot2包70
4.2.2分佈的特徵74
4.2.3比例的構成76
4.2.4用函數ggsave()保存圖形78
4.3其他圖形78
4.3.1金字塔圖78
4. 3.2橫向堆棧條形圖79
4.3.3熱圖79
4.3.4三維散點圖80
4.3.5詞雲圖81
4.3.6動態圖形82
4.4小結83
4. 5習題85

第5章基本統計分析86
5.1數值型變量的描述性統計分析88
5.2分類變量的列聯表和獨立性檢驗91
5.2.1生成頻數表和列聯表91
5.2. 2獨立性檢驗96
5.3連續型變量組間差異的比較101
5.3.1獨立樣本的t檢驗101
5.3.2非獨立樣本的t檢驗102
5.3.3單因素方差分析103
5.3.4組間差異的非參數檢驗105
5.4用函數tablestack()匯總雙變量分析結果106
5.5變量間的相關性111
5.5.1連續型變量間的相關性111
5 . 5.2分類變量間的相關性114
5.5.3相關性的可視化115
5.6小結118
5.7習題120

第6章線性回歸分析122
6.1簡單線性回歸122
6.1.1擬合簡單線性回歸模型123
6.1.2模型輸出結果的解釋124
6.1.3回歸診斷126
6.2分層線性回歸129
6.3多重線性回歸133
6.3.1擬合多重線性回歸模型133
6.3.2多重共線性135
6.3.3逐步回歸136
6.3.4回歸診斷139
6.4小結140
6.5習題141

第7章Logistic回歸分析142
7.1二分類Logistic回歸142
7.1.1 Logistic回歸模型142
7.1.2 Logistic回歸實例143
7.1.3表格數據的Logistic回歸151
7.2條件Logistic回歸155
7.3無序多分類Logistic回歸157
7.4有序Logistic回歸161
7.5小結166
7.6習題167

第8章Poisson回歸分析168
8.1 Poisson回歸模型168
8.2過度離散的判定及處理171
8.3對數線性模型174
8.4小結178
8.5習題178

第9章生存分析180
9.1生存對象180
9.2生存率的估計與生存曲線182
9.3生存率的比較184
9.4 Cox回歸186
9.4.1建立Cox回歸模型186
9.4.2比例風險假定的檢驗188
9.4.3生存的預測188
9. 5小結190
9.6習題190

第10章聚類分析192
10.1相似性的度量192
10.1.1樣品間的距離192
10.1.2變量間的相似係數195
10.2層次聚類法196
10.2.1類之間相似係數的定義196
10.2.2 Q型聚類196
10.2.3 R型聚類203
10.3 k均值聚類法204
10.4小結206
10.5習題207

第11章判別分析209
11.1距離判別209
11.2 K最鄰近判別213
11.3 Fisher判別215
11.4 Bayes判別218
11.5小結219
11.6習題220

第12章主成分分析和因子分析221
12.1主成分分析221
12. 1.1主成分的定義221
12.1.2主成分的求解222
12.1.3主成分分析的注意事項226
12.2因子分析226
12.2.1因子分析模型的定義226
12.2 . 2因子分析模型的求解227
12.2.3因子旋轉229
12.2.4因子分析的注意事項231
12.3小結232
12.4習題233

第13章臨床診斷試驗評價234
13.1二分類結果的評價指標234
13.1.1靈敏度和特異度234
13.1.2預測值235
13.1.3圖解靈敏度、特異度、陽性預測值和陰性預測值235
13.1 . 4診斷試驗的綜合評價指標236
13.2 ROC及曲線下面積237
13.2.1單個ROC分析237
13.2.2兩個ROC的比較240
13.2.3 Logistic回歸的ROC曲線241
13 . 3聯合試驗243
13.4小結244
13.5習題244

第14章Meta分析245
14.1 Meta分析的基本步驟245
14.2 Meta分析的常用統計方法246
14.3二分類變量資料的Meta分析247
14.3.1 OR、RR或RD的合併248
14.3.2發表偏倚的識別251
14.3.3敏感性分析253
14.4連續型變量資料的Meta分析254
14.5 Meta分析的注意事項255
14.6小結256
14.7習題256
習題參考答案258
參考文獻273
函數索引274