R語言醫學數據分析與可視化
宗敏、石尚軒
相關主題
商品描述
"《R語言醫學數據分析與可視化》以通俗易懂的語言和實際案例,全面講解R語言在醫學數據分析與可視化中的應用。通過理論與實踐相結合的方式,幫助讀者快速掌握R語言的基礎知識及其在醫學科研中的應用。《R語言醫學數據分析與可視化》共包含18章,系統地介紹從R語言入門到醫學數據分析與可視化的完整流程。《R語言醫學數據分析與可視化》首先介紹R語言的基礎知識、數據集的創建與操作、數據輸入輸出等基本技能;隨後,詳細講解數據可視化、統計分析、回歸模型等核心分析方法;同時,深入地探索聚類分析、判別分析、生存分析、Meta分析等高級技術;還涵蓋基因測序數據處理、臨床診斷試驗評價、列線圖、C指數及校準曲線等醫學科研領域的重要工具與方法,並通過大量實例展示如何利用R語言高效地完成醫學數據分析與科研圖表的制作。 《R語言醫學數據分析與可視化》內容翔實、邏輯清晰,貼近醫學科研實際需求,特別適合醫學科研人員、臨床醫生、數據分析初學者以及從事醫學統計工作的讀者學習與參考。"
作者簡介
"宗 敏 / 碩士畢業於首都醫科大學,現就職於北京朝陽醫院,副主任醫師,從事臨床工作十余年,長期工作在臨床一線。熟練掌握各種心血管疾病的常規診療,熟練掌握臨床數據的分析方法,發表北大核心及SCI學術論文10余篇。石尚軒 / 碩士畢業於上海科技大學,從事數據分析工作多年,熟練掌握各類數據分析工具,能夠高效地進行數據處理、清洗和分析,尤其擅長數據可視化,能夠利用R語言制作直觀、易於理解的圖表和報告。在SCI期刊及中文核心期刊發表論文多篇,涉及醫學數據分析、統計建模及相關領域的創新性應用。"
目錄大綱
目 錄
第1部分 R語言基礎與數據處理
第1章 R語言簡介3
1.1 R語言概述3
1.1.1 R語言的誕生3
1.1.2 R語言的特點4
1.1.3 R語言繪圖系統4
1.1.4 R語言與醫學數據分析5
1.1.5 R語言與醫學數據可視化6
1.2 搭建R語言環境8
1.2.1 安裝程序下載8
1.2.2 R語言安裝與啟動10
1.2.3 輔助工具RStudio11
1.2.4 包的安裝與加載14
1.3 對象與變量17
1.3.1 對象18
1.3.2 變量19
1.4 獲取幫助信息20
1.4.1 使用內置幫助函數20
1.4.2 獲取自帶數據集信息21
1.4.3 R語言相關軟件和資料21
1.5 本章小結22
第2章 創建數據集23
2.1 數據集的概念23
2.1.1 認識R語言的對象24
2.1.2 認識R語言的變量25
2.2 R語言的數據結構26
2.2.1 數據類型26
2.2.2 向量28
2.2.3 矩陣31
2.2.4 數組33
2.2.5 數據框36
2.2.6 因子38
2.2.7 列表40
2.3 獲取內置數據集42
2.4 基本運算符43
2.5 本章小結44
第3章 數據的輸入與輸出45
3.1 工作路徑的設置45
3.2 數據的輸入46
3.2.1 TXT文件的讀入47
3.2.2 CSV文件的讀入48
3.2.3 Excel文件的讀入49
3.2.4 SPSS文件的讀入49
3.2.5 GraphPadPrism文件的讀入50
3.3 數據的輸出50
3.3.1 TXT文件的輸出51
3.3.2 CSV文件的輸出51
3.4 本章小結52
第4章 數據的基本操作53
4.1 數據框的基本操作53
4.2 用dplyr包處理數據55
4.3 數據框的合並59
4.3.1 merge()函數的數據框合並59
4.3.2 dplyr包的數據框合並63
4.4 數據抽樣65
4.4.1 簡單隨機抽樣65
4.4.2 有放回的抽樣66
4.4.3 分層抽樣67
4.4.4 系統抽樣68
4.4.5 Bootstrap抽樣68
4.4.6 按比例抽樣69
4.5 數據框的長寬格式的轉換70
4.5.1 寬格式轉換為長格式70
4.5.2 長格式轉換為寬格式73
4.6 列的分割與合並75
4.7 缺失值與空值的處理79
4.8 本章小結80
第2部分 醫學數據分析與可視化
第5章 數據可視化83
5.1 基礎作圖83
5.1.1 plot()函數的基本作圖83
5.1.2 plot()函數添加圖例、參考線以及文本註釋86
5.1.3 更改圖文邊界以及拼圖90
5.2 初識ggplot2作圖93
5.3 使用ggplot2包美化圖片98
5.3.1 認識ggplot不同的圖形代碼98
5.3.2 添加文本和直線101
5.3.3 更改顏色103
5.3.4 更改圖例108
5.3.5 更改主題112
5.4 本章小結114
第6章 基本統計分析115
6.1 數值型變量的描述性統計分析和組間差異比較115
6.1.1 數值型變量的描述性統計分析115
6.1.2 判斷數據的正態分布和方差齊性121
6.1.3 兩組樣本檢驗123
6.1.4 多組樣本檢驗125
6.2 分類型變量描述性統計分析和獨立性檢驗126
6.2.1 分類型變量的描述性統計分析126
6.2.2 分類型變量的獨立性檢驗128
6.3 變量間的相關性131
6.4 使用tableone包快速統計數據134
6.5 本章小結137
第7章 回歸分析138
7.1 簡單線性回歸138
7.2 分層線性回歸141
7.3 多重線性回歸145
7.4 二分類邏輯回歸146
7.5 Poisson回歸150
7.6 本章小結152
第 8 章 聚類分析153
8.1 樣品的距離153
8.2 層次聚類157
8.3 均值聚類160
8.4 本章小結164
第9章 判別分析165
9.1 K最鄰近判別165
9.2 距離判別167
9.3 Fisher判別170
9.4 貝葉斯判別172
9.5 本章小結174
第3部分 高級應用與醫學科研工具
第10章 基因測序數據處理177
10.1 基因表達譜微陣列芯片介紹177
10.1.1 實驗步驟178
10.1.2 基因表達譜芯片的應用178
10.1.3 基因表達譜芯片的優缺點179
10.1.4 認識GEO數據庫頁面180
10.1.5 使用R語言代碼整理GEO數據庫的array數據183
10.2 RNA-seq數據介紹186
10.2.1 RNA-seq數據生成的流程186
10.2.2 RNA-seq的應用場景188
10.2.3 RNA-seq的挑戰189
10.2.4 TCGA數據庫腫瘤數據下載流程190
10.2.5 使用R語言代碼整理TCGA數據193
10.3 主成分分析196
10.4 使用limma包進行差異分析199
10.4.1 差異分析及其可視化流程199
10.4.2 差異分析的計算200
10.4.3 使用 ggplot2程序包可視化差異分析結果202
10.5 使用DESeq2包進行差異分析和火山圖的繪制204
10.5.1 差異分析及其可視化流程204
10.5.2 差異分析的計算205
10.5.3 使用ggplot2程序包可視化差異分析結果206
10.6 差異基因熱圖可視化208
10.7 差異基因的KEGG與GO富集分析211
10.7.1 R語言KEGG富集分析及可視化211
10.7.2 R語言GO富集分析及可視化215
10.8 本章小結219
第11章 生存分析220
11.1 認識生存數據220
11.2 Cox回歸224
11.3 森林圖228
11.4 Kaplan-Meier生存分析231
11.5 本章小結236
第12章 臨床診斷試驗評價237
12.1 ROC簡介237
12.2 基於二分類變量的ROC239
12.2.1 單一模型繪制ROC曲線239
12.2.2 多模型繪制ROC曲線241
12.3 基於生存資料的ROC243
12.3.1 單模型單時間點ROC曲線243
12.3.2 單模型多時間點ROC曲線246
12.3.3 多模型單時間點ROC曲線247
12.4 本章小結248
第13章 自變量的篩選249
13.1 逐步法249
13.2 Lasso回歸法254
13.3 隨機森林258
13.4 本章小結264
第14章 列線圖265
14.1 列線圖簡介265
14.2 連續變量構建列線圖267
14.3 二分類變量構建列線圖272
14.4 生存變量構建列線圖276
14.5 本章小結280
第15章 C指數的計算281
15.1 C指數簡介281
15.2 二分類變量計算C指數284
15.3 對生存變量計算C指數286
15.4 本章小結289
第16章 Calibration校準曲線290
16.1 Calibration校準曲線簡介290
16.2 二分類變量計算校準曲線293
16.3 對生存變量計算校準曲線296
16.4 本章小結303
第17章 DCA曲線304
17.1 DCA曲線簡介304
17.2 繪制二分類變量的DCA曲線307
17.3 繪制生存變量的DCA曲線312
17.4 本章小結316
第18章 Meta分析317
18.1 Meta分析的基本步驟317
18.2 二分類變量的Meta分析320
18.3 連續型變量的Meta分析328
18.4 本章小結331



