R 語言數據科學基礎——基於tidyverse
高華川
相關主題
商品描述
內 容 提 要
R語言中的tidyverse包可以使數據的處理、轉換和可視化變得簡單、合理且可復制,大大簡化了數據整理的過程。本書詳細介紹了tidyverse包,主要內容包括R語言基礎知識,數據導入,數據整理,數據變換,處理日期、因子與字符串,數據可視化,編程,建模等內容。
本書圖文結合,實例豐富,語言通俗易懂,既適合商業數據分析從業者閱讀,也適合科研工作者、統計工作者(特別是醫學統計從業者)及各大專院校相關專業的師生等學習。
目錄大綱
第 1章 R語言基礎知識 1
1.1 對象與賦值 1
1.2 數據結構 1
1.2.1 原子向量 2
1.2.2 列表 9
1.2.3 因子 12
1.2.4 矩陣 15
1.2.5 數據框 17
1.3 常用函數 23
1.4 控制語句 27
1.4.1 分支語句 27
1.4.2 循環語句 28
1.5 管道操作符 31
1.6 自定義函數 33
1.7 其他 36
1.7.1 工作目錄與RStudio項目 36
1.7.2 編程風格 38
1.7.3 幫助 40
1.7.4 R、 RStudio及R包的版本更新 42
1.8 更多學習資源 42
練習題參考答案 42
第 2章 數據導入 44
2.1 將外部數據文件導入R 44
2.1.1 菜單式導入 44
2.1.2 命令式導入 47
2.1.3 解析函數 49
2.2 將處理後的數據導出到外部數據文件 52
2.3 有關中文亂碼問題 52
2.4 更多學習資源 55
第3章 數據整理 56
3.1 整潔數據 56
3.1.1 數據的形式結構 56
3.1.2 數據的語義結構 57
3.1.3 整潔數據簡介 57
3.1.4 非整潔數據的常見形式 59
3.2 長寬變換 62
3.2.1 寬變長 62
3.2.2 長變寬 67
3.3 拆分與合並列 71
3.3.1 拆分列 71
3.3.2 合並列 72
3.4 處理缺失值 73
3.4.1 將隱式缺失值變為顯式缺失值 73
3.4.2 去掉帶有缺失值的行 75
3.4.3 用相鄰值填充缺失值 75
3.4.4 用已知值替換缺失值 76
3.5 更多學習資源 77
練習題參考答案 77
第4章 數據變換 78
4.1 單表操作 78
4.1.1 行操作 78
4.1.2 列操作 82
4.1.3 分組操作 89
4.1.4 輔助操作 94
4.1.5 轉換變量類型 100
4.1.6 其他操作 104
4.2 雙表操作 106
4.2.1 合並連接 106
4.2.2 篩選連接 108
4.2.3 集合操作 111
4.2.4 組合操作 112
4.3 更多學習資源 114
練習題參考答案 114
第5章 處理日期、因子與字符串 115
5.1 處理日期 115
5.1.1 創建日期型變量 115
5.1.2 獲取日期成分 118
5.1.3 修改日期成分 121
5.1.4 日期的四舍五入 121
5.1.5 日期的數學運算 122
5.1.6 時區 125
5.1.7 其他 126
5.2 處理因子 127
5.2.1 因子水平計數 128
5.2.2 增加與刪除因子水平 129
5.2.3 修改與合並因子水平 130
5.2.4 改變因子水平的順序 132
5.3 處理字符串 134
5.3.1 正則表達式 134
5.3.2 字符串處理函數 141
5.4 更多學習資源 147
練習題參考答案 147
第6章 數據可視化 152
6.1 ggplot2簡介 152
6.2 幾何對象 153
6.2.1 美學屬性映射 153
6.2.2 統計變換 160
6.2.3 位置調整 162
6.2.4 常用幾何對象函數 165
6.3 標度 178
6.3.1 標度函數的5個重要參數 178
6.3.2 3類重要的標度函數 184
6.3.3 關於圖例 190
6.4 坐標 195
6.4.1 笛卡兒坐標 195
6.4.2 坐標翻轉 198
6.4.3 極坐標 199
6.5 分面 200
6.6 主題 202
6.6.1 主題函數 202
6.6.2 主題元素 203
6.6.3 元素函數 204
6.6.4 主題套裝 204
6.6.5 多張圖形應用相同主題 205
6.7 保存圖像 208
6.8 其他 209
6.8.1 在圖形中插入數學公式 209
6.8.2 在圖形中使用其他字體 212
6.8.3 多圖組合排版 215
6.9 更多學習資源 222
練習題參考答案 223
第7章 編程 226
7.1 map()函數族 226
7.1.1 map() 226
7.1.2 參數.f的5種形式 229
7.1.3 map()的擴展函數 230
7.2 更多學習資源 239
練習題參考答案 240
第8章 建模 241
8.1 將模型輸出整潔化 241
8.2 列表列 243
8.2.1 列表列與嵌套數據框 243
8.2.2 列表列工作流 244
8.3 更多學習資源 246
練習題參考答案 246
第9章 溝通 247
9.1 R Markdown簡介 247
9.2 R Markdown文檔 247
9.2.1 Markdown文本 250
9.2.2 代碼段 251
9.2.3 YAML文件頭 253
9.3 將R Markdown編譯成中文PDF文檔 254
9.3.1 編譯為PDF文檔 255
9.3.2 PDF文檔的中文顯示 256
9.4 更多學習資源 256
第 10章 數據科學實踐 257
10.1 格點搜索算法 257
10.2 Monte Carlo模擬 258
10.3 Bootstrap 267
10.4 更多學習資源 268
練習題參考答案 269
參考文獻 271

