R語言編程:基於 tidyverse

張敬信

  • 出版商: 人民郵電
  • 出版日期: 2023-02-01
  • 售價: $539
  • 貴賓價: 9.5$512
  • 語言: 簡體中文
  • 頁數: 328
  • ISBN: 7115603804
  • ISBN-13: 9787115603807
  • 相關分類: R 語言
  • 立即出貨 (庫存 < 4)

  • R語言編程:基於 tidyverse-preview-1
  • R語言編程:基於 tidyverse-preview-2
R語言編程:基於 tidyverse-preview-1

買這商品的人也買了...

商品描述

這是一本基於 tidyverse 入門 R 語言編程的書,本書從基本的編程語法講起,適合編程零基礎的讀者閱讀。本書結合新的 R 語言編程範式,讓讀者學習更高效率的 R 編程,尤其是真正用整潔優雅的數據化編程思維解決一系列數據問題,包括數據清洗、數據處理、數據可視化、統計建模、文檔溝通等,並在附錄中將透視表、網絡爬蟲、高性能計算、機器學習等典型應用囊括其中,為讀者提供了豐富的R實用編程案例,也可作為一本 R 語言語法大全的工具書。

 

本書面向熱愛R語言編程的讀者,適合統計學、數據分析、數據可視化等領域的讀者閱讀參考,也可以作為高等院校相關專業的 R 語言教材。

作者簡介

张敬信,哈尔滨工业大学基础数学博士,哈尔滨商业大学数学与应用数学系主任、副教授、应用统计硕导、数学建模主教练。主研方向为数据挖掘、数学建模等,热爱编程、擅长R语言。常驻知乎平台。发表SCI论文4篇,主持黑龙江省社科项目1项。

目錄大綱

1 基礎語法 1

1 1 搭建 R 環境及常用操作 1

1 1 1 搭建 R 環境 1

1 1 2 常用操作 3

1 2 數據結構:向量、矩陣、

多維數組 8

1 2 1 向量(一維數據) 8

1 2 2 矩陣(二維數據) 12

1 2 3 多維數組(多維數據) 14

1 3 數據結構:列表、數據框、因子 15

1 3 1 列表 15

1 3 2 數據框(數據表) 17

1 3 3 因子 22

1 4 數據結構:字符串、日期時間 26

1 4 1 字符串 26

1 4 2 日期時間 30

1 4 3 時間序列 34

1 5 正則表達式 36

1 5 1 基本語法 36

1 5 2 若乾實例 38

1 6 控制結構 40

1 6 1 分支結構 40

1 6 2 循環結構 42

1 7 自定義函數 50

1 7 1 自定義函數 50

1 7 2 R 自帶的函數 54

2 數據操作 60

2 1 tidyverse 簡介與管道 61

2 1 1 tidyverse 包簡介 61

2 1 2 管道操作 62

2 2 數據讀寫 63

2 2 1 用於數據讀寫的包與函數 63

2 2 2 數據讀寫實例 64

2 2 3 連接數據庫 68

2 2 4 關於中文編碼 70

2 3 數據連接 73

2 3 1 合並行與合並列 74

2 3 2 根據值匹配合並數據框 75

2 3 3 集合運算 78

2 4 數據重塑 78

2 4 1 什麽是整潔的數據 78

2 4 2 寬表變長表 80

2 4 3 長表變寬表 82

2 4 4 拆分列與合並列 85

2 4 5 方形化 87

2 5 數據操作 89

2 5 1 選擇列 89

2 5 2 修改列 95

2 5 3 篩選行 99

2 5 4 對行排序 104

2 5 5 分組操作 104

2 6 其他數據操作 109

2 6 1 按行匯總 109

2 6 2 窗口函數 111

2 6 3 滑窗迭代 113

2 6 4 整潔計算 114

2 7 數據處理神器:data table 包 119

2 7 1 通用語法 119

2 7 2 數據讀寫 121

2 7 3 數據連接 121

2 7 4 數據重塑 122

2 7 5 數據操作 123

2 7 6 分組操作 126

3 可視化與建模技術 128

3 1 ggplot2 基礎語法 128

3 1 1 ggplot2 概述 128

3 1 2 數據、映射、幾何對象 129

3 1 3 標度 133

3 1 4 統計變換、坐標系、位置

調整 142

3 1 5 分面、主題、輸出 146

3 2 ggplot2 圖形示例 149

3 2 1 類別比較圖 150

3 2 2 數據關系圖 151

3 2 3 數據分佈圖 152

3 2 4 時間序列圖 154

3 2 5 局部整體圖 154

3 2 6 地理空間圖 155

3 2 7 動態交互圖 156

3 3 統計建模技術 157

3 3 1 整潔模型結果 157

3 3 2 輔助建模 159

3 3 3 批量建模 162

4 應用統計 168

4 1 描述性統計 170

4 1 1 統計量 170

4 1 2 統計圖 172

4 1 3 列聯表 176

4 2 參數估計 177

4 2 1 點估計與區間估計 177

4 2 2 最小二乘估計 180

4 2 3 最大似然估計 183

4 3 假設檢驗 187

4 3 1 假設檢驗原理 187

4 3 2 基於理論的假設檢驗 189

4 3 3 基於重排的假設檢驗 194

4 4 回歸分析 196

4 4 1 線性回歸 197

4 4 2 回歸診斷 198

4 4 3 多元線性回歸實例 202

4 4 4 梯度下降法 208

5 探索性數據分析 212

5 1 數據清洗 212

5 1 1 缺失值 213

5 1 2 異常值 219

5 2 特徵工程 223

5 2 1 特徵縮放 223

5 2 2 特徵變換 225

5 2 3 特徵降維 227

5 3 探索變量間的關系 228

5 3 1 兩個分類變量 228

5 3 2 分類變量與連續變量 229

5 3 3 兩個連續變量 230

6 文檔溝通 232

6 1 R Markdown 233

6 1 1 Markdown 簡介 233

6 1 2 R Markdown 基礎 235

6 1 3 表格輸出 240

6 2 R 與 Latex 交互 243

6 2 1 Latex 開發環境 243

6 2 2 Latex 嵌入 Rmd 244

6 2 3 期刊論文、幻燈片、書籍

模板 245

6 3 R 與 Git 版本控制 249

6 3 1 Git 版本控制 249

6 3 2 RStudio 與 Git/GitHub

交互 250

6 4 R Shiny 256

6 4 1 Shiny 基本語法 256

6 4 2 響應表達式 259

6 4 3 案例:探索性數據展板 262

6 5 開發 R 包 264

6 5 1 準備開發環境 264

6 5 2 編寫 R 包工作流 264

6 5 3 發布到 CRAN 269

6 5 4 推廣包(可選) 272

附錄 A R6 類面向對象編程簡單實例 273

附錄 B 錯誤與調試 275

B 1 解決報錯的一般策略 275

B 2 錯誤調試技術 275

B 3 異常處理 278

附錄 C 用 R 實現 Excel 中的 VLOOKUP 與

透視表 282

C 1 VLOOKUP 查詢 282

C 2 數據透視表 284

附錄 D 非等連接與滾動連接 286

D 1 非等連接 286

D 2 滾動連接 287

附錄 E R 與網絡爬蟲 290

E 1 rvest 爬取靜態網頁 290

E 2 用 httr 包爬取動態網頁 292

附錄 F R 與高性能計算 296

F 1 並行計算 296

F 2 運行 C++代碼 296

F 3 對超出內存容量的數據集進行

處理 297

F 4 大型矩陣運算 298

附錄 G R 機器學習框架 300

G 1 mlr3verse 300

G 2 tidymodels 301