R 語言編程藝術 (The Art of R Programming: A Tour of Statistical Software Design) R语言编程艺术

麥特洛夫 (Norman Matloff)

買這商品的人也買了...

商品描述

<內容簡介>

譯者序
  
前 言
  
致 謝
1章 快速入門  1
  1.1
怎樣運行
R  1
  1.1.1
交互模式
  1
  1.1.2
批處理模式
  2
  1.2
第一個R會話
  3
  1.3
函數入門
  5
  1.3.1
變量的作用域
  7
  1.3.2
默認參數
  8
  1.4 R
語言中一些重要的數據結構
  8
  1.4.1
向量,R語言中的戰鬥機
  8
  1.4.2
字符串
  9
  1.4.3
矩陣
  9
  1.4.4
列表
  10
  1.4.5
數據框
  12
  1.4.6
  12
  1.5
擴展案例:考試成績的回歸分析
  13
  1.6
啟動和關閉
R  16
  1.7
獲取幫助
  17
  1.7.1 help()
函數
  18
  1.7.2 example()
函數
  18
  1.7.3
如果你不太清楚要查找什麼
  19
  1.7.4
其他主題的幫助
  20
  1.7.5
批處理模式的幫助
  21
  1.7.6
因特網資源
  21
2章 向量
  22
  2.1
標量、向量、數組與矩陣
  22
  2.1.1
添加或刪除向量元素
  22
  2.1.2
獲取向量長度
  23
  2.1.3
作為向量的矩陣和數組
  24
  2.2
聲明
  24
  2.3
循環補齊
  25
  2.4
常用的向量運算
  26
  2.4.1
向量運算和邏輯運算
  26
  2.4.2
向量索引
  27
  2.4.3
:運算符創建向量
  28
  2.4.4
使用seq()創建向量
  28
  2.4.5
使用rep()重複向量常數
  29
  2.5
使用all()
any()  30
  2.5.1
擴展案例:尋找連續出現1的游程
  30
  2.5.2
擴展案例:預測離散值時間序列
  31
  2.6
向量化運算符
  34
  2.6.1
向量輸入,向量輸出
  34
  2.6.2
向量輸入,矩陣輸出
  36
  2.7 NA
NULL
  37
  2.7.1 NA
的使用
  37
  2.7.2 NULL
的使用
  37
  2.8
篩選
  38

  2.8.1
生成篩選索引
  38
  2.8.2
使用subset()函數篩選
  40
  2.8.3
選擇函數
which()  40
  2.9
向量化的ifelse()函數
  41
  2.9.1
擴展案例:度量相關性
  42
  2.9.2
擴展案例:對鮑魚數據集重新編碼
  44
  2.10
測試向量相等
  46
  2.11
向量元素的名稱
  47
  2.12
關於c()的更多內容
  48
3章 矩陣和數組
  49
  3.1
創建矩陣
  49
  3.2
一般矩陣運算
  50
  3.2.1
線性代數運算
  50
  3.2.2
矩陣索引
  51
  3.2.3
擴展案例:圖像操作
  52
  3.2.4
矩陣元素篩選
  55
  3.2.5
擴展案例:生成協方差矩陣
  57
  3.3
對矩陣的行和列調用函數
  58
  3.3.1
使用apply()函數
  58
  3.3.2
擴展案例:尋找異常值
  60
  3.4
增加或刪除矩陣的行或列
  61
  3.4.1
改變矩陣的大小
  61
  3.4.2
擴展案例:找到圖中距離最近的一對端點
  63
  3.5
向量與矩陣的差異
  65
  3.6
避免意外降維
  66
  3.7
矩陣的行和列的命名問題
  68
  3.8
高維數組
  68
4章 列表
  71
  4.1
創建列表
  71
  4.2
列表的常規操作
  72
  4.2.1
列表索引
  72
  4.2.2
增加或刪除列表元素
  73
  4.2.3
獲取列表長度
  75
  4.2.4
擴展案例:文本詞匯索引
  75
  4.3
訪問列表元素和值
  78
  4.4
在列表上使用apply系列函數
  79
  4.4.1 lapply()
sapply()的使用
  79
  4.4.2
擴展案例:文本詞匯索引(續)
  80
  4.4.3
擴展案例:鮑魚數據
  82
  4.5
遞歸型列表
  83
5章 數據框
  85
  5.1
創建數據框
  85
  5.1.1
訪問數據框
  85
  5.1.2
擴展案例:考試成績的回歸分析(續)
  86
  5.2
其他矩陣式操作
  87
  5.2.1
提取子數據框
  87
  5.2.2
缺失值的處理
  88
  5.2.3
使用rbind()cbind()等函數
  89
  5.2.4
使用
apply()  90
  5.2.5
擴展案例:工資研究
  90

  5.3
合併數據框
  92
  5.4
應用於數據框的函數
  95
  5.4.1
在數據框上應用lapply()sapply()函數
  95
  5.4.2
擴展案例:應用Logistic模型
  95
  5.4.3
擴展案例:學習中文方言的輔助工具
  96
6章 因子和表
  102
  6.1
因子與水平
  102
  6.2
因子的常用函數
  103
  6.2.1 tapply
函數
  103
  6.2.2 split()
函數
  105
  6.2.3 by()
函數
  106
  6.3
表的操作
  107
  6.3.1
表中有關矩陣和類似數組的操作
  109
  6.3.2
擴展案例: 提取子表
  111
  6.3.3
擴展案例:在表中尋找頻數最大的單元格
  113
  6.4
其他與因子和表有關的函數
  114
  6.4.1 aggregate()
函數
  115
  6.4.2 cut()
函數
  115
7 R語言編程結構
  116
  7.1
控制語句
  116
  7.1.1
循環
  116
  7.1.2
對非向量集合的循環
  119
  7.1.3 if-else
結構
  120
  7.2
算術和邏輯運算符及數值
  121
  7.3
參數的默認值
  122
  7.4
返回值
  123
  7.4.1
決定是否顯式調用
return ()  124
  7.4.2
返回複雜對象
  124
  7.5
函數都是對象
  124
  7.6
環境和變量作用域的問題
  127
  7.6.1
頂層環境
  127
  7.6.2
變量作用域的層次
  128
  7.6.3
關於ls()的進一步討論
  131
  7.6.4
函數(幾乎)沒有副作用
  131
  7.6.5
擴展案例:顯示調用框的函數
  132
  7.7 R
語言中沒有指針
  134
  7.8
向上級層次進行寫操作
  136
  7.8.1
利用超賦值運算符對非局部變量進行寫操作
  136
  7.8.2
assign()函數對非局部變量進行寫操作
  137
  7.8.3
擴展案例:用R語言實現離散事件模擬
  138
  7.8.4
什麼時候使用全局變量
  145
  7.8.5
閉包
  147
  7.9
遞歸
  148
  7.9.1 Quicksort
的具體實現
  149
  7.9.2
拓展舉例:二叉查找樹
  150
  7.10
置換函數
  155
  7.10.1
什麼是置換函數
  155
  7.10.2
擴展案例:可記錄元素修改次數的向量類
  156
  7.11
寫函數代碼的工具
  158
  7.11.1
文本編輯器和集成開發環境
  158

  7.11.2 edit()
函數
  158
  7.12
創建自己的二元運算符
  159
  7.13
匿名函數
  159
8章 數學運算與模擬
  161
  8.1
數學函數
  161
  8.1.1
擴展例子:計算概率
  161
  8.1.2
累積和與累積乘積
  162
  8.1.3
最小值和最大值
  162
  8.1.4
微積分
  163
  8.2
統計分佈函數
  164
  8.3
排序
  165
  8.4
向量和矩陣的線性代數運算
  166
  8.4.1
擴展示例:向量叉積
  169
  8.4.2
擴展示例:確定馬爾科夫鏈的平穩分佈
  170
  8.5
集合運算
  171
  8.6
R做模擬
  173
  8.6.1
內置的隨機變量發生器
  173
  8.6.2
重複運行時獲得相同的隨機數流
  175
  8.6.3
擴展案例:組合的模擬
  175
9章 面向對象的編程
  177
  9.1 S3
  177
  9.1.1 S3
泛型函數
  177
  9.1.2
實例:線性模型函數lm()中的
OOP  178
  9.1.3
尋找泛型函數的實現方法
  179
  9.1.4
編寫S3
  181
  9.1.5
使用繼承
  182
  9.1.6
擴展示例:用於存儲上三角矩陣的類
  183
  9.1.7
擴展示例:多項式回歸程序
  187
  9.2 S4
  191
  9.2.1
編寫S4
  191
  9.2.2
S4類上實現泛型函數
  193
  9.3 S3
類和S4類的對比
  193
  9.4
對象的管理
  194
  9.4.1
ls()函數列出所有對象
  194
  9.4.2
rm()函數刪除特定對象
  194
  9.4.3
save()函數保存對象集合
  195
  9.4.4
查看對象內部結構
  196
  9.4.5 exists()
函數
  197
10章 輸入與輸出
  198
  10.1
連接鍵盤與顯示器
  198
  10.1.1
使用scan()函數
  198
  10.1.2
使用readline()函數
  200
  10.1.3
輸出到顯示器
  201
  10.2
讀寫文件
  202
  10.2.1
從文件中讀取數據框或矩陣
  202
  10.2.2
讀取文本文件
  203
  10.2.3
連接的介紹
  203
  10.2.4
擴展案例:讀取PUMS普查數據
  204
  10.2.5
通過URL在遠程電腦上訪問文件
  208
  10.2.6
寫文件
  209

  10.2.7
獲取文件和目錄信息
  210
  10.2.8
擴展案例:多個文件內容的和
  211
  10.3
訪問因特網
  211
  10.3.1 TCP/IP
概述
  212
  10.3.2 R
中的
socket  212
  10.3.3
擴展案例:實現R的並行計算
  213
11章 字符串操作
  216
  11.1
字符串操作函數概述
  216
  11.1.1 grep()  216
  11.1.2 nchar()  216
  11.1.3 paste()  217
  11.1.4 sprintf()  217
  11.1.5 substr()  217
  11.1.6 strsplit()  217
  11.1.7 regexpr()  218
  11.1.8 gregexpr()  218
  11.2
正則表達式
  218
  11.2.1
擴展案例:檢測文件名的後綴
  219
  11.2.2
擴展案例:生成文件名
  220
  11.3
在調試工具edtdbg中使用字符串工具
  221
12章 繪圖
  224
  12.1
創建圖形
  224
  12.1.1
基礎圖形系統的核心:plot()函數
  224
  12.1.2
添加線條:abline()函數
  225
  12.1.3
在保持現有圖形的基礎上新增一個繪圖窗口
  226
  12.1.4
擴展案例:在一張圖中繪製兩條密度曲線
  227
  12.1.5
擴展案例:進一步考察多項式回歸
  228
  12.1.6
添加點:points()函數
  231
  12.1.7
添加圖例:legend()函數
  231
  12.1.8
添加文字:text()函數
  232
  12.1.9
精確定位:locator()函數
  232
  12.1.10
保存圖形
  233
  12.2
定製圖形
  233
  12.2.1
改變字符大小:cex選項
  233
  12.2.2
改變坐標軸的範圍:xlimylim選項
  234
  12.2.3
添加多邊形:polygon()函數
  235
  12.2.4
平滑散點:lowess()loess()函數
  236
  12.2.5
繪製具有顯式表達式的函數
  237
  12.2.6
擴展案例:放大曲線的一部分
  237
  12.3
將圖形保存到文件
  240
  12.3.1 R
圖形設備
  240
  12.3.2
保存已顯示的圖形
  241
  12.3.3
關閉R圖形設備
  241
  12.4
創建三維圖形
  241
13章 調試
  243
  13.1
調試的基本原則
  243
  13.1.1
調試的本質:確認原則
  243
  13.1.2
從小處著手
  243
  13.1.3
模塊化的、自頂向下的調試風格
  244
  13.1.4
反漏洞
  244

  13.2
為什麼要使用調試工具
  244
  13.3
使用R的調試工具
  245
  13.3.1
利用debug()browser()函數進行逐步調試
  245
  13.3.2
使用瀏覽器命令
  246
  13.3.3
設置斷點
  246
  13.3.4
使用trace()函數進行追蹤
  247
  13.3.5
使用traceback()debugger()函數對崩潰的程序進行檢查
   248
  13.3.6
擴展案例:兩個完整的調試會話
  248
  13.4
更方便的調試工具
  256
  13.5
在調試模擬數據的代碼時請確保一致性
  258
  13.6
語法和運行時錯誤
  258
  13.7
R上運行
GDB  259
14章 性能提升:速度和內存
  260
  14.1
編寫快速的R代碼
  260
  14.2
可怕的for循環
  260
  14.2.1
用向量化提升速度
  261
  14.2.2
擴展案例:在蒙特卡羅模擬中獲得更快的速度
  262
  14.2.3
擴展案例:生成冪次矩陣
  266
  14.3
函數式編程和內存問題
  267
  14.3.1
向量賦值問題
  267
  14.3.2
改變時拷貝
  268
  14.3.3
擴展案例:避免內存拷貝
  269
  14.4
利用Rprof()來尋找代碼的瓶頸
  270
  14.4.1
利用Rprof()來進行監視
  270
  14.4.2 Rprof()
的工作原理
  271
  14.5
字節碼編譯
  273
  14.6
內存無法裝下數據怎麼辦
  273
  14.6.1
分塊
  274
  14.6.2
利用R軟件包來進行內存管理
  274
15 R與其他語言的接口
  275
  15.1
編寫能被R調用的C/C++函數
  275
  15.1.1 R
C/C++交互的預備知識
  275
  15.1.2
例子:提取方陣的次對角線元素
  275
  15.1.3
編譯和運行程序
  276
  15.1.4
調試R/C程序
  277
  15.1.5
擴展案例:預測離散取值的時間序列
  279
  15.2
Python調用
R  281
  15.2.1
安裝
RPy  281
  15.2.2 RPy
語法
  282
16 R語言並行計算
  284
  16.1
共同外鏈問題
  284
  16.2 snow
包簡介
  285
  16.2.1
運行snow代碼
  285
  16.2.2
分析snow代碼
  287
  16.2.3
可以獲得多少倍的加速
  287
  16.2.4
擴展案例:K均值聚類
  288
  16.3
借助於
C  290
  16.3.1
利用多核機器
  291
  16.3.2
擴展案例:利用OpenMP解決共同外鏈問題
  291
  16.3.3
運行OpenMP代碼
  292

  16.3.4 OpenMP
代碼分析
  293
  16.3.5
其他OpenMP指令
  293
  16.3.6 GPU
編程
  294
  16.4
普遍的性能考慮
  295
  16.4.1
開銷的來源
  295
  16.4.2
簡單並行程序,以及那些不簡單的
  296
  16.4.3
靜態和動態任務分配
  297
  16.4.4
軟件煉金術:將一般的問題轉化為簡單並行問題
  299
  16.5
調試R語言並行計算的代碼
  299
  
附錄A 安裝
R  300
  
附錄B 安裝和使用包  301