R語言可以很簡單 第2版 (R for dummies) R语言可以很简单 第2版

[法]Andrie de Vries,[比利時]Joris Meys

  • 出版商: 人民郵電
  • 出版日期: 2017-06-01
  • 定價: $414
  • 售價: 8.5$352
  • 語言: 簡體中文
  • 頁數: 358
  • 裝訂: 平裝
  • ISBN: 7115455392
  • ISBN-13: 9787115455390
  • 相關分類: R 語言
  • 立即出貨 (庫存=1)

買這商品的人也買了...

商品描述

R是一個開源、跨平臺的編程語言,用於統計計算和繪圖,特別是其社區開發的數以千計的擴展包為R增加了強大的和前瞻性的功能。數據分析與挖掘已經成為大數據時代重要的技能之一,而 R已經成為數據分析領域炙手可熱的標志性語言。
本書作為業內外一致好評的 Dummies系列書籍之一,是供 R語言初學者學習的經典力作。本書通俗易懂地講解瞭如何利用 R語言基本知識,包括創建、運行以及調試 R腳本,用戶自定義 R函數,用 R繪制基本圖形, R的循環語句和邏輯控制語句等,逐步引導讀者邁入 R語言高手行列。
本書適用於數據分析人員以及對 R語言感興趣的讀者。

作者簡介

作者:[法]Andrie de Vries(安德里·德弗里斯),[比利時]Joris Meys(喬里斯·梅斯)譯者:李毅

作者簡介
Andrie de Vries是Revolution Analytics公司的首席R專家和商業服務總監,有超過20年的R使用經驗,為客戶提供關於R的諮詢和培訓服務。Joris Meys是一位統計學家、R程序員和R講師,就職於根特大學生物工程學院。

譯者簡介
李毅,韓國嶺南大學理學博士,現為山西財經大學統計學院副教授,碩士生導師。研究方向為應用統計,主持國家自然基金、國家統計局重點課題等多項。發表學術論文20餘篇,其中被SCI收錄10餘篇。

目錄大綱

第一部分R語言編程入門1 

第1章R語言簡介:全景圖3 
認識到使用R語言的優勢5 
 免費、開源代碼5 
 可以在任何環境下運行5 
 R語言支持擴展5 
 擁有活躍的社區5 
 和其他語言的連接6 
R語言的獨特之處7 
 向量的多項計算7 
 不僅僅是統計分析8 
 無需編輯直接運行8 

第2章探索R 9 
使用代碼編輯器10 
 探索RGui 11 
 用RStudio優化13 
開始第一個R會話15 
 向世界說你好15 
 使用向量15 
 存儲和計算值16 
 回饋用戶18 
 啟動一個腳本18 
 響應你的工作20 
導航環境21 
 操縱環境中的內容21 
 保存你的工作21 
 檢索你的工作22 

第3章R基礎知識23 
充分利用函數的強大功能23 
 向量函數24 
 函數參數調用25 
 創建歷史記錄27 
保持代碼的可讀性27 
 遵循命名規則28 
 組織代碼30 
 添加註釋32 
R基礎功能的擴展32 
 查找擴展包32 
 安裝擴展包33 
 加載和卸載擴展包33 

第二部分開始使用R 35 
第4章算術入門37 
數值、無窮值與缺失值37 
 基礎運算的操作38 
 使用數學函數40 
 計算整 向量43 
 無窮及其以後43 
使用向量組織數據45 
 探索向量屬性45 
 創建向量48 
 向量連接48 
 重複向量49 
向量值的存取49 
 理解R的索引50 
 從向量中提取數值50 
 修改向量的值51 
使用邏輯向量52 
 值的比較53 
 將邏輯向量作為索引54 
 邏輯表達式的組合55 
 邏輯向量小結56 
增強數學運算56 
 使用向量的數學運算57 
 參數循環59 

第5章開始讀和寫61 
對文本數據使用字符向量61 
 為字符向量賦值62 
 創建包含多個元素的字符向量62 
 獲取向量的子集63 
 為向量中的值命名64 
文本操作66 
 字符串理論:組合和分割字符串66 
 文本排序69 
 查找文本中包含的內容70 
 文本替換72 
 使用正則表達式73 
使用因子進行分類76 
 創建因子76 
 轉換因子77 
 關注水平79 
 區分數據類型80 
 使用有序因子81 

第6章使用R處理時間數據83 
處理日期83 
用不同的格式表示日期85 
添加時間86 
日期和時間的格式88 
操作日期與時間88 
 加法和減法89 
 日期的比較89 
 提取90 

第7章高維數據 處理93 
添加第二個維度93 
 探索新維度94 
 將向量組合成矩陣97 
使用索引98 
 提取矩陣元素的值98 
 降低維度100 
 修改矩陣中的值100 
為矩陣行列命名101 
 修改行和列的名稱102 
 將名稱作為索引103 
矩陣的計算103 
 矩陣的基本運算103 
 行列求和105 
 矩陣運算105 
添加更多維度107 
 創建數組107 
 使用維度來提取數據108 
在數據框組合不同類型的值109 
 由矩陣創建數據框109 
 從零開始創建數據框111 
 命名變量和規則112 
操縱數據框中的值113 
 提取變量、觀察值和元素值114 
 向數據框添加觀測值115 
 向數據框添加變量117 
將不同類型的對象組合到列表中118 
 創建列表119 
 提取列表中的元素120 
 修改列表中的元素122 
 理解列表的str()輸出結果124 
 透過樹木看到森林125 

第三部分編寫R代碼127 
第8章探索函數的樂趣129 
從腳本到函數129 
 編寫腳本130 
 轉換腳本130 
 使用函數131 
 簡化代碼133 
巧妙地使用參數134 
 添加更多的參數135 
 點參數的魔力136 
 將 數作為參數137 
 處理作用域140 
 穿越邊界140 
方法分配142 
 隱藏函數背後的方法142 
 實現自己的通用函數144 

第9章控制邏輯流146 
使用“if”語句做出判斷選擇147 
用“if...else ”語句實現另一種選擇149 
判斷選擇的向量化150 
 查看問題150 
 基於邏輯向量進行判斷151 
多種選擇152 
 嵌套“if ... else ”語句153 
 用switch處理多種選擇154 
循環遍歷155 
 構造一個“for”循環155 
 通過“for”循環來進行計算156 
無循環的循環:認識“Apply”家族函數158 
 “apply”函數的家族特徵159 
 認識“apply”家族中的三個成員159 
 針對行和列使用apply函數160 
 將函數應用於與列表類似的對像上162 

第10章調試代碼165 
知道要查找什麼165 
閱讀錯誤信息和警告信息166 
 閱讀錯誤信息166 
 注意警告信息(或者不) 167 
查找漏洞169 
 logit計算169 
 了解錯誤的來源169 
 查找函數內部170 
自定義消息174 
 創建錯誤174 
 創建警告175 
一些常見的錯誤175 
 從錯誤的數 開始176 
 格式錯誤的數據176 

第11章取得幫助180 
在R幫助文檔中查找信息180 
 當我們明確地知道到底查找什麼時180 
 當我們不知道到底要查找什麼時181 
在互聯網上查找R幫助文檔182 
加入R社區184 
 在Stack Overflow和Stack Exchange討論R 184 
 使用R郵件列表184 
 在Twitter討論R 185 
實現最小可複現示例185 
 用隨機數創建樣本數據186 
 精簡代碼187 
 提供必要的信息187 

第四部分讓數據說話189 
第12章導入和導出數據191 
導入數據到R中191 
 在R文本編輯器中錄入數據192 
 使用剪貼板複製和粘貼193 
 從CSV文件中讀取數據195 
 從Excel中讀取數據198 
 處理其他數據類型200 
R中導出數據201 
使用文件和文件夾202 
 了解工作目錄202 
 文件操作204 

第13章操作和處理數據207 
確定最合適的數據結構207 
創建數據子集208 
 理解三種子集運算符209 
 理解取子集的五種方式209 
 提取數據框子集210 
在數據中添加計算域214 
 數據框的列運算214 
 使用with和within提高 碼的可讀性215 
 對數據進行分組216 
組合與合併數據集217 
 創建示例數據218 
 使用“merge()”函數220 
 使用查詢表221 
數據排序223 
 對向量進行排序224 
 對數據框進行排序224 
使用“apply ”函數遍歷數據227 
 使用“apply()”函數匯總數組228 
 使用“lapply()”和“sapply()”來遍歷列表或數據框229 
 使用“tapply()”創建表格匯總數據230 
了解公式接口232 
規範數據的格式234 
 理解數據的長格式和寬格式234 
 初識reshape2包235 
 將數據轉換為長格式236 
 將數據重塑寬格式237 

第14章數據匯總240 
從正確的數據開始241 
 使用因子或數值241 
 唯一值計數242 
 準備數據242 
描述連續變量243 
 討論數據的中心243 
 描述變異性244 
 計算分位數244 
描述分類245 
 計數246 
 計算比例246 
 查找中心247 
描述分佈248 
 繪製直方圖248 
 使用頻率和密度249 
描述多元變量251 
 完整數據集的匯總251 
 繪製子集的分位數252 
 記錄相關性254 
使用表格257 
 創建雙向表257 
 將表格轉換為 數據框258 
 邊際與比例259 

第15章差異與關聯檢驗261 
仔細研究分佈262 
觀察海狸262 
 正態分佈的圖形檢驗262 
 使用分位圖263 
 使用公式法檢驗正態性265 
比較兩個樣本267 
 差異檢驗267 
 比較成對數據269 
檢驗頻數和比例270 
 檢驗比例270 
 表格分析271 
 提取檢驗結果273 
使用模型273 
 方差分析274 
 計算差異276 
 線性關係建模278 
 線性模型評估280 
 預測新值282 

第五部分繪製圖形285 
第16章使用基本圖型287 
創建不同類型的數據圖287 
 數據圖概覽287 
 向數據圖添加點和線288 
 各種類型的數據圖292 
控制數據圖選項和參數294 
 添加標題和坐標軸標籤294 
 修改數據圖選項295 
 在單頁中繪製多個數據圖298 
將數據圖保存成圖片文件299 

第17章使用lattice繪製切片圖301 
創建lattice數據圖302 
 加載lattice包303 
 製作lattice散點圖303 
 添加趨勢線304 
修改數據圖的選項306 
 添加標題和標籤306 
 修改標題和標籤的字號307 
 使用主題修改數據圖選項308 
繪製不同類 型的數據圖309 
 繪製柱狀圖309 
 繪製箱型圖310 
繪製分組數據311 
 使用高格式數據311 
 繪製分組數據313 
 添加圖例313 
輸出和保存lattice數據圖314 
 將lattice圖賦予一個對象315 
 在腳本中輸出lattice數據圖315 
 將lattice數據圖保存成文件315 

第18章學習ggplot2製圖317 
安裝並加載ggplot2 317 
認識層318 
使用geom和stat 319 
 定義數據319 
 從數據映射到可視元素320 
 獲得geom 321 
了解stat 324 
添加切片、標尺和選項326 
 添加切片326 
 修改選項327 
獲取更多信息329 

第六部分20條有用建議331 
第19章10種用R不用Excel的情況333 
添加行和列的總和333 
格式化數據334 
數據排序336 
使用if進行選擇336 
計算條件總和337 
列或行轉置337 
查找唯一或重複值338 
使用檢索表339 
利用數據透視表339 
使用單變量求解340 

第20章關於程序包的10個技巧343 
探索CRAN 343 
尋找有趣的程序包344 
安裝程序包344 
加載程序包345 
閱讀程序包的手冊和文檔345 
更新程序包346 
使用R-Forge 34 7 
從github獲取程序包347 
從Bioconductor進行安裝348 
閱讀R手冊348 

附錄A安裝R和RStudio 349 
附錄B rfordummies包355 
譯後記357