R語言資料分析:基礎、演算法與實戰

孫玉林

商品描述

本書基於主流統計分析程式語言R,介紹了常用的資料分析方法及其實戰應用,內容涵蓋了R語言的使用、
基於ggplot2套件及其拓展套件的資料視覺化、資料的清洗與探索、資料分析、資料探勘以及統計分析方法等。
本書在講解資料分析時,主要基於tidyverse系列套件進行資料整理、操作與視覺化,基於tidymodels系列套件進行資料分析、
統計分析、機器學習等演算法的應用,其它的R套件用於資料分析的輔助。
使用R語言時,遵循更新更簡潔的程式設計方式。
本書內容循序漸進,講解通俗易懂,同時配套原始程式和資料文件,讀者可以邊學邊實踐。
本書可供從事資料分析、資料視覺化、機器學習的科學研究及技術人員閱讀使用,
也可作為高等院校中統計學、電腦科學等相關專業的教材。

目錄大綱

第1章R語言與資料分析
1.1 R與RStudio安裝
1.1.1 R語言安裝
1.1.2 RStudio安裝
1.1.3 R套件安裝
1.2 資料分析簡介
1.2.1 資料分析的內容
1.2.2 資料分析工作流程
1.2. 3 什麼是資料分析師
1.2.4 資料分析師所需的技術與知識
1.3 R語言與資料分析
1.3.1 為何 R語言適合資料分析
1.3.2 R語言常用資料分析套件
1.4 本章小結
第2章R語言快速入門
2.1 向量的資料型別
2.1.1 數值型
2.1.2 邏輯值型
2.1.3 字元
型2.1.4 因子型
2.2 矩陣與高維數組
2.2.1 矩陣
2.2.2 高維數組
2.3 資料框與列表
2.3. 1 資料框
2.3.2 清單
2.4 條件判斷與循環語句
2.4.1 條件判斷語句
2.4.2 循環語句
2.5 編寫自己的函數
2.6 本章小結
第3章R語言資料管理與操作
3.1 資料導入與保存
3.1.1 資料導入
3.1.2 資料保存
3.2 處理缺失值
3.2.1 缺失值發現
3.2.2 缺失值填入
3.3 資料操作
3.3.1 資料並行計算
3.3.2 資料選擇、篩選、分組
3.3.3 資料融合
3.3.4 進行長寬資料轉換
3.4 其它資料處理
3.4.1 lubridate套件處理時間資料
3.4.2 stringr套件處理文字資料
3.5 本章小結
第4章R語言資料視覺化
4.1 R語言基礎繪圖系統
4.1.1 基礎繪圖系統視覺化基本設定
4.1. 2 基礎繪圖系統視覺化實戰
4.2 ggplot2套件資料視覺化
4.2.1 使用圖層建構影像
4.2.2 ggplot2視覺化進階
4.3 R語言其它資料視覺化套件
4.3.1 GGally封包視覺化
4.3.2 ggChernoff封包資料視覺化
。 ggTimeSeries套件資料視覺化
4.3.4 pheatmap套件資料視覺化
4.3.5 igraph套件資料視覺化
4.3.6 wordcloud套件資料視覺化
4.3.7 ComplexUpset套件資料視覺化
4.4 本章小結
第5章R語言資料分析
5.1 相關性分析5.1.1 相關性分析
5.1.1 相關性分析係數介紹
5.1.2 相關係數計算與視覺化分析
5.2 變異數分析
5.2.1 單因子變異數分析
5.2.2 雙因子變異數分析
5.3 降維
5.3.1 常用資料降維演算法
5.3.2 資料降維實戰
5.4 迴歸分析
5.4 .1 常用迴歸演算法
5.4.2 迴歸評估指標
5.4.3 資料迴歸實戰
5.5 分類
5.5.1 常用分類演算法
5.5.2 分類評估指標
5.5.3 資料分類實戰
5.6 聚類
5.6.1 常用資料聚類演算法
5.6. 2 聚類評估指標
5.6.3 資料聚類實戰
5.7 時間序列預測
5.7.1 時序預測的相關模型
5.7.2 時間序列預測實戰
5.8 本章小結
第6章綜合案例1:中藥材鑑別
6.1 聚類鑑別藥材演算法種類
6.1.1 資料探索與視覺化
6.1.2 資料降維與特徵擷取
6.1.3 資料聚類
6.2 分類演算法鑑別藥材的產地
6.2.1 資料導入與探索
6.2.2 選擇資料中的重要特徵
6.2.3 鑑別藥材的產地
6.3 分類演算法鑑別藥材的類別
6.3.1 資料導入與探索
6.3.2 資料特徵降維
6.3.3 預測藥材的類別
6.4 分類演算法預測藥材的產地
6.4.1 資料導入與探索
6.4.2 資料特徵降維
6.4.3 預測藥材的產地
6.5 本章小結
第7章綜合案例2:抗乳癌候選藥物分析
7.1 資料特徵擷取
7.1.1 資料視覺化探索
7.1. 2 特徵選擇
7.2 迴歸模型預測生物活性
7.2.1 利用隨機森林提取的特徵建立迴歸模型
7.2.2 利用Lasso迴歸提取的特徵建立迴歸模型
7.3 分類模型預測二分類變數
7.3.1 透過遞歸特徵消除提取特徵建立分類模型
7.3.2 透過主成分降維提取特徵建立分類模型
7.4 本章小結
第8章綜合案例3:文本內容資料分析
8.1 文本預處理
8.1.1 讀取文本資料
8.1.2 文本資料清洗
8.2 特徵提取與視覺化
8.2.1 TF特徵
8.2.2 TF-IDF特徵
8.2.3 詞雲視覺化
8.3 文本聚類
8.3.1 LDA主題模型聚類
8.3.2 K均值聚類
8.4 對文本進行分類
8.4.1 基於TF-IDF特徵建立分類模型
8.4.2 基於TF特徵建立分類模型
8.5 中文文本資料分析
8.5.1 《三國演義》文本資料預處理
8.5.2 對文本資料探索與特徵提取
8.5.3 建立LDA主題模型
8.6 本章小結
參考文獻