R語言與數據挖掘最佳實踐和經典案例计算机科学丛书:R语言与数据挖掘最佳实践和经典案例

趙彥昌

出版商: 機械工業
出版日期: 2014-09-01
售價: $294
語言: 簡體中文
頁數: 208
裝訂: 平裝
ISBN: 7111475410
ISBN-13: 9787111475415
相關分類: R 語言
此書翻譯自: R and Data Mining: Examples and Case Studies (Hardcover)

下單後立即進貨 (約4週~6週)

買這商品的人也買了...

$351

R 語言編程藝術 (The Art of R Programming: A Tour of Statistical Software Design)
~~$360~~ $324

大數據挖掘－從巨量資料發現別人看不到的秘密
$178

R 語言與商業智能
~~$680~~ $537

R 錦囊妙計 (R Cookbook)
$336

數據挖掘：R 語言實戰－大數據時代的 R 語言
~~$360~~ $324

巨量資料的下一步－Big Data 新戰略、技術及大型網站應用實錄
~~$780~~ $663

ASP.NET MVC 5 網站開發美學
~~$650~~ $617

資料挖礦與大數據分析
$534

R 數據可視化手冊 (R Graphics Cookbook)
~~$350~~ $297

啊哈！圖解演算法必學基礎
~~$420~~ $357

Swift初學特訓班--iOS App 開發快速養成與實戰(附近3小時新手入門與關鍵影音教學/全書範例程式)
~~$490~~ $417

利用R語言打通大數據的經脈
~~$380~~ $323

Big Data－驅動大企業的幕後推手 (Big Data: Understanding How Data Powers Big Business)
~~$480~~ $408

巨量資料的第一步－基礎 R 語言與商業應用
~~$550~~ $467

精實開發與看板方法
~~$580~~ $493

挑戰大數據－Facebook、Google、Amazon 怎麼處理 Big Data？用 NoSQL 搞定每年 100 億顆硬碟資料, 2/e
$294

R 與 Hadoop 大數據分析實戰
~~$350~~ $350

Text Mining 文本探勘
~~$780~~ $616

精通 Python｜運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)
$351

R語言數據分析與挖掘實戰
$354

資料採擷核心技術揭秘
$294

R語言數據挖掘方法及應用/統計分析系列
$351

數據科學：理論、方法與R語言實踐
$354

R語言與數據挖掘
~~$450~~ $382

打下好基礎－程式設計必修的數學思維與邏輯訓練

商品描述

<內容簡介>

趙彥昌編著的《R語言與數據挖掘最佳實踐和經典案例》主要介紹如何使用R工具進行數據挖掘，提供了R用於數據挖掘應用的案例、代碼示例和數據，涵蓋了最常用的數據挖掘技術。
《R語言與數據挖掘最佳實踐和經典案例》講述簡潔、內容實用，配有現實應用案例和代碼示例以及數據，在線資源豐富，適合數據挖掘方向的研究生、數據挖掘領域的研究人員，以及數據挖掘工程師和分析師閱讀。

<目錄>

出版者的話
譯者序
縮寫詞表
第1章　簡介
1.1 數據挖掘
1.3 數據集
    1.3.1 iris數據集
    1.3.2 bodyfat數據集
第2章　數據的導入與導出
2.1 R數據的保存與加載
2.2 .CSV文件的導入與導出
2.3 從SAS中導入數據
2.4 通過ODBC導入與導出數據
    2.4.1 從數據庫中讀取數據
    2.4.2 從Excel文件中導入與導出數據
第3章　數據探索
3.1 查看數據
3.2 探索單個變量
3.3 探索多個變量
3.4 更多探索
3.5 將圖表保存到文件中
第4章　決策樹與隨機森林
4.1 使用party包構建決策樹
4.2 使用rpart包構建決策樹
4.3 隨機森林
第5章　回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
第6章　聚類
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基於密度的聚類
第7章　離群點檢測
7.1 單變量的離群點檢測
7.2 局部離群點因子檢測
7.3 用聚類方法進行離群點檢測
7.4 時間序列數據的離群點檢測
7.5 討論
第8章　時間序列分析與挖掘
8.1 R中的時間序列數據
8.2 時間序列分解
8.3 時間序列預測
8.4 時間序列聚類
    8.4.1 動態時間規整
    8.4.2 合成控製圖的時間序列數據
    8.4.3 基於歐氏距離的層次聚類
    8.4.4 基於DTW距離的層次聚類
8.5 時間序列分類
    8.5.1 基於原始數據的分類
    8.5.2 基於特徵提取的分類
    8.5.3 k-NN分類
8.6 討論
8.7 延伸閱讀
第9章　關聯規則
9.1 關聯規則的基本概念
9.2 Titanic數據集
9.3 關聯規則挖掘
9.4 消除冗餘
9.5 解釋規則
9.6 關聯規則的可視化
9.7 討論與延伸閱讀
第10章　文本挖掘
10.1 Twitter的文本檢索
10.2 轉換文本
10.3 提取詞幹
10.4 建立詞項-文檔矩陣
10.5 頻繁詞項與關聯
10.6 詞雲
10.7 詞項聚類
10.8 推文聚類
    10.8.1 基於k-means演算法的推文聚類
    10.8.2 基於k-medoids演算法的推文聚類
10.9 程序包、延伸閱讀與討論
第11章　社交網絡分析
11.1 詞項網絡
11.2 推文網絡
11.3 雙模式網絡
11.4 討論與延伸閱讀
第12章　案例Ⅰ：房價指數的分析與預測
12.1 HPI數據導入
12.2 HPI數據探索
12.3 HPI趨勢與季節性成分
12.4 HPI預測
12.5 房地產估價
12.6 討論
第13章　案例Ⅱ：客戶回復預測與效益最大化
13.1 簡介
13.2 KDD Cup 1998的數據
13.3 數據探索
13.4 訓練決策樹
13.5 模型評估
13.6 選擇最優決策樹
13.7 評分
13.8 討論與總結
第14章　案例Ⅲ：內存受限的大數據預測模型
14.1 簡介
14.2 研究方法
14.3 數據與變量
14.4 隨機森林
14.5 內存問題
14.6 樣本數據的訓練模型
14.7 使用已選變量建立模型
14.8 評分
14.9 輸出規則
    14.9.1 以文本格式輸出規則
    14.9.2 輸出SAS規則的得分
14.10 總結與討論
第15章　在線資源
15.1 R參考文檔
1
15.3 數據挖掘
15.4 R的數據挖掘
15.5 R的分類與預測
15.6 R的時間序列分析
15.7 R的關聯規則挖掘
15.8 R的空間數據分析
15.9 R的文本挖掘
15.10 R的社交網絡分析
15.11 R的數據清洗與轉換
15.12 R的大數據與並行計算
R語言數據挖掘參考文檔
參考資料
通用索引
包索引
函數索引