R數據挖掘入門 R数据挖掘入门
[日]山本義郎、藤野友和、久保田貴文
- 出版商: 人民郵電
- 出版日期: 2018-03-01
- 定價: $270
- 售價: 7.9 折 $213
- 語言: 簡體中文
- 頁數: 198
- 裝訂: 平裝
- ISBN: 7115478783
- ISBN-13: 9787115478788
-
相關分類:
R 語言、Text-mining、R 語言
立即出貨
買這商品的人也買了...
-
R資料採礦與數據分析--以 GUI 套件 Rattle 結合程式語言實作$500$395 -
Introduction to Data Mining, 2/e (GE-Paperback)$1,420$1,392 -
$449Python真好玩:教孩子學編程
商品描述
本書使用R,結合大量實例,詳細介紹了數據挖掘的理論和分析方法。全書分為3部分:* 1部分簡單介紹了使用R進行數據挖掘的流程和數據挖掘的概要;* 2部分介紹了數據挖掘的10種常用方法,並在此基礎上使用R實際進行數據挖掘;第3部分結合實際的數據挖掘事例介紹瞭如何使用這些方法。本書適合數據挖掘的初學者,以及正在從事數據分析相關工作,想瞭解更多分析方法的讀者閱讀。
作者簡介
久保田貴文,日本多摩大學經營信息學部副教授。執筆本書第5章、第7章、第10章、第14章。
目錄大綱
第Ⅰ部分 使用R進行數據挖掘的準備
第1章 基於R的數據分析入門
1.1 R及RStudio的安裝
1.2 RStudio的基本操作
1.3 R語言入門
1.3.1 作為計算器使用的方法
1.3.2 向量——R的基本數據結構
1.3.3 向量變量的賦值和運算
1.3.4 數組和矩陣
1.3.5 因子型
1.3.6 列表
1.3.7 數據框
1.4 獲取外部數據
1.5 數據匯總
1.6 安裝程序包
1.7 基於dplyr程序包的數據框操作
1.8 數據的可視化
1.8.1 柱狀圖
1.8.2 直方圖
1.8.3 箱形圖
1.8.4 散點圖
1.8.5 逐層繪制的圖
第2章 數據挖掘概述
2.1 大數據和數據挖掘
2.2.1 業務理解(Business Understanding)
2.2 CRISP-DM
2.2.2 數據理解(Data Understanding)
2.2.3 數據準備(Data Preparation)
2.2.4 建模(Modeling)
2.2.5 評估(Evaluation)
2.2.6 運用(Deployment)
2.3.1 數據的種類和建模
2.3 數據挖掘的方法
2.3.2 預測和判別
2.3.3 分類和聚類
2.3.4 維規約
2.3.5 規則發現
第Ⅱ部分 數據挖掘的方法
第3章 回歸分析
3.1 一元回歸分析
3.2 多元回歸分析
第4章 Logistic回歸分析
4.1 數據準備
4.2 使用一個解釋變量進行預測
4.3 使用兩個及以上的解釋變量進行預測
第5章 決策樹分析
5.1 使用分類樹的判別
5.2 使用回歸樹的預測
第6章 支持向量機
6.1 支持向量機的概念
6.2 類別預測的例子
6.3 數值預測的例子
第7章 記憶基礎推理
7.1 k第近鄰法的概念
7.2 變量的基準化和標準化
第8章 聚類分析
8.1 聚類分析的概念
8.2 層次聚類分析
8.3 執行層次聚類分析
8.4 可視化進階
8.5 非層次聚類分析
8.6 執行非層次聚類分析
第9章 自組織映射
9.1 自組織映射的概念
9.2 基於自組織映射的分析實例
9.3 基於自組織映射的分類
第10章 主成分分析
10.1 主成分分析的概念
10.2 對象數據的準備
10.3 執行主成分分析
第11章 對應分析
11.1 對應分析
11.2 多重對應分析
第12章 關聯規則分析
12.1 關聯規則及其評價指標
12.2 關聯規則分析的實例
12.3 關聯規則分析的應用實例
第Ⅲ部分 數據挖掘實戰
第13章 對各種預測方法的評估
13.1 關於預測方法的評估
13.2 類別預測的判別方法的比較
13.2.1 Logistic回歸分析
13.2.2 決策樹分析
13.2.3 支持向量機
13.3 數值預測方法的比較
13.3.1 多元回歸分析
13.3.2 決策樹分析
13.3.3 支持向量機
第14章 用股價數據生成綜合指數
14.1 獲取股價數據
14.2 根據股價數據生成綜合指數
第15章 SNS數據的分析
15.1 微博API
15.2 通過R獲取微博信息
15.3 分詞及詞頻統計
15.4 詞雲圖
