R語言數據分析與挖掘實戰 R语言数据分析与挖掘实战

張良均, 雲偉標, 王路, 劉曉勇

  • 出版商: 機械工業
  • 出版日期: 2015-10-01
  • 定價: $414
  • 售價: 8.5$352
  • 語言: 簡體中文
  • 頁數: 325
  • 裝訂: 平裝
  • ISBN: 7111516044
  • ISBN-13: 9787111516040
  • 相關分類: R 語言Data Science
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

商品描述

<內容簡介>
 本書共16章,分三個部分:基礎篇、實戰篇、提高篇。基礎篇介紹了數據挖掘的基本原理,實戰篇介紹了一個個真實案例,通過對案例深入淺出的剖析,使讀者在不知不覺中通過案例實踐獲得數據挖掘項目經驗,同時快速領悟看似難懂的數據挖掘理論。讀者在閱讀過程中,應充分利用隨書配套的案例建模數據,借助相關的數據挖掘建模工具,通過上機實驗,以快速理解相關知識與理論。高級篇介紹了基於R語言二次開發的數據挖掘應用軟件,使讀者體驗到數據挖掘二次的開發的魅力。

<目錄>

前 言
基 礎 篇
第1章 數據挖掘基礎
 1.1 某知名連鎖餐飲企業的困惑
 1.2 從餐飲服務到數據挖掘
 1.3 數據挖掘的基本任務
 1.4 數據挖掘建模過程
   1.4.1 定義挖掘目標
   1.4.2 數據取樣
   1.4.3 數據探索
   1.4.4 數據預處理
   1.4.5 挖掘建模
   1.4.6 模型評價
 1.5 常用數據挖掘建模工具
 1.6 小結
第2章 R語言簡介
 2.1 R安裝
 2.2 R使用入門
   2.2.1 R操作界面
   2.2.2 RStudio窗口介紹
   2.2.3 R常用操作
 2.3 R數據分析包
 2.4 配套附件使用設置
 2.5 小結
第3章 數據探索
 3.1 數據質量分析
   3.1.1 缺失值分析
   3.1.2 異常值分析
   3.1.3 一致性分析
 3.2 數據特徵分析
   3.2.1 分佈分析
   3.2.2 對比分析
   3.2.3 統計量分析
   3.2.4 周期性分析
   3.2.5 貢獻度分析
   3.2.6 相關性分析
 3.3 R語言主要數據探索函數
   3.3.1 統計特徵函數
   3.3.2 統計作圖函數
 3.4 小結
第4章 數據預處理
 4.1 數據清洗
   4.1.1 缺失值處理
   4.1.2 異常值處理
 4.2 數據集成
   4.2.1 實體識別
   4.2.2 冗餘屬性識別
 4.3 數據變換
   4.3.1 簡單函數變換
   4.3.2 規範化
   4.3.3 連續屬性離散化
   4.3.4 屬性構造
   4.3.5 小波變換
 4.4 數據規約
   4.4.1 屬性規約
   4.4.2 數值規約
 4.5 R語言主要數據預處理函數
 4.6 小結
第5章 挖掘建模
 5.1 分類與預測
   5.1.1 實現過程
   5.1.2 常用的分類與預測算法
   5.1.3 回歸分析
   5.1.4 決策樹
   5.1.5 人工神經網絡
   5.1.6 分類與預測算法評價
   5.1.7 R語言主要分類與預測算法函數
 5.2 聚類分析
   5.2.1 常用聚類分析算法
   5.2.2 K-Means聚類算法
   5.2.3 聚類分析算法評價
   5.2.4 R語言主要聚類分析算法函數
 5.3 關聯規則
   5.3.1 常用關聯規則算法
   5.3.2 Apriori算法
 5.4 時序模式
   5.4.1 時間序列算法
   5.4.2 時間序列的預處理
   5.4.3 平穩時間序列分析
   5.4.4 非平穩時間序列分析
   5.4.5 R語言主要時序模式算法函數
 5.5 離群點檢測
   5.5.1 離群點檢測方法
   5.5.2 基於模型的離群點檢測方法
   5.5.3 基於聚類的離群點檢測方法
 5.6 小結
實 戰 篇
第6章 電力竊漏電用戶自動識別
 6.1 背景與挖掘目標
 6.2 分析方法與過程
   6.2.1 數據抽取
   6.2.2 數據探索分析
   6.2.3 數據預處理
   6.2.4 構建專家樣本
   6.2.5 模型構建
 6.3 上機實驗
 6.4 拓展思考
 6.5 小結
第7章 航空公司客戶價值分析
 7.1 背景與挖掘目標
 7.2 分析方法與過程
   7.2.1 數據抽取
   7.2.2 數據探索分析
   7.2.3 數據預處理
   7.2.4 模型構建
 7.3 上機實驗
 7.4 拓展思考
 7.5 小結
第8章 中醫證型關聯規則挖掘
 8.1 背景與挖掘目標
 8.2 分析方法與過程
   8.2.1 數據獲取
   8.2.2 數據預處理
   8.2.3 模型構建
 8.3 上機實驗
 8.4 拓展思考
 8.5 小結
第9章 基於水色圖像的水質評價
 9.1 背景與挖掘目標
 9.2 分析方法與過程
   9.2.1 數據預處理
   9.2.2 模型構建
   9.2.3 水質評價
 9.3 上機實驗
 9.4 拓展思考
 9.5 小結
第10章 家用電器用戶行為分析與事件識別
 10.1 背景與挖掘目標
 10.2 分析方法與過程
   10.2.1 數據抽取
   10.2.2 數據探索分析
   10.2.3 數據預處理
   10.2.4 模型構建
   10.2.5 模型檢驗
 10.3 上機實驗
 10.4 拓展思考
 10.5 小結
第11章 應用系統負載分析與磁盤容量預測
 11.1 背景與挖掘目標
 11.2 分析方法與過程
   11.2.1 數據抽取
   11.2.2 數據探索分析
   11.2.3 數據預處理
   11.2.4 模型構建
 11.3 上機實驗
 11.4 拓展思考
 11.5 小結
第12章 電子商務智能推薦服務
 12.1 背景與挖掘目標
 12.2 分析方法與過程
   12.2.1 數據抽取
   12.2.2 數據探索分析
   12.2.3 數據預處理
   12.2.4 模型構建
 12.3 上機實驗
 12.4 拓展思考
 12.5 小結
第13章 基於數據挖掘技術的市財政收入分析預測模型
 13.1 背景與挖掘目標
 13.2 分析方法與過程
   13.2.1 灰色預測與神經網絡的組合模型
   13.2.2 數據探索分析
   13.2.3 模型構建
 13.3 上機實驗
 13.4 拓展思考
 13.5 小結
第14章 基於基站定位數據的商圈分析
 14.1 背景與挖掘目標
 14.2 分析方法與過程
   14.2.1 數據抽取
   14.2.2 數據探索分析
   14.2.3 數據預處理
   14.2.4 模型構建
 14.3 上機實驗
 14.4 拓展思考
 14.5 小結
第15章 電商產品評論數據情感分析
 15.1 背景與挖掘目標
 15.2 分析方法與過程
   15.2.1 評論數據採集
   15.2.2 評論預處理
   15.2.3 文本評論分詞
   15.2.4 模型構建
 15.3 上機實驗
 15.4 拓展思考
 15.5 小結
提 高 篇
第16章 基於R語言的數據挖掘二次開發
 16.1 混合編程應用體驗——TipDM數據挖掘平臺
 16.2 二次開發過程環境配置
 16.3 R語言數據挖掘二次開發實例
 16.4 小結
參考資料