誰說菜鳥不會數據分析 (R語言篇)

方小敏,齊德勝,張文霖

  • 出版商: 電子工業
  • 出版日期: 2020-05-01
  • 定價: $414
  • 售價: 7.9$327
  • 貴賓價: 7.5$311
  • 語言: 簡體中文
  • ISBN: 7121389681
  • ISBN-13: 9787121389689
  • 相關分類: R 語言Data Science
  • 立即出貨

買這商品的人也買了...

商品描述

本書從解決工作實際問題出發,提煉並總結工作中R 語言常用的數據處理、數據分析實戰方法與技巧。本書力求通俗易懂地介紹相關知識,在不影響學習和理解的前提下,盡可能地避免使用晦澀難懂的R 語言編程、統計術語或模型公式。如果讀者需要瞭解相關的知識,可查閱相關的圖書或資料。本書的定位是帶領R 語言數據分析初學者入門,並解決在學習、工作中使用R 語言進行數據分析的大部分問題或需求。如果讀者在入門後還需要進一步學習,可自行擴展閱讀相關圖書或資料,因為學習是永無止境的,正所謂“師傅領進門,修行在個人”。

作者簡介

方小敏

“數據分析實戰”公眾號主理人,資深機器學習工程師;
曾服務於BAT等知名互聯網企業,熟練掌握Python、R、Spark、Hive、TensorFlow等工具進行機器學習。

齊德勝

“玩轉Python數據”公眾號主理人,資深商業智能工程師,略懂Python、R、SQL等。

張文霖

新浪博客“小蚊子數據分析”博主,資深數據分析師,
曾服務於國內知名市場研究公司、中國移動等公司,
具有多年移動互聯網數據分析經驗,略懂Excel、PPT、SPSS、水晶易表等工具。

目錄大綱

第1 章數據分析概況
1.1 數據分析的定義(What)
1.2 數據分析的作用(Why)
1.3 數據分析的步驟(How)
1.3.1 明確分析目的和思路
1.3.2 數據收集
1.3.3 數據處理
1.3.4 數據分析
1.3.5 數據展現
1.3.6 報告撰寫
1.4 數據分析的三大誤區
1.5 常用的數據分析工具
1.5.1 Excel
1.5.2 SPSS
1.5.3 Python
1.5.4 R 語言

第2 章R 語言概況
2.1 R 語言簡介
2.2 R 語言的特點
2.3 R 語言包
2.3.1 函數
2.3.2 包
2.4 R 語言的使用場景
2.5 RStudio 簡介
2.6 R 軟件和RStudio 的下載與安裝
2.6.1 下載R 軟件
2.6.2 安裝R 軟件
2.6.3 下載RStudio
2.6.4 安裝RStudio
2.7 RStudio 的使用
2.7.1 RStudio 界面簡介
2.7.2 項目管理
2.7.3 新建R 代碼文件
2.7.4 代碼提示
2.7.5 變量瀏覽
2.7.6 圖形繪製
2.7.7 幫助文檔

第3 章編程基礎
3.1 數據類型8
3.1.1 數值型
3.1.2 字符型
3.1.3 邏輯型
3.2 賦值和變量
3.2.1 賦值和變量
3.2.2 變量命名規則
3.3 數據結構
3.3.1 向量
3.3.2 因子9
3.3.3 數據框
3.3.4 列表
3.3.5 四種數據結構的區別
3.4 向量化運算
3.5 for 循環
3.6 R 語言編程注意事項

第4 章數據處理
4.1 數據導入與導出
4.1.1 數據導入7
4.1.2 數據導出
4.2 數據清洗
4.2.1 數據排序
4.2.2 重複數據處理
4.2.3 缺失數據處理
4.2.4 空格數據處理
4.3 數據轉換
4.3.1 數值轉字符
4.3.2 字符轉數值
4.3.3 字符轉時間
4.4 數據抽取
4.4.1 字段拆分
4.4.2 記錄抽取
4.4.3 隨機抽樣
4.5 數據合併
4.5.1 記錄合併
4.5.2 字段合併
4.5.3 字段匹配
4.6 數據計算
4.6.1 簡單計算
4.6.2 時間計算
4.6.3 數據標準化
4.6.4 數據分組

第5 章數據分析
5.1 對比分析
5.2 基本統計分析
5.3 分組分析
5.4 結構分析
5.5 分佈分析
5.6 交叉分析
5.7 RFM 分析
5.8 矩陣分析
5.9 相關分析
5.10 回歸分析
5.10.1 回歸分析簡介
5.10.2 簡單線性回歸分析
5.10.3 多重線性回歸分析

第6 章數據可視化
6.1 數據可視化簡介
6.1.1 什麼是數據可視化
6.1.2 數據可視化常用圖表
6.1.3 通過關係選擇圖表
6.2 散點圖
6.3 矩陣圖
6.4 折線圖
6.5 餅圖
6.6 柱形圖
6.7 條形圖