R語言數據分析項目精解:理論、方法、實戰 R语言数据分析项目精解:理论、方法、实战

羅榮錦

  • 出版商: 電子工業
  • 出版日期: 2017-08-01
  • 售價: $414
  • 貴賓價: 9.5$393
  • 語言: 簡體中文
  • 頁數: 340
  • 裝訂: 平裝
  • ISBN: 7121315734
  • ISBN-13: 9787121315732
  • 相關分類: R 語言資料科學

立即出貨 (庫存=1)

買這商品的人也買了...

相關主題

商品描述

本書以因特網電商企業為背景,抽象出工作中常見的數據分析問題,利用 R 語言和統計學列出了詳細的解決方案和過程。本書共 9 章,前兩章分別為總論和 R 語言入門知識,之後各章分別介紹了運營指標的建立、指標監控系統、假設檢驗及 AB 測試、變量篩選技術、用戶畫像系統、尋找優質用戶和文本挖掘等內容。本書涉及到的統計方法有:指標增長幅度量化方法、層次分析法、時間序列模型、基於正態分佈的一元離群點檢驗、傅里葉譜分析、假設檢驗、主成分分析、因子分析、模糊聚類、無監督下連續型變量離散化、邏輯回歸模型和文本挖掘等。另外,本書提供了所有實例的 R 語言實現代碼,總計 33 個自定義函數和數千行代碼。本書適合數據分析從業人員、產品運營人員、統計專業學生和 R 語言愛好者閱讀。

作者簡介

羅榮錦:
應用統計學碩士、應用數學和國際經濟與貿易雙學士。有8年數據分析工作經驗,先後從事過金融數據分析、網絡遊戲數據分析、B2B數據庫營銷以及互聯網用戶行為數據分析。現就職於攜程旅行網擔任資深數據分析師,主要從事用戶行為分析研究、統計學與數據挖掘應用等工作,擅長統計建模,熟悉R語言、SAS、SPSS等數據挖掘工具。從事數據研究工作,一定要“耐得住寂寞,忍受得了孤獨”。

目錄大綱

第1章互聯網+統計學+R語言1 
1.1互聯網中的統計學1 
1.1.1“互聯網+”的發展1 
1.1.2統計學的發展2 
1.1.3大數據時代的統計學2 
1.2R語言— —互聯網與統計學的橋樑3 
1.3本書結構5 

第2章R語言基礎7 
2.1安裝R語言7 
2.1.1獲取和安裝R語言7 
2.1.2安裝RStudio9 
2.1.3R包10 
2.1.4幫助12 
2.2 R語言基本對象12 
2.2.1數據類型12 
2.2.2向量12 
2.2.3矩陣和數組19 
2.2.4列表27 
2.2.5數據框29 
2.2.6因子32 
2.2.7數據類型的辨別和轉換39 
2.2 .8數據類型和對象關係39 
2.3工作空間和查看對象40 
2.3.1工作空間和工作目錄40 
2.3.2遍歷、創建、刪除文件夾41 
2.3.3查看對象的方法42 
2.4數據導入和導出43 
2.4 .1數據導入43 
2.4.2數據導出49 
2.5操作符和函數51 
2.5.1操作符51 
2.5.2函數54
2.6數據集操作59 
2.6.1變量操作60 
2.6.2數據集操作63 
2.6.3數據集連接67 
2.6.4數據匯總68 
2.7控制流71 
2.7.1重複和循環71 
2.7.2條件執行73 
2.7. 3next和break74 
2.8自定義函數75 

第3章互聯網運營指標的建立77 
3.1項目背景、目標及方案78 
3.1.1項目背景78 
3.1.2項目目標78 
3.1.3項目方案78 
3.2項目技術理論簡介78 
3.2 .1骨灰級流量指標78 
3.2.2登錄和激活80 
2.2.3訪問深度和吸引力81 
3.2.4訂單指標85 
3.2.5網站或APP性能指標86 
3.2.6轉化率87 
3.2.7層次分析法87 
3.3項目實踐92 
3.3.1搭建運營指標系統92 
3.3.2製作對比型指標及趨勢線97 
3.3.3創建用戶價值和活躍度指標101 

第4章指標監控系統111 
4.1項目背景、目標及方案111 
4.1.1項目背景111 
4.1.2項目目標111 
4.1.3項目方案112 
4.2項目技術理論簡介112
4.2.1時間序列基本統計量112 
4.2.2數據觀測與描述性統計113 
4.2.3隨機性115 
4.2.4週期性115 
4.2.5節假日模式識別115 
4.2.6建模數據集的建立118 
4.2. 7指標監控方法(不含節假日)125 
4.2.8節假日指標監控方法134 
4.2.9R語言實例代碼135 
4.3項目實踐141 
4.3.1數據概覽142 
4.3.2節假日模式識別145 
4.3.3模型數據集的建立155 
4.3.4指標監控(非節假日)160 
4.3.5節假日指標監控176 
4.3.6總結181 

第5章用數據驅動業務——AB測試182 
5.1項目背景、目標和方案182 
5.1.1項目背景182 
5.1 .2項目目標183 
5.1.3項目方案183 
5.2項目技術理論簡介183 
5.2.1自動化分流策略183 
5.2.2整體評估指標185 
5.2.3概率論預備知識186 
5.2.4假設檢驗191 
5.2.5三個問題197 
5.3項目實踐197 

第6章變量篩選技術204 
6.1項目背景、目標和方案204 
6.1.1項目背景204
6.1.2項目目標205 
6.1.3項目方案205 
6.2項目技術理論簡介205 
6.2.1變量相關性206 
6.2.2變量篩選209 
6.2.3變量降維215 
6.2.4R語言實例代碼225 
6.3項目實踐237 
6.3 .1變量篩選238 
6.3.2變量降維243 

第7章構建用戶畫像系統247 
7.1項目背景、目標和方案247 
7.1.1項目背景247 
7.1.2項目目標248 
7.1.3項目方案248 
7.2項目技術理論簡介248 
7.2.1用戶畫像的基本概念248 
7.2.2用戶畫像應用領域249 
7.2.3用戶畫像分類250 
7.2.4用戶畫像構建250 
7.2.5用戶畫像標籤的數值處理方法254 
7.3項目實踐256 

第8章從數據中尋找優質用戶261 
8.1項目背景、目標和方案261 
8.1.1項目背景261 
8.1.2項目目標262 
8.1.3項目方案262 
8.2項目技術理論簡介262 
8.2.1邏輯回歸的基本概念262 
8.2 .2建模流程266 
8.2.3模型開發階段269 
8.2.4模型驗證階段279
8.2.5模型測試階段285 
8.2.6商業應用流程288 
8.2.7R語言實例代碼288 
8.3項目實踐295 
8.3.1數據探索295 
8.3.2數據處理297 
8.3.3建立模型302 
8.3.4模型驗證304 
8.3 .5總結308 

第9章文本挖掘——點評數據展示策略309 
9.1項目背景、目標和方案310 
9.1.1項目背景310 
9.1.2項目目標311 
9.1.3項目方案311 
9.2項目技術理論簡介312 
9.2. 1評論文本質量量化指標模型312 
9.2.2用戶相似度模型313 
9.2.3情感性分析316 
9.2.4R語言實例代碼321 
9.3項目實踐326 
9.3.1若干自定義函數326 
9.3.2文本質量量化指標模型329 
9.3.3用戶相似度模型334 
9.3.4情感性分析335 
9.3.5總結340