數據分析實戰 数据分析实战

酒捲隆治, 里洋平

  • 出版商: 人民郵電
  • 出版日期: 2017-06-01
  • 定價: $270
  • 售價: 8.5$230
  • 語言: 簡體中文
  • 頁數: 254
  • 裝訂: 平裝
  • ISBN: 7115454531
  • ISBN-13: 9787115454539
  • 相關分類: Data Science
  • 立即出貨 (庫存=1)

買這商品的人也買了...

商品描述

數據分析實戰 由實戰經驗豐富的兩位數據分析師執筆,數據分析實戰 首先介紹了商業領域里通用的數據分析框架,然後根據該框架,結合8個真實的案例,詳細解說了通過數據分析解決各種商業問題的流程,讓讀者在解決問題的過程中學習各種數據分析方法,包括柱狀圖、交叉列表統計、A/B測試、多元回歸分析、邏輯回歸分析、聚類、主成分分析、決策樹分析、機器學習等。特別是書中使用的數據都是未經清洗的原始數據,對如何加工數據以用於數據分析也進行了詳細的介紹。讀者可以使用R語言實際操作數據,體驗真實的數據分析流程,避免紙上談兵。

作者簡介

酒卷隆治(作者)
浦和出身。環境學博士畢業。就職於株式會社DRECOM數據分析部門。擅長人類行動日誌的分析。現主要從事社交遊戲和在線服務的日誌分析工作。

裡洋平(作者)
種子島出身。就職於株式會社DRECOM數據分析部門。擅長使用R語言進行數據分析,現主要從事數據分析環境的搭建和數據分析工作。合著有《數據科學養成讀本》(技術評論社)、《R包使用手冊》(東京圖書)。

肖峰(譯者)
日本東京工業大學計算機工學博士。曾在日本樂天株式會社樂天技術研究所從事研究工作。2013年回國後加入新浪,現任新浪個性化推薦團隊算法負責人。擁有豐富的數據分析與建模能力。

目錄大綱

第1章數據科學家的工作1 
1.1什麼是數據科學家2 
1.23種類型的數據科學家5 
1.3數據科學家的現狀8 

第2章商業數據分析流程9 
2.1數據分析的5個流程10 
2.2現狀和預期12 
2.3發現問題13 
2.4數據的收集和加工19 
2.5數據分析24 
2.6解決對策27 
2.7小結29 

分析基礎篇

第3章案例1—柱狀圖
為什麼銷售額會減少35 
3.1現狀和預期36 
3.2發現問題38 
3.3數據的收集和加工39 
3.4數據分析46 
3.5解決對策49 
3.6小結50 
3.7詳細的R代碼51 

第4章案例2—交叉列表統計
什麼樣的顧客會選擇離開61 
4.1現狀和預期62 
4.2發現問題64 
4.3數據的收集和加工65 
4.4數據分析69 
4.5解決對策73 
4.6小結75 
4.7詳細的R代碼76 

第5章案例3—A/B測試
哪種廣告的效果更好83
5.1現狀和預期84 
5.2發現問題86 
5.3數據的收集和加工88 
5.4數據分析96 
5.5解決對策98 
5.6小結99 
5.7詳細的R代碼100 

第6章案例4—多元回歸分析105 
如何通過各種廣告的組合獲得更多的用戶105 
6.1現狀和預期106 
6.2發現問題108 
6.3數據的收集112 
6.4數據分析114 
6.5解決對策117 
6.6小結119 
6.7詳細的R代碼120 

分析應用篇

第7章案例5—邏輯回歸分析
根據過去的行為能否預測當下125 
7.1期望增加遊戲的智能手機用戶量126 
7.2是用戶賬號遷轉設定失敗導致的問題嗎128 
7.3在數據不包含正解的情況下收集數據131 
7.4驗證是否能夠建立模型144 
7.5解決對策148 
7.6小結149 
7.7詳細的R代碼150 

第8章案例6—聚類
應該選擇什麼樣的目標用戶群163 
8.1希望了解用戶的特點164 
8.2基於行為模式的用戶分類165 
8.3把主成分作為自變量來使用168 
8.4進行聚類176
8.5解決對策180 
8.6小結181 
8.7詳細的R代碼182 

第9章案例7—決策樹分析
具有哪些行為的用戶會是長期用戶193 
9.1希望減少用戶開始遊戲後不久就離開的情況194 
9.2了解“樂趣”的結構195 
9.3把類作為自變量198 
9.4進行決策樹分析210 
9.5解決對策213 
9.6小結215 
9.7詳細的R代碼216 

第10章案例8—機器學習
如何讓組隊遊戲充滿樂趣233 
10.1使組隊作戰的樂趣最大化234 
10.2利用數據分析為服務增加附加價值236 
10.3在數據中排除星期的影響238 
10.4構建預測模型241 
10.5解決對策248 
10.6小結249 
10.7詳細的R代碼250