大數據實踐之路:數據中台 + 數據分析 + 產品應用

林澤豐 等

  • 出版商: 電子工業
  • 出版日期: 2021-08-01
  • 定價: $414
  • 售價: 8.5$352
  • 語言: 簡體中文
  • 頁數: 248
  • 裝訂: 平裝
  • ISBN: 7121416654
  • ISBN-13: 9787121416651
  • 相關分類: 大數據 Big-dataData Science
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

商品描述

本書共13 章,匯集了7 位作者(來自各大互聯網企業)的知識總結和經驗分享。本書借助老湯姆、小風、阿北、小諾在某電商企業數據部門工作的故事,通過大量案例深入淺出地介紹了數據中台建設與應用之路。本書以Why-What-How 的思路展開,從0 到1 介紹知識點,並重點講述How 的過程,同時結合某個場景下的具體案例,以使讀者更好地理解實操過程。每個企業都會面臨各種各樣的數據問題,有數據質量的問題、數據獲取效率的問題、數據應用價值的問題等。本書首先介紹數據中台的建設,確保數據的質量,為企業的數據質量體系建設提供堅實的基礎;然後,進行偏向深入業務的分析探索,介紹如何從數據分析角度更好地賦能業務發展;最後,介紹數據應用,解決數據獲取效率的問題,並把一些分析思路和業務策略沉澱為數據產品,從而更好地將數據應用於業務。本書結合各大互聯網企業的實際項目案例,讓讀者真正掌握數據產品經理這個新興職業的必備技能和核心能力。

作者簡介

林澤豐,筆名小風,某國有企業的數據中台產品負責人。 UBDC全域大數據峰會“燈塔人物”,“友盟杯”數據大賽三等獎獲得者,公眾號“一個數據人的自留地”的課程講師。在電商、社交、交通、直播等領域擔任過產品、運營、數據等部門的負責人,有7年多的互聯網從業經驗。跨領域、跨部門實戰經驗豐富,曾從0到1搭建過企業數據中台、大數據平台、智能營銷平台,擅長埋點模型設計、指標質量治理、數倉架構、數據運營等。


許秋貴,筆名阿北,貝殼找房的高級數據分析師,畢業於東北農業大學。在校期間主導開發了校園拼車等應用,幫助大學生拼車省錢出行。曾就職於百度、滴滴等互聯網“大廠”,有多年數據分析經驗。


陳斌,筆名小諾,某互聯網“大廠”的策略產品經理,畢業於大連東軟信息學院。人人都是產品經理網站的“20年度熱文作者”,公眾號“一個數據人的自留地”的聯合創辦人。先後就職於百度、小米,在搜索引擎、資訊、電商等領域從事過搜索、推薦、BI、畫像、反作弊、消息觸達等產品工作,涉獵範圍較廣,經驗豐富。


陳麗媛,筆名草帽小子,自如畫像數據產品經理,擁有兩項發明專利。人人都是產品經理網站的專欄作家,公眾號“一個數據人的自留地”聯合創辦人。在用戶畫像、數據埋點、指標體系、BI等方面具有豐富的實戰經驗,所著系列文章深受廣大讀者喜愛。


梁旭鵬,筆名大鵬,某互聯網“大廠”的數據產品負責人,畢業於北京郵電大學的碩士研究生。人人都是產品經理網站的專欄作家,《數據產品經理修煉手冊:從零基礎到大數據產品實踐》的作者,公眾號“一個數據人的自留地”的創辦人。在電商、內容、出行、金融等領域有近10年的大數據從業經驗。


黃為偉,筆名偉仔,資深數據產品經理,金融學碩士,理學學士,公眾號“一個數據人的自留地”的聯合創辦人。先後就職於清科集團、交通銀行、小米、字節跳動,在私募、銀行、信貸、財務領域從事過數據分析和數據產品的相關工作,經驗豐富。


陳勃,筆名薄荷點點,某互聯網“大廠”的高級數據產品經理,公眾號“一個數據人的自留地”的作者。先後就職於dangdang網、北京中交興路信息科技有限公司、JD物流集團,曾負責貨運大數據平台、無人倉倉儲大腦等數據產品,北京市科協金橋工程種子資金項目負責人。

目錄大綱

第1 章 那些困擾我們的數據問題

數據中台篇
第2 章 元數據中心
2.1 元數據中心概述
2.2 元數據中心的核心功能
2.2.1 數據整合
2.2.2 數據管理
2.2.3 數據地圖

第3 章 數據指標中心
3.1 數據指標中心概述
3.2 數據指標中心的設計思路
3.2.1 定義指標並將其歸集到對應的主題域
3.2.2 拆分原子指標與派生指標
3.2.3 定義原子指標與派生指標的生產邏輯
3.2.4 通過指標管理平台對指標進行規範生產

第4 章 數倉模型中心
4.1 數倉模型中心概述
4.2 數倉模型中心的設計思路
4.2.1 控制數據源
4.2.2 劃分主題域
4.2.3 構建一致性維度
4.2.4 構建總線矩陣
4.2.5 數倉分層建設
4.2.6 數倉效果評估

第5 章 數據資產中心
5.1 數據資產中心概述
5.2 數據資產中心的治理流程
5.2.1 數據資產定級
5.2.2 數據資產質量治理
5.2.3 數據資產成本治理

第6 章 數據服務中心
6.1 數據服務中心概述
6.2 數據服務中心的設計思路
6.2.1 將數據寫入查詢庫
6.2.2 搭建元數據模型
6.2.3 按主題歸類
6.2.4 緩存優化
6.2.5 數據接口化
6.2.6 構建API 集市
6.2.7 統一數據服務

數據分析篇
第7 章 數據分析理論
7.1 業務和數據
7.2 數據分析師的全貌
7.3 數據分析團隊的組織架構及其對應的工作模式
7.4 數據分析師的工作方式
7.4.1 工作象限圖
7.4.2 1+N 的工作內容
7.4.3 與業務方的合作模式
7.4.4 有關工作方式常見問題的解法思考

第8 章 數據分析實操
8.1 預測性分析
8.1.1 預測性分析的目的
8.1.2 分析思路與方法
8.1.3 預測性分析案例
8.2 描述性分析
8.3 診斷性分析
8.4 數據分析報告

數據應用篇
第9 章 BI 系統
9.1 讓人頭疼的看板需求
9.2 BI 系統介紹
9.3 BI 系統的關鍵技術
9.4 BI 系統實踐
9.4.1 數據接入
9.4.2 數據集加工
9.4.3 數據集權限控制
9.4.4 可視化報表配置
9.4.5 可視化結果展示
9.4.6 數據分析OLAP
9.4.7 如何衡量BI 系統是否成功

第10 章 用戶畫像
10.1 用戶畫像的全貌
10.2 用戶畫像的需求
10.3 用戶畫像的規劃
10.3.1 用戶畫像的業務架構
10.3.2 用戶畫像的產品架構
10.3.3 用戶畫像的版本計劃
10.3.4 用戶畫像的項目執行計劃
10.4 用戶ID 體系
10.5 標籤體系
10.6 用戶畫像系統
10.7 用戶畫像的應用

第11 章 電商反作弊體系
11.1 電商黑產的現狀
11.2 電商黑產的防控方案
11.2.1 活動的損失評估
11.2.2 反電商黑產作弊案例

第12 章 資訊個性化推薦
12.1 資訊的內容處理
12.1.1 資訊的內容來源
12.1.2 資訊的分類體系
12.1.3 常見的分類問題及內容分類原則
12.1.4 分類體系的構建
12.1.5 內容的標註與機器學習
12.2 資訊用戶的畫像和特徵
12.2.1 資訊用戶的畫像
12.2.2 資訊用戶的特徵
12.3 資訊的推薦算法
12.3.1 資訊的信息抽取
12.3.2 資訊的分詞方法
12.3.3 資訊的過濾排重
12.3.4 資訊的召回模型
12.3.5 資訊的算法排序
12.4 資訊的重排策略及案例
12.4.1 常見的重排策略及策略的目標
12.4.2 資訊的重排策略案例

第13 章 電商個性化推送
13.1 push 的衡量
13.1.1 push 的目標與本質
13.1.2 push 的衡量指標
13.2 push 的優化方向
13.3 push 的推薦案例
13.3.1 新用戶推薦方案
13.3.2 推薦的效果評測