DataOps 實踐手冊 : 敏捷精益的數據運營 Practical Dataops : Delivering Agile Data Science at Scale

HarvinderAtwal 譯馬歡等

買這商品的人也買了...

商品描述

數據運營是指通過數據來分析和解決問題,
利用各種數據科學技術挖掘數據價值,幫助企業優化業務管理和提升決策效率。
隨著我國數字化轉型的深入,傳統基於項目、人工處理的各類數據運營活動已經無法滿足業務發展要求。
集合了敏捷開發、精益製造以及DevOps理念的DataOps因此順勢而生,並且受到了業界的廣泛關注。

本書總結了作者25年的行業經驗和對DataOps的認知,從當前數據科學交付面臨哪些挑戰、什麼是DataOps、
通過哪些手段可以建立對數據的信任,以及如何實現DataOps目標和成功實施DataOps幾個方面進行了系統的闡述。

本書適合參與數字化轉型的各類角色人員學習,
尤其有助於數據科學高級管理崗位的專業人士開拓視野、提升領導力。

作者簡介

馬歡
本科畢業於同濟大學,後獲得上海交通大學工學碩士學位。
從開發工程師做起,擔任過系統分析師、系統架構師、項目經理等角色。
具有20多年的信息系統開發設計經驗,曾經兩次獲得部級科技發展獎項。
主持翻譯了《DAMA-DMBOK數據管理知識體係指南》系列等專業書籍,
作為骨幹編委參與編寫《國際數據之都——上海城市數字化轉型市民手冊》,
此外還翻譯了《首席數據官管理手冊:建立並運行組織的數據供應鏈》《區塊鏈重構規則》《數據與現實》《星型模型》等多本譯著。
2011年首次把數據管理專業認證CDMP引入中國,
並獲得CDMP大師級認證,主理的“DAMA數據管理”是國內最活躍的專業社區之一。

目錄大綱

譯者序
前言
第1部分入門
第1章數據科學中的問題
   有問題嗎?
        現實
        數據價值
        技術、軟件和算法
        數據科學家
        數據科學過程
        組織文化
   知識鴻溝
        數據科學家的知識鴻溝
        IT知識鴻溝
        技術知識鴻溝
        領導力知識鴻溝
        數據素養鴻溝
        缺乏支持
        教育和文化
        不明確的目標
        留給數據科學家來弄清楚
   總結
   尾註
 
第2章數據戰略
   我們為什麼需要新的數據戰略
        數據已不再屬於IT
        數據戰略的範圍
        戰略時間跨度
        戰略發起人
        從識別現狀開始
        組織方面
        人員方面
        技術方面
        流程方面
        數據資產方面
   識別分析用例
        使命、願景和KPI
        構思——我們能做些什麼?
   數據生命週期的基準能力
        差距分析——需要改變什麼?
        定義數據戰略目標——我們需要
        從哪裡開始?
   交付數據戰略
        定義數據戰略舉措——我們如何
        實現目標?
        制定執行和度量計劃——如何
        知道進度?
   總結
   尾註
 
第2部分邁向數據運營
第3章精益思維
   精益思維簡介
        豐田的起源
        精益軟件開發
        精益產品開發
   精益思維和數據分析
        識別浪費
        價值流圖
        快速交付
        拉動式系統
        看到整體
        根因分析
   總結
   尾註
 
第4章敏捷協作
   為什麼選擇敏捷?
        瀑布式項目管理
        敏捷價值觀
   敏捷框架
        Scrum
        XP及Scrum/XP 混合
        看板方法
        Scrumban
   大規模敏捷
        SoS
        規范敏捷交付
        規模化敏捷框架
   DataOps的敏捷
        DataOps宣言
        DataOps原則
        數據科學生命週期
   敏捷DataOps 實踐
        構思
        準備
        研發
        過渡/生產
   總結
   尾註
 
第5章構建反饋和度量
   系統思維
        持續改進
        反饋循環
   團隊健康
        回顧
        健康檢查
        海星回顧
        帆船回顧
        事前檢驗
   服務交付
        服務交付審查會議
        改進服務交付
   產品健康
        數據產品監控的KPI
        監控
        概念漂移
   產品效益
        效益度量
        效益度量的挑戰
        A/B測試和度量的替代方案
        指標的挑戰
   總結
   尾註
      
第3部分進一步措施
第6章建立信任
   信任擁有數據和系統的人
        訪問和供應數據
        數據安全和隱私
        資源利用率監控
   人們可以信任數據
        元數據
        加標籤
        採集過程中的信任
        數據質量評估
        數據清理
        數據血緣
        數據發現
        數據治理
   總結
   尾註
 
第7章面向DataOps 的DevOps
   開發和運營
        衝突
        打破螺旋
   持續交付的快速流程
        可重現的環境
        部署管道
        持續集成
        自動化測試
   部署和發布流程
        自動部署
        發布流程
        DevOps 度量
        審核流程
   數據分析的DevOps
        數據衝突
        數據管道環境
        數據管道編排
        數據管道持續集成
        簡化和重用
   MLOps 和AIOps
        機器學習模型開發
        機器學習模型投產
   總結
   尾註
 
第8章DataOps 組織
   團隊結構
        面向職能的團隊
        面向領域的團隊
        新技能矩陣
        核心角色
        支持角色
        團隊不需要“I型人”
   優化團隊
        溝通渠道和團隊規模
        產品型而非項目型
        辦公位置
   匯報關係
        數據平台管理
        跨職能角色
   總結
   尾註
 
第4部分自服務組織
第9章DataOps 技術
   基於DataOps的價值和原則選擇
        工具
        調整脊椎模型
        對實踐和工具的影響
   DataOps技術生態系統
        流水線
        數據集成
        數據準備
        流處理
        數據管理
        可重複性、部署、編排和監控
        計算基礎設施和查詢執行引擎
        數據存儲
        DataOps平台
        數據分析工具
        挑戰
   建造vs購買
        擴展
        內部構建
        購買或租賃現成產品
        借用開源軟件
        擴建、構建、購買、出租或借用
        雲原生架構
   不斷發展的技術棧
        Wardley地圖
        使用Wardley地圖
        技術雷達
   總結
   尾註
 
第10章DataOps工廠
   第一步
        從數據戰略開始
        領導力
   最小可行的DataOps
        第一個方案
        度量
        第一個DataOps團隊
   跨團隊擴展
        達到臨界點
        團隊協調
        文化
        數據治理
   擴展
        成功的組織
        集中化平台
        全局自動化
        提供自助服務
   總結
  尾註