DataOps 實踐手冊 : 敏捷精益的數據運營 Practical Dataops : Delivering Agile Data Science at Scale
HarvinderAtwal 譯馬歡等
- 出版商: 機械工業
- 出版日期: 2022-11-01
- 售價: $594
- 貴賓價: 9.5 折 $564
- 語言: 簡體中文
- 頁數: 207
- 裝訂: 平裝
- ISBN: 711171606X
- ISBN-13: 9787111716068
-
相關分類:
Data Science
- 此書翻譯自: Practical Dataops: Delivering Agile Data Science at Scale
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$403Web 與網絡數據科學:建模技術在預測分析中的應用 (Web and network data science: modeling techniques in predictive analytics)
-
$347套路!機器學習:北美數據科學家的私房課
-
$534$507 -
$680$537 -
$505DevSecOps 實戰
-
$636$604 -
$588$559 -
$690$538 -
$455持續測試
-
$352DevOps實施策略:原則、流程、工具和趨勢
-
$600$468 -
$602因果推斷與機器學習
-
$768$730 -
$455Serverless核心技術和大規模實踐
-
$454DevOps 落地與轉型: 提升研發效能的方法與實踐
-
$680$537 -
$626數據分析師典型面試題精講
-
$539$512 -
$356DevOps 原理與實踐
-
$620$484 -
$654$621 -
$780$616 -
$680$530 -
$750$525 -
$650$507
相關主題
商品描述
數據運營是指通過數據來分析和解決問題,
利用各種數據科學技術挖掘數據價值,幫助企業優化業務管理和提升決策效率。
隨著我國數字化轉型的深入,傳統基於項目、人工處理的各類數據運營活動已經無法滿足業務發展要求。
集合了敏捷開發、精益製造以及DevOps理念的DataOps因此順勢而生,並且受到了業界的廣泛關注。
本書總結了作者25年的行業經驗和對DataOps的認知,從當前數據科學交付面臨哪些挑戰、什麼是DataOps、
通過哪些手段可以建立對數據的信任,以及如何實現DataOps目標和成功實施DataOps幾個方面進行了系統的闡述。
本書適合參與數字化轉型的各類角色人員學習,
尤其有助於數據科學高級管理崗位的專業人士開拓視野、提升領導力。
作者簡介
馬歡
本科畢業於同濟大學,後獲得上海交通大學工學碩士學位。
從開發工程師做起,擔任過系統分析師、系統架構師、項目經理等角色。
具有20多年的信息系統開發設計經驗,曾經兩次獲得部級科技發展獎項。
主持翻譯了《DAMA-DMBOK數據管理知識體係指南》系列等專業書籍,
作為骨幹編委參與編寫《國際數據之都——上海城市數字化轉型市民手冊》,
此外還翻譯了《首席數據官管理手冊:建立並運行組織的數據供應鏈》《區塊鏈重構規則》《數據與現實》《星型模型》等多本譯著。
2011年首次把數據管理專業認證CDMP引入中國,
並獲得CDMP大師級認證,主理的“DAMA數據管理”是國內最活躍的專業社區之一。
目錄大綱
譯者序
前言
第1部分入門
第1章數據科學中的問題
有問題嗎?
現實
數據價值
技術、軟件和算法
數據科學家
數據科學過程
組織文化
知識鴻溝
數據科學家的知識鴻溝
IT知識鴻溝
技術知識鴻溝
領導力知識鴻溝
數據素養鴻溝
缺乏支持
教育和文化
不明確的目標
留給數據科學家來弄清楚
總結
尾註
第2章數據戰略
我們為什麼需要新的數據戰略
數據已不再屬於IT
數據戰略的範圍
戰略時間跨度
戰略發起人
從識別現狀開始
組織方面
人員方面
技術方面
流程方面
數據資產方面
識別分析用例
使命、願景和KPI
構思——我們能做些什麼?
數據生命週期的基準能力
差距分析——需要改變什麼?
定義數據戰略目標——我們需要
從哪裡開始?
交付數據戰略
定義數據戰略舉措——我們如何
實現目標?
制定執行和度量計劃——如何
知道進度?
總結
尾註
第2部分邁向數據運營
第3章精益思維
精益思維簡介
豐田的起源
精益軟件開發
精益產品開發
精益思維和數據分析
識別浪費
價值流圖
快速交付
拉動式系統
看到整體
根因分析
總結
尾註
第4章敏捷協作
為什麼選擇敏捷?
瀑布式項目管理
敏捷價值觀
敏捷框架
Scrum
XP及Scrum/XP 混合
看板方法
Scrumban
大規模敏捷
SoS
規范敏捷交付
規模化敏捷框架
DataOps的敏捷
DataOps宣言
DataOps原則
數據科學生命週期
敏捷DataOps 實踐
構思
準備
研發
過渡/生產
總結
尾註
第5章構建反饋和度量
系統思維
持續改進
反饋循環
團隊健康
回顧
健康檢查
海星回顧
帆船回顧
事前檢驗
服務交付
服務交付審查會議
改進服務交付
產品健康
數據產品監控的KPI
監控
概念漂移
產品效益
效益度量
效益度量的挑戰
A/B測試和度量的替代方案
指標的挑戰
總結
尾註
第3部分進一步措施
第6章建立信任
信任擁有數據和系統的人
訪問和供應數據
數據安全和隱私
資源利用率監控
人們可以信任數據
元數據
加標籤
採集過程中的信任
數據質量評估
數據清理
數據血緣
數據發現
數據治理
總結
尾註
第7章面向DataOps 的DevOps
開發和運營
衝突
打破螺旋
持續交付的快速流程
可重現的環境
部署管道
持續集成
自動化測試
部署和發布流程
自動部署
發布流程
DevOps 度量
審核流程
數據分析的DevOps
數據衝突
數據管道環境
數據管道編排
數據管道持續集成
簡化和重用
MLOps 和AIOps
機器學習模型開發
機器學習模型投產
總結
尾註
第8章DataOps 組織
團隊結構
面向職能的團隊
面向領域的團隊
新技能矩陣
核心角色
支持角色
團隊不需要“I型人”
優化團隊
溝通渠道和團隊規模
產品型而非項目型
辦公位置
匯報關係
數據平台管理
跨職能角色
總結
尾註
第4部分自服務組織
第9章DataOps 技術
基於DataOps的價值和原則選擇
工具
調整脊椎模型
對實踐和工具的影響
DataOps技術生態系統
流水線
數據集成
數據準備
流處理
數據管理
可重複性、部署、編排和監控
計算基礎設施和查詢執行引擎
數據存儲
DataOps平台
數據分析工具
挑戰
建造vs購買
擴展
內部構建
購買或租賃現成產品
借用開源軟件
擴建、構建、購買、出租或借用
雲原生架構
不斷發展的技術棧
Wardley地圖
使用Wardley地圖
技術雷達
總結
尾註
第10章DataOps工廠
第一步
從數據戰略開始
領導力
最小可行的DataOps
第一個方案
度量
第一個DataOps團隊
跨團隊擴展
達到臨界點
團隊協調
文化
數據治理
擴展
成功的組織
集中化平台
全局自動化
提供自助服務
總結
尾註