敏捷數據工程項目開發:高效機器學習團隊管理 Agile Machine Learning: Effective Machine Learning Inspired by the Agile Manifesto

Eric Carter,Matthew Hurst

買這商品的人也買了...

商品描述

本書通過示例向你展示如何通過敏捷過程交付良好的數據產品,
以及如何組織和管理快節奏的團隊,在生產環境中解決大規模的新數據問題。
它將為你提供組織工作的方法,如何為數據設置可交付成果,如何在看似永無止境的任務中管理時間,
如何理解數據,以及如何增加團隊的透明度。
書中所有的例子都來自真實的團隊、真實的會議和真實的數據。

作者簡介

埃里克·卡特(Eric Carter),在微軟的Bing搜索引擎和Cortana團隊任職工程經理,主要負責團隊產品、評論、業務列表、電子郵件和日曆的搜索功能研發,他當前致力於微軟的白板產品的開發。
  

馬修·赫斯特(Matthew Hurst),在微軟的機器培訓組任職首席工程經理和應用科學家,他曾任職於微軟的許多團隊,比如Bing文檔理解團隊、本地搜索團隊以及各種創新團隊。

目錄大綱

前言
關於作者
關於技術審查人
第1章 儘早交付1
1.1 入門3
1.2 用於規劃的數據分析 7
1.3 創造價值9
1.4 從儘早交付到持續交付11
1.4.1 更多實體 12
1.4.2 更多屬性 13
1.4.3 更多市場 15
1.4.4 更高的質量 15
1.4.5 平台即產品:更多垂直商業和客戶 16
1.5 儘早且持續交付價值16
1.6 結論 20

第2章 需求變化21
2.1 為變化而構建 22
2.1.1 為變化而構建度量 22
2.1.2 為變化而構建管道 24
2.1.3 為變化而構建模型 27
2.1.4 為變化而構建架構 35
2.2 為變化而構建測試和監控 37
2.2.1 監控增量變化:數據DRI37
2.2.2 哨兵實體 38
2.2.3 日常判斷指標 39
2.2.4 測試特徵40
2.2.5 測試學習後的模型 41
2.2.6 帶標籤的訓練數據 41
2.3 響應客戶DSAT43
2.3.1 確定DSAT的類別44
2.3.2 定期自我評估:數據滾動和質量審查46
2.3.3 度量競爭對手48
2.4 結論50

第3章 持續交付51
3.1 驗證代碼更改52
3.2 持續集成系統53
3.3 持續部署系統54
3.4 驗證數據更改56
3.5 持續部署數據58
3.6 決定發布什麼59
3.7 結論60

第4章 與業務人員保持一致61
4.1 日常的重要性61
4.2 集中辦公的優勢64
4.3 業務驅動的Scrum團隊65
4.4 與業務人員合作了解數據68
4.5 幫助業務人員了解機器學習的局限性69
4.6 與業務人員溝通工程的節奏:我們如何做Scrum71
4.6.1 Scrum團隊72
4.6.2 組合和產品待辦事項72
4.6.3 用戶故事75
4.6.4 任務77
4.6.5 衝刺82
4.6.6 通過郵件與業務人員溝通Scrum狀態89
4.7 結論93

第5章 激發個體94
5.1 頻繁重寫95
5.2 發現和培養激發個體96
5.2.1 面試與招聘98
5.2.2 激發個體的職業生涯管理103
5.3 為激發個體創造一個生產力環境106
5.3.1 內外循環106
5.3.2 尋找工具、監控和編制文檔107
5.3.3 開發人員NSAT109
5.4 支持組織外部的激發個體110
5.5 結論111

第6章 有效溝通112
6.1 圍繞數據的討論必須是交互式的118
6.2 數據工具基礎119
6.2.1 數據討論工具的要求119
6.2.2 進行快速評估120
6.2.3 實例挖掘122
6.2.4 抽樣策略122
6.2.5 迭代差分124
6.3 數據可視化124
6.4 召開有效的會議是一種技能126
6.5 結對和並行標記127
6.6 數據滾動128
6.7 演示會議130
6.8 結論133

第7章 監控134
7.1 監控工作軟件135
7.1.1 示例係統:離開時間135
7.1.2 基於活動的監控136
7.1.3 用於分析跟踪的Azure數據資源管理器139
7.2 監控可以告訴你什麼141
7.2.1 工作軟件是否真的可工作141
7.2.2 什麼地方出現了問題141
7.2.3 有多快142
7.2.4 業務目標是否真的達成143
7.2.5 是否真正滿足了客戶需求144
7.2.6 數據和模型如何使用145
7.3 結論146

第8章 可持續開發147
8.1 我們是否在正確的可持續節奏上148
8.1.1 放慢節奏149
8.1.2 加快節奏150
8.2 調整節奏的重要性151
8.3 可持續節奏與實時網站153
8.4 可持續節奏與多個開發地域155
8.5 結論155

第9章 技術卓越157
9.1 敏捷軟件工程實踐158
9.2 數據項目的技術卓越162
9.2.1 度量自身162
9.2.2 建立指標時開發模型165
9.2.3 為推理系統編寫測試166
9.2.4 自定義標註工具168
9.2.5 存儲和版本化訓練與評估數據169
9.2.6 管理模型170
9.3 數據項目的良好設計171
9.3.1 數據模型中的表示和標識173
9.3.2 表示不確定175
9.3.3 代表輸入176
9.4 結論177

第10章 簡潔178
10.1 勤於完成任務描述179
10.1.1 不明確的工作179
10.1.2 致命的連詞181
10.1.3 跨任務的依賴關係和假設181
10.2 儘早集成183
10.3 基線和啟發式方法183
10.4 認識到限制184
10.5 管理HiPPO185
10.6 快速失敗186
10.7 構建、購買或使用開源187
10.8 結論189

第11章 自組織團隊190
11.1 團隊組成191
11.2 團隊由個體組成192
11.3 鼓勵團隊的個體特性194
11.4 跨多個自組織團隊的管理196
11.5 被授權的團隊可以推動團隊發展和產品演進197
11.6 好事如何出現198
11.7 培養自組織團隊199
11.8 工程原理與概念完整性200
11.9 結論201

第12章 調整202
12.1 回顧202
12.2 五個為什麼204
12.3 調整指標205
12.4 展望未來206
12.5 結論207

第13章 總結208