企業級數據與AI項目成功之道 Smarter Data Science: Succeeding with Enterprise-Grade Data and AI Projects

Neal Fishman,Cole Stryker 張虹宇//陳小林

商品描述

大型組織正在競相實施先進的數據科學。
大多數時候,我們的人工智能嘗試變成了走進死胡同的科學項目,
從來沒有提供可持續的商業價值。
我們錯過了什麼?
在本書中,你將發現必須理解和實現的信息架構支柱。
只有當數據分析和人工智能能夠在整個組織內以可預測和一致的方式提供業務洞見時,
它們才能增加價值。
本書概述了一種組織、管理和評估數據的有效且實用的方法,
這樣你就可以建立一個信息架構來更好地推動人工智能和數據科學的發展。

作者簡介

[美]尼爾·菲什曼 (Neal Fishman),[美]科爾·斯特萊克 (Cole Stryker) 著:
尼爾·菲什曼(尼爾·菲什曼)是 IBM 的全球青年工程師,並且是 IBM 業務服務組織內基於數據的學的首席技術官。
尼爾也是Open Group認證的IT架構師。


科爾·斯特萊克(Cole Stryker)是一位常駐洛杉磯的作家和記者。他是史詩般的勝利為 Anymous 和 Hacking the Future 的作者。

目錄大綱

題記
本書讚譽
序言
前言
致謝
關於作者
第1章 攀登人工智能階梯1
1.1 人工智能的數據準備2
1.2 重點技術領域2
1.3 一步一個腳印地攀登階梯3
1.4 不斷適應以保持組織的相關性6
1.5 基於數據的推理在現代業務中至關重要8
1.6 朝著以人工智能為中心的組織邁進11
1.7 本章小結12
第2章 框架部分I:使用人工智能的注意事項14
2.1 數據驅動決策制定15
2.1.1 通過詢問來獲得洞見15
2.1.2 信任矩陣16
2.1.3 衡量標準和人類洞見的重要性18
2.2 使數據與數據科學民主化18
2.3 是的,先決條件:組織數據必須有先見之明20
2.4 促進變革之風:有組織的數據如何縮短反應時間23
2.5 質疑一切24
2.6 本章小結26
第3章 框架部分II:使用數據和人工智能的注意事項27
3.1 個性化每個用戶的數據體驗28
3.2 上下文的影響:選擇正確的數據顯示方式29
3.3 民族志研究:通過專業數據增進理解32
3.4 數據治理和數據質量33
3.4.1 分解數據的價值34
3.4.2 通過數據治理提供結構34
3.4.3 為訓練進行數據策管35
3.4.4 創造價值的其他注意事項35
3.5 本體論:封裝知識的手段36
3.6 人工智能成果的公平、信任和透明度38
3.7 可訪問的、準確的、經過策管的和經過組織的數據41
3.8 本章小結42
第4章 分析回顧:不只是個錘子44
4.1 曾經的情況:回顧企業數據倉庫44
4.2 傳統數據倉庫的缺點49
4.3 範式轉變52
4.4 現代分析環境:數據湖53
4.4.1 兩者對比55
4.4.2 本地數據56
4.4.3 差異屬性56
4.5 數據湖的要素58
4.6 新常態:大數據即普通數據60
4.6.1 從單一數據模型的剛性中解放出來60
4.6.2 流數據61
4.6.3 適合任務的工具61
4.6.4 易訪問性61
4.6.5 降低成本61
4.6.6 可擴展性62
4.6.7 人工智能的數據管理和數據治理62
4.7 Schema-On-Read與Schema-On-Write63
4.8 本章小結65
第5章 分析前瞻:不是所有事物都是釘子67
5.1 組織的需求67
5.1.1 暫存區域69
5.1.2 原始區域70
5.1.3 發現與探索區域71
5.1.4 對齊區域71
5.1.5 協調區域76
5.1.6 策管區域77
5.2 數據拓撲78
5.2.1 區域地圖80
5.2.2 數據管道81
5.2.3 數據地形81
5.3 擴展、添加、移動和刪除區域83
5.4 啟用區域84
5.4.1 攝入84
5.4.2 數據治理86
5.4.3 數據存儲和保留87
5.4.4 數據處理89
5.4.5 數據訪問90
5.4.6 管理和監控91
5.4.7 元數據91
5.5 本章小結92
第6章 人工智能階梯的運營準則93
6.1 時光流逝94
6.2 創建98
6.2.1 穩定性99
6.2.2 障礙99
6.2.3 複雜性99
6.3 執行100
6.3.1 攝入101
6.3.2 可見性102
6.3.3 合規性102
6.4 運行102
6.4.1 質量103
6.4.2 依賴104
6.4.3 可複用性104
6.5 xOps三重奏:DevOps/MLOps、DataOps和AIOps105
6.5.1 DevOps/MLOps105
6.5.2 DataOps107
6.5.3 AIOps109
6.6 本章小結111
第7章 化運用數據:以價值為導向112
7.1 邁向價值鏈113
7.1.1 通過關聯***116
7.1.2 啟用操作117
7.1.3 擴大行動手段118
7.2 策管119
7.3 數據治理121
7.4 集成數據管理123
7.4.1 載入125
7.4.2 組織125
7.4.3 編目126
7.4.4 元數據127
7.4.5 準備128
7.4.6 預配129
7.4.7 多租戶129
7.5 本章小結132
第8章 通過統計分析評估數據並啟用有意義的訪問133
8.1 派生價值:將數據當作資產進行管理133
8.2 數據可訪問性:並非所有用戶都是平等的139
8.3 向數據提供自助服務140
8.4 訪問:添加控件的重要性141
8.5 為了數據治理,使用自底向上的方法對數據集進行排序142
8.6 各行業如何使用數據和人工智能143
8.7 受益於統計數字144
8.8 本章小結151
第9章 長期構建152
9.1 改變習慣的需要:避免硬編碼152
9.1.1 過載153
9.1.2 鎖定154
9.1.3 所有權和分解156
9.1.4 避免變化的設計156
9.2 通過人工智能擴展數據的價值157
9.3 混合持久化159
9.4 受益於數據素養163
9.4.1 理解主題165
9.4.2 技能集165
9.4.3 全部都是元數據167
9.4.4 正確的數據,在正確的上下文
中,使用正確的接口168
9.5 本章小結170
第10章 終章:人工智能的信息架構171
10.1 人工智能開發工作172
10.2 基本要素:基於雲的計算、數據和分析175
10.2.1 交集:計算容量和存儲容量180
10.2.2 分析強度181
10.2.3 跨要素的互操作性183
10.2.4 數據管道飛行路徑:飛行前、飛行中、飛行後186
10.2.5 數據水坑、數據池和數據湖的數據管理187
10.3 驅動行動:上下文、內容和決策者188
10.4 保持簡單190
10.5 筒倉已死,筒倉長存192
10.6 分類:組織數據區域194
10.7 開放平台的功能197
10.8 本章小結200
附錄 縮略語對照表203