人工智能時代的數據體系

宗東東、龔雪菲、孫踐偉

  • 出版商: 清華大學
  • 出版日期: 2025-07-01
  • 售價: $408
  • 語言: 簡體中文
  • ISBN: 7302694249
  • ISBN-13: 9787302694243
  • 相關分類: 人工智慧Data Science
  • 下單後立即進貨 (約4週~6週)

  • 人工智能時代的數據體系-preview-1
  • 人工智能時代的數據體系-preview-2
  • 人工智能時代的數據體系-preview-3
人工智能時代的數據體系-preview-1

相關主題

商品描述

"人類已進入到智能時代,多模態數據成為大數據的主體,非結構化數據在大數據中的體量急速增長,數據的內涵也正在回歸到大數據的原始定義。然而,當前企業級數據體系仍然以處理企業內占比很小的結構化數據為主,無法對企業的數據資產進行統一管理和深度價值挖掘。構建能夠貫通全形態數據、覆蓋全業務流程的數據體系,是當前時代大數據領域和企業數據體系面臨的重要且緊迫的任務。 本書提出了以語義為思想、以文本為基礎數據,應用大模型的數據解析和分析推理能力來重構企業級數據體系的方案;同時本書介紹了融合全形態數據後,在當前新的商業場景下,企業如何在營銷和運營中使用數據並賦能業務,以及如何推動企業數智化轉型。 "

作者簡介

宗東東,Teradata(中國)技術專家 2003~2010京東 後臺數據部 總監 2011 ~2012唯品會 大數據部 部門負責人 2012~2014叮當快藥 COO 兼CTO 2014 ~2015蜜芽寶貝 CTO 2015~2016樂視集團 集團數據副總裁 2016~2018藍曠科技 CEO 2018 ~ 今

目錄大綱

目錄

第一篇智能時代的數據內涵與體系困局

第1章未來已來,數據之變// 003

11非結構化的數據洪潮// 003

12AIGC?不,是AIGD!// 004

13新商業場景下,非結構數據價值突顯// 004

14數據資產入表,數據直接產生價值// 006

第2章進一步認識非結構化數據// 008

21大數據的多視角定義// 008

22剖析非結構化數據的特性// 011

23當前商業環境中兩種重要的非結構化數據// 013

24語言文字: 普遍而特殊的非結構化數據// 015

第3章數據體系的演進與存在的問題// 017

31數據的價值演進// 017

32數據的發展及貢獻// 020

33當前體系之困: 數據體系的缺陷// 026

34當前數據之痛: 數據域不完整// 028

第二篇數智平臺的理論與規劃

第4章打開非結構化黑盒,釋放數據價值// 033

41構建數智平臺是時代的使命// 033

42釋放非結構化數據價值是首要任務// 034

43使用大模型打開結構黑盒// 035

44基於大模型的解讀式數據處理// 038

45大模型解讀數據原理// 039

46智造數據,資產落地// 042

第5章基於語義,非結構化數據轉譯為文本數據// 045

51數據的價值在語義中// 045

52結構化數據也是一種文本數據// 048

53從數據的角度看文本歸一化// 048

54語言即世界,語言即數據// 050

55語義理論在數智平臺中的應用// 052

56人機融匯於語義,數智從語義出發// 055

第6章數智平臺體系的規劃原則// 057

61討論Bill Inmon的數據架構// 057

62數智平臺的設計與規劃// 059

63數智平臺構建方法論// 060

64對智能技術落地企業的現實性考慮// 063

65體系規劃中的技術問題// 064

第三篇數智平臺的設計與構建

第7章構建數智平臺: 全域全形態的數據體系// 071

71系統架構:縱向分層、橫向分池// 071

72“雙輪驅動”的平臺理念// 075

73“雙輪驅動”下的基礎數據層// 077

74建立數據連接,貫通全域數據// 078

75結構化數據的數據模型// 079

76數智平臺的數據視圖// 080

77直播帶貨場景的邏輯數據視圖// 084

78內容運營場景的邏輯數據視圖// 087

79數智平臺落地實例// 089

第8章構建數智平臺: 雙流協同的數據流處理// 092

81生成式ETL// 092

82“雙流協同”的數據流框架// 093

83GTL1: 非結構數據的語義化// 096

84GTL1: 主題分離提取// 098

85GTL2: 數據聚合入庫// 099

86GTL2: 數據規範化// 100

87GTL2: 數據富化// 102

88GTL3: 面向應用開發// 104

89GTL4: 文本數據結構化// 104

810開發和管理復雜的數據流任務// 106

第9章構建數智平臺: 智能時代大數據平臺的技術棧// 110

91技術棧總體介紹// 110

92大數據平臺技術// 111

93文本數據的組織與存儲技術// 116

94大模型及相關智能技術// 119

95精煉提示語,提升大模型的分析能力// 123

96其他文本分析處理技術// 127

97生成式開發技術// 131

98數據可視化開發// 134

99智能分析決策// 134

第10章構建數智平臺: 全形態數據體系的數據治理// 136

101數據治理的資產管理理念// 136

102數智平臺數據治理的復雜性// 138

103元數據管理// 140

104數據血緣關系// 141

105數據質量管理// 144

106數據標準管理// 147

第11章企業大模型落地方法論// 151

111大模型的部署方式// 151

112大模型的私有化方式// 154

113大模型落地的實踐參考// 156

114設計靈活擴展的架構// 160

115大模型能力管控原則// 161

116規劃大模型落地場景// 161

第四篇數智平臺與企業數智化

第12章數智平臺與數智化營銷// 167

121營銷理論的發展與基本商業結構// 167

122數據視角下的經典營銷模型// 170

123“人貨場”數據模型: CPC// 174

124數據視角下的新商業場景// 176

125新商業場景營銷模型: SPCC// 184

第13章數智平臺與數智化運營// 188

131奠定新商業場景數據運營的基礎// 188

132提升內容運營互動能力// 199

133賦能直播與實時互動// 205

134提高新場景的銷售轉化率// 208

第14章數智平臺與企業數智化// 214

141智能時代的數智變革// 214

142從數字化轉型到數智化轉型// 217

143數智化轉型營運先行// 220

144案例: 如何高效率推動數智項目// 222

參考文獻// 224

後記// 225