工業級知識圖譜:方法與實踐

張偉,陳華鈞,張亦弛

  • 出版商: 電子工業
  • 出版日期: 2021-08-01
  • 定價: $708
  • 售價: 8.5$602
  • 語言: 簡體中文
  • 頁數: 348
  • 裝訂: 平裝
  • ISBN: 7121417472
  • ISBN-13: 9787121417474
  • 相關分類: 人工智慧
  • 立即出貨

買這商品的人也買了...

商品描述

本書源於阿裡巴巴千億級知識圖譜構建與產業化應用的工作總結,對知識圖譜理論和大規模工業實踐進行了全面和深入的闡述。本書以阿裡巴巴的實戰經驗為中心,以深厚的理論成果為支撐,詳細闡述了知識圖譜的方方面面。首先介紹工業場景下知識圖譜的現狀、存在的問題和架構設計;然後從知識表示、知識融合、知識獲取、知識推理、知識存儲和知識圖譜前沿方向等方面入手,介紹大規模商品知識圖譜的構建方法;最後結合阿裡巴巴的業務實踐,詳細介紹知識圖譜的產品設計、技術實現和業務應用細節。通過閱讀本書,讀者不僅可以從零開始認識知識圖譜,瞭解知識圖譜技術方法和前沿技術方向,而且可以熟悉知識圖譜工業實踐的實現路徑,清楚知識圖譜的應用方向和方法。本書介紹的成果獲得錢偉長中文信息處理科學技術一等獎。本書在知識圖譜的廣度和深度上兼具極強的參考性,適合人工智能相關行業的管理者和研發人員、高等院校的電腦專業學生閱讀。

作者簡介

張 偉
博士畢業於新加坡國立大學。
研究方向為知識圖譜(KG)、自然語言處理(NLP)等。
曾任阿里巴巴資深算法專家、新加坡資訊通信研究院NLP應用實驗室主任等職位。
曾擔任NLP會議ACL領域主席,期刊TACL常駐審稿人。兼職復旦大學、蘇州大學碩士生校外導師。主導了阿里巴巴商品知識圖譜的建設。
論文發表在WWW/EMNLP/AAAI/IJCAI/AIJ/CoLing/ICDE/WSDM/IJCNLP/NAACL/CIKM等國際會議和期刊上。
獲得了錢偉長中文信息處理科學技術一等獎,杭州市省級領軍人才等榮譽。


陳華鈞
浙江大學計算機科學與技術學院教授/博導,主要研究方向為知識圖譜、大數據系統、自然語言處理等。
在WWW/IJCAI/AAAI/KR/ACL/EMNLP/KDD/VLDB/ICDE/TKDE/ACM MM/Briefings in Bioinforamtics等國際會議或期刊上發表多篇論文。
曾獲國際語義網會議ISWC2006最佳論文獎、教育部技術發明一等獎、錢偉長中文信息處理科技獎一等獎、阿里巴巴優秀學術合作獎、中國工信傳媒出版集團優秀出版物一等獎等獎勵。
牽頭髮起中文開放知識圖譜OpenKG,中國人工智能學會知識工程專業委員會副主任、中國中文信息學會語言與知識計算專委會副主任,全國知識圖譜大會CCKS2020大會主席,Elsevier Big Data Research Journal Editor in Chief。


張亦弛
畢業於倫敦大學。
工作研究方向為電商領域知識圖譜構建、自然語言處理和多模態技術在知識圖譜的應用等。
曾任阿里巴巴商品知識圖譜算法負責人。
在阿里巴巴知識圖譜藏經閣研究計劃中,聯合團隊與清華大學、浙江大學、中科院軟件所、中科院自動化所和蘇州大學等科研機構協作,構建了千億級商品知識圖譜數據,服務了阿里十多個垂直電商平台和海內外多個國家市場。
學術論文發表在BMVC/EMNLP/WSDM等國內外會議和期刊中。
團隊多次榮獲中國國家編碼中心和中國ECR委員會頒發的創新項目獎、卓越項目獎,中國中文信息學會錢偉長科技獎一等獎等國家機構和學術協會獎項。

目錄大綱

目錄
第1章 工業級知識圖譜概述 / 1
1.1 知識圖譜概述 / 2
1.1.1 通用知識圖譜 / 2
1.1.2 行業知識圖譜 / 3
1.2 工業級知識圖譜實戰原則 / 4
1.2.1 實踐中的典型問題 / 4
1.2.2 實戰原則 / 4
1.3 阿里巴巴知識引擎技術架構 / 8
1.3.1 平台產品:知識建模與管理 / 9
1.3.2 平台產品:知識生產 / 11
1.3.3 業務、平台產品:知識服務 / 16
1.4 本章小結 / 19

第2章 商品知識的表示和建模 / 20
2.1 知識表示簡介 / 21
2.1.1 基於符號邏輯的知識表示方法 / 21
2.1.2 面向互聯網的知識表示方法 / 23
2.1.3 基於連續向量的知識表示 / 25
2.2 行業知識建模 / 27
2.2.1 基於專家的知識建模 / 27
2.2.2 基於機器學習的知識建模 / 29
2.3 商品知識建模實踐 / 32
2.3.1 術語抽取 / 33
2.3.2 商品概念及上下位關係生成 / 36
2.4 構建商品知識體系 / 37
2.4.1 通用域知識圖譜 / 37
2.4.2 阿里商品域知識體系 / 39
2.5 商品知識建模應用場景 / 48
2.5.1 服務國家和社會機構應用 / 48
2.5.2 零售業務應用 / 49
2.6 小結 / 50
2.6.1 知識建模技術的未來發展 / 50
2.6.2 知識體系設計的未來發展 / 51

第3章 商品知識融合 / 53
3.1 知識融合概述 / 54
3.1.1 知識融合的主要難點 / 54
3.1.2 知識融合的基本步驟 / 55
3.2 本體對齊 / 57
3.2.1 基於語言學特徵的方法 / 58
3.2.2 基於結構特徵的方法 / 61
3.2.3 商品知識圖譜本體對齊算法 / 63
3.3 實體對齊 / 70
3.3.1 實體對齊的流程 / 70
3.3.2 實體對齊的技術路線 / 71
3.3.3 商品知識圖譜實體對齊實踐 / 80
3.4 信息融合 / 91
3.4.1 無監督的信息融合方法 / 92
3.4.2 有監督和半監督的信息融合方法 / 99
3.4.3 商品知識圖譜信息融合算法實踐 / 100
3.5 跨語言知識融合 / 103
3.5.1 跨語言知識融合的挑戰 / 103
3.5.2 跨語言實體對齊的技術路線 / 104
3.5.3 基於規則的跨語言實體對齊方法 / 104
3.5.4 基於翻譯的跨語言實體對齊方法 / 105
3.5.5 基於表示學習的跨語言實體對齊方法 / 107
3.6 知識融合質量評估體系 / 110
3.6.1 知識融合評估指標介紹 / 110
3.6.2 離線融合效果評估 / 112
3.6.3 在線融合效果評估 / 117
3.7 本章小結 / 119

第4章 商品知識獲取 / 120
4.1 知識獲取概述 / 121
4.1.1 知識獲取相關任務 / 121
4.1.2 知識獲取相關測評會議 / 123
4.2 命名實體識別 / 125
4.2.1 命名實體識別概覽 / 125
4.2.2 標註體系及常用數據集 / 126
4.2.3 基於規則的命名實體識別 / 128
4.2.4 基於統計模型的命名實體識別 / 128
4.2.5 基於神經網絡的實體識別 / 130
4.3 實體鏈接 / 133
4.3.1 實體鏈接概述 / 133
4.3.2 候選實體生成 / 133
4.3.3 候選實體排序 / 135
4.3.4 端到端的實體鏈接方法 / 138
4.4 關係抽取 / 139
4.4.1 關係抽取概述 / 139
4.4.2 基於模板的關係抽取方法 / 140
4.4.3 基於監督學習的關係抽取方法 / 140
4.4.4 基於半監督學習的關係抽取方法 / 149
4.4.5 基於無監督學習的關係抽取方法 / 154
4.5 槽填充與屬性補全 / 156
4.5.1 槽填充與屬性補全概述 / 156
4.5.2 基於模板的方法 / 158
4.5.3 基於關係分類的方法 / 160
4.6 面向半結構化數據的知識獲取 / 160
4.6.1 百科類網站數據抽取 / 160
4.6.2 面向Web網頁的知識獲取 / 161
4.7 低資源條件下知識獲取 / 162
4.7.1 基於監督學習和弱監督學習的方法 / 163
4.7.2 基於遷移學習的方法 / 163
4.7.3 基於元學習的方法 / 164
4.7.4 基於知識增強的方法 / 165
4.8 電商領域知識獲取實踐 / 166
4.8.1 電商知識獲取框架 / 166
4.8.2 面向場景導購的知識獲取示例 / 169
4.8.3 低資源商品知識獲取示例 / 177
4.9 本章小結 / 180

第5章 商品知識推理 / 182
5.1 知識推理概述 / 183
5.1.1 知識推理的作用 / 183
5.1.2 專家系統與知識推理 / 184
5.1.3 神經網絡與知識推理 / 185
5.2 基於符號邏輯的知識推理 / 186
5.2.1 基於本體的知識推理方法 / 187
5.2.2 基於規則的知識推理方法 / 191
5.2.3 基於規則學習的知識圖譜推理 / 197
5.3 基於表示學習的知識推理 / 200
5.3.1 基於分佈式表示的知識推理 / 200
5.3.2 基於神經網絡的知識推理 / 210
5.4 基於圖數據庫的商品知識推理引擎工程實踐 / 218
5.4.1 技術框架簡介 / 219
5.4.2 與傳統規則推理引擎的對比 / 223
5.5 可解釋的商品知識圖譜推理應用實踐 / 226
5.5.1 電商應用背景 / 226
5.5.2 技術實踐方案 / 228
5.5.3 實驗結果及案例分析 / 233
5.6 基於強化學習的商品規則學習與推理應用實踐 / 236
5.6.1 電商應用背景 / 236
5.6.2 技術實踐方案 / 238
5.6.3 實驗結果及案例分析 / 240
5.7 本章小結 / 241

第6章 知識圖譜的存儲、服務與質量 / 243
6.1 知識圖譜的存儲 / 244
6.1.1 數據模型 / 244
6.1.2 存儲系統選型 / 247
6.1.3 圖查詢語言 / 252
6.1.4 關鍵技術與選擇 / 254
6.2 知識圖譜的服務 / 257
6.2.1 基於知識圖譜的搜索 / 258
6.2.2 基於知識圖譜的推薦 / 264
6.2.3 搜索推薦在業務智能中的應用 / 274
6.2.4 基於知識圖譜的問答系統 / 278
6.3 知識圖譜質量保障 / 281
6.3.1 質量保障架構 / 281
6.3.2 測試原則與方法 / 282
6.4 本章小結 / 284

第7章 大規模商品知識圖譜預訓練 / 285
7.1 知識預訓練概述 / 286
7.1.1 預訓練語言模型 / 286
7.1.2 知識圖譜中的結構化上下文信息 / 288
7.1.3 基於知識增強的預訓練模型 / 289
7.1.4 預訓練知識圖譜模型與預訓練語言模型的區別 / 293
7.2 商品知識圖譜靜態預訓練模型 / 294
7.2.1 預訓練知識圖譜查詢框架 / 294
7.2.2 預訓練知識圖譜查詢模塊 / 295
7.2.3 預訓練知識圖譜查詢服務 / 296
7.2.4 在任務模塊中使用查詢服務 / 297
7.3 商品知識圖譜動態預訓練模型 / 299
7.3.1 上下文模塊和整合模塊 / 299
7.3.2 預訓練階段和微調階段 / 301
7.4 商品知識圖譜預訓練實踐案例 / 303
7.4.1 基於知識圖譜預訓練的商品分類 / 304
7.4.2 基於知識圖譜預訓練的商品對齊 / 309
7.4.3 基於知識圖譜預訓練的商品推薦 / 312
7.4.4 基於商品知識預訓練的實體識別 / 316
7.4.5 基於商品知識預訓練的關係抽取與屬性補齊 / 318
7.4.6 基於商品知識預訓練的標題生成 / 324
7.5 總結與展望 / 325
參考文獻 / 326