知識圖譜:概念與技術

肖仰華 等

買這商品的人也買了...

商品描述

知識圖譜是一種大規模語義網絡,已經成為大資料時代知識工程的代表性進展。知識圖譜技術是實現機器認知智慧和推動各行業智慧化發展的關鍵基礎技術。知識圖譜也成為大規模知識工程的代表性實踐,其學科日益完善。
本書是一本系統介紹知識圖譜概念、技術與實踐的書籍。全書共五篇,由16章構成,力求涵蓋知識圖譜相關的基本概念與關鍵技術。“基礎篇”介紹知識圖譜的基本概念、內涵與外延、歷史沿革、應用價值,以及相關的基礎知識。“構建篇”重點介紹大規模高品質知識圖譜的自動化構建技術,涵蓋詞彙挖掘、實體識別、關係抽取及概念圖譜構建、百科圖譜構建、眾包構建與品質控制等專題。“管理篇”系統地闡述了知識圖譜建模與存儲、查詢與檢索,以及圖資料管理系統。“應用篇”對於基於知識圖譜的關鍵應用技術展開介紹,包括搜索與推薦、自然語言問答,以及基於知識圖譜的自然語言理解。“實踐篇”介紹知識圖譜實踐中的基本原則和有用實踐,初步討論了知識圖譜實踐中的開放性問題。
本書可作為高年級本科生、碩士生或者博士生的教材,也適合企業與行業智慧化的從業人員閱讀。

目錄大綱

第1篇 基礎篇
1 知識圖譜概述 2
1.1 知識圖譜的基本概念 2
1.1.1 知識圖譜的狹義概念 3
1.1.2 知識圖譜的廣義概念 8
1.2 知識圖譜的歷史沿革 10
1.2.1 知識圖譜溯源 10
1.2.2 大資料知識工程 13
1.3 知識圖譜的研究意義 16
1.3.1 知識圖譜是認知智慧的基石 16
1.3.2 知識引導成為解決問題的重要方式之一 19
1.4 知識圖譜的應用價值 20
1.4.1 資料分析 20
1.4.2 智慧搜索 21
1.4.3 智能推薦 22
1.4.4 自然人機交互 23
1.4.5 決策支援 23
1.5 知識圖譜的分類 24
1.5.1 知識圖譜中的知識分類 25
1.5.2 知識圖譜的領域特性 26
1.5.3 知識圖譜的分類 30
本章小結 38
思考題 39
參考文獻 39
2 基礎知識 43
2.1 概述 43
2.2 知識表示 45
2.2.1 基本概念 45
2.2.2 知識圖譜的圖表示 47
2.2.3 知識圖譜的數值表示 49
2.2.4 其他相關知識表示 54
2.3 機器學習 65
2.3.1 機器學習的基本概念 65
2.3.2 深度學習概述 67
2.3.3 卷積神經網路 70
2.3.4 迴圈神經網路 71
2.3.5 注意力機制 72
2.4 自然語言處理 73
2.4.1 基本概念 74
2.4.2 文本的向量化表示 76
本章小結 78
思考題 79
參考文獻 80
第2篇 構建篇
3 詞彙挖掘與實體識別 84
3.1 概述 84
3.2 領域短語挖掘 86
3.2.1 問題描述 87
3.2.2 領域短語挖掘方法 88
3.2.3 統計指標特徵 91
3.3 同義詞挖掘 95
3.3.1 概述 95
3.3.2 典型方法 96
3.4 縮略詞抽取 101
3.4.1 縮略詞的概念與形式 101
3.4.2 縮略詞的檢測及抽取 103
3.4.3 縮略詞的預測 105
3.5 實體識別 109
3.5.1 概述 109
3.5.2 傳統的NER方法 110
3.5.3 基於深度學習的NER方法 114
3.5.4 近期的一些方法 120
本章小結 121
思考題 122
參考文獻 122
4 關係抽取 127
4.1 概述 127
4.1.1 關係抽取的問題和方法分類 128
4.1.2 關係抽取常用資料集 130
4.1.3 關係抽取評估方法 131
4.2 基於模式的抽取 133
4.2.1 基於字元模式的抽取 133
4.2.2 基於語法模式的抽取 134
4.2.3 基於語義模式的抽取 135
4.2.4 自動化模式獲取:自舉法(Bootstrapping) 136
4.2.5 基於模式抽取的品質評估 138
4.3 基於學習的抽取 139
4.3.1 基於監督學習的關係抽取 140
4.3.2 基於遠端監督學習的關係抽取 142
4.3.3 基於深度學習的關係抽取 144
4.4 開放關係抽取 149
4.4.1 TextRunner 150
4.4.2 ReVerb 152
4.4.3 Ollie 153
本章小結 154
思考題 156
參考文獻 156
5 概念圖譜構建 160
5.1 概述 160
5.1.1 常見的概念圖譜 163
5.1.2 概念圖譜的應用 166
5.2 isA關係抽取 168
5.2.1 基於線上百科的方法 169
5.2.2 基於模式的方法 170
5.2.3 中文概念圖譜的構建 172
5.3 isA關係補全 175
5.3.1 isA關係缺失的成因 176
5.3.2 基於isA傳遞性的概念圖譜補全 177
5.3.3 基於協同過濾思想的概念圖譜補全 179
5.4 isA關係糾錯 182
5.4.1 錯誤的成因 182
5.4.2 基於支援度的糾錯 183
5.4.3 基於圖模型的糾錯 184
本章小結 186
思考題 186
參考文獻 187
6 百科圖譜構建 190
6.1 百科圖譜概述 190
6.1.1 什麼是百科圖譜 190
6.1.2 百科圖譜的意義 191
6.1.3 百科圖譜的分類 192
6.2 基於單源的百科圖譜構建 193
6.2.1 資料獲取 194
6.2.2 屬性抽取 196
6.2.3 關係構建 201
6.2.4 概念層級體系構建 202
6.2.5 實體分類 202
6.3 基於多源的百科圖譜融合 208
6.3.1 基於多個知識圖譜的融合方法 209
6.3.2 基於多源異構資料的融合方法 216
本章小結 217
思考題 218
參考文獻 219
7 知識圖譜的眾包構建 223
7.1 概述 223
7.2 知識型眾包的基本概念 225
7.3 知識型眾包研究的問題 228
7.3.1 What(對什麼任務進行眾包) 228
7.3.2 Whom(將務交予誰完成) 231
7.3.3 How(如何完成眾包) 232
7.4 基於眾包的知識圖譜構建與精化 237
7.4.1 本體構建階段的人工介入 238
7.4.2 知識圖譜構建階段的人工介入 240
7.4.3 知識圖譜精化階段的人工介入 245
本章小結 247
思考題 248
參考文獻 248

8 知識圖譜的品質控制 253
8.1 概述 254
8.1.1 知識圖譜品質評估的維度 254
8.1.2 知識圖譜品質評估的方法 256
8.1.3 知識圖譜品質控制全週期概覽 257
8.2 缺失知識的發現與補全 263
8.2.1 類型補全 263
8.2.2 實關係補全 266
8.2.3 屬性值補全 271
8.3 錯誤知識的發現與糾正 273
8.3.1 錯誤類型檢測 273
8.3.2 錯誤關係檢測 274
8.3.3 錯誤屬性值檢測 275
84 過期知識的更新 276
8.4.1 基於更新頻率預測的更新機制 277
8.4.2 基於時間標籤的更新機制 279
8.4.3 基於熱點事件發現的更新機制 280
本章小結 281
思考題 282
參考文獻 283
第3篇 管理篇
9 知識圖譜的建模與存儲 288
9.1 概述 288
9.2 知識圖譜的資料模型 289
9.2.1 知識圖譜的三元組模型 290
9.2.2 知識圖譜的圖模型 293
9.3 知識圖譜的物理存儲 298
9.3.1 知識圖譜資料的基本操作 298
9.3.2 知識圖譜的關係表存儲 300
9.3.3 知識圖譜的圖存儲 304
9.3.4 分散式運算環境下的知識圖譜資料存儲 307
本章小結 311
思考題 312
參考文獻 312
10 知識圖譜查詢與檢索 316
10.1 概述 316
10.2 查詢語言:SPARQL 317
10.2.1 簡單查詢 317
10.2.2 SPARQL查詢機制及知識圖譜上的推理 323
10.3 子圖查詢 326
10.3.1 子圖查詢 326
10.3.2 近似子圖查詢 328
10.3.3 Top-k查詢 333
10.3.4 索引結構 336
10.4 其他查詢 337
10.4.1 路徑查詢 337
10.4.2 關鍵字查詢 340
10.4.3 社團搜索 341
本章小結 345
思考題 345
參考文獻 346
11 圖資料管理系統 349
11.1 知識圖譜與圖管理系統 350
11.1.1 大圖管理的挑戰 352
11.1.2 圖管理系統的重要性 354
11.1.3 圖管理系統管理知識圖譜的挑戰 356
11.2 圖管理系統的基本架構和設計原則 359
11.3 典型的圖管理系統 362
11.3.1 通用圖管理系統 362
11.3.2 知識圖譜專用圖管理系統 365
11.3.3 圖管理系統使用實例 368
本章小結 371
思考題 373
參考文獻 373
第4篇 應用篇
12 基於知識圖譜的語言認知 376
12.1 概述 377
12.1.1 語言理解的挑戰 377
12.1.2 語言理解需要知識圖譜 378
12.1.3 語言理解的任務 379
12.2 實體理解 380
12.2.1 基本模型 381
12.2.2 局部實體連結分數 382
12.2.3 全域實體連結分數 383
12.2.4 模型計算 384
12.2.5 短文本實體連結 390
12.2.6 跨語言實體連結 391
12.3 概念理解 393
12.3.1 單實例概念理解 393
12.3.2 多實例概念理解 395
12.3.3 短語概念理解 397
12.3.4 關係對的概念理解 399
12.3.5 概念理解應用舉例 400
12.4 屬性理解 401
本章小結 403
思考題 404
參考文獻 405
13 基於知識圖譜的搜索與推薦 408
13.1 概述 408
13.2 基於知識圖譜的搜索 411
13.2.1 搜索概述 411
13.2.2 意圖理解 414
13.2.3 目標查找 416
13.2.4 結果呈現 416
13.2.5 實體探索 417
13.3 基於知識圖譜的推薦 422
13.3.1 推薦的基本問題與挑戰 422
13.3.2 基於知識圖譜的物品畫像 425
13.3.3 基於知識圖譜的用戶畫像 430
13.3.4 基於知識圖譜的跨領域推薦 432
13.3.5 基於知識圖譜的可解釋推薦 435
本章小結 436
思考題 437
參考文獻 438
14 基於知識圖譜的問答 441
14.1 概述 441
14.1.1 問答系統 441
14.1.2 KBQA 444
14.2 基於範本的KBQA 452
14.2.1 基於範本的意圖識別 452
14.2.2 基於範本的屬性關聯 454
14.3 基於圖模型的KBQA 455
14.3.1 監督學習 456
14.3.2 無監督方法 457
14.4 基於深度學習的KBQA 460
14.4.1 表示學習 460
14.4.2 分類模型 462
14.4.3 生成模型 464
本章小結 465
思考題 466
參考文獻 467
第5篇 實踐篇
15 知識圖譜實踐 472
15.1 概述 472
15.1.1 知識圖譜應用的推動力 473
15.1.2 知識圖譜應用與產業現狀 475
15.1.3 知識圖譜實踐的系統工程觀念 476
15.1.4 知識圖譜助力行業智慧化的演進路徑 478
15.2 知識圖譜系統 479
15.2.1 知識圖譜系統的外部環境 480
15.2.2 知識圖譜系統的關鍵要素 481
15.2.3 知識圖譜系統的典型架構 483
15.3 知識圖譜工程 489
15.3.1 基本原則 489
15.3.2 過程模型 493
15.3.3 可行性分析 494
15.3.4 知識圖譜工程實踐建議 498
本章小結 502
思考題 502
參考文獻 503
16 開放性問題 504
16.1 知識表示 504
16.1.1 與其他知識表示相聯合的語義增強 505
16.1.2 過程語義增強 505
16.1.3 時空語義增強 506
16.1.4 跨模態語義增強 507
16.2 知識獲取 508
16.2.1 低成本知識獲取 508
16.2.2 複雜知識的獲取 510
16.2.3 知識獲取中的人機協作與評測 511
16.3 知識應用 512
16.3.1 知識圖譜上的推理 512
16.3.2 符號知識增強機器學習 513
16.3.3 基於知識圖譜的可解釋人工智慧 514
16.3.4 知識圖譜的個性化問題 514
本章小結 515
思考題 516
參考文獻 516