知識圖譜:基礎、技術與應用
- 出版商: 人民郵電
- 出版日期: 2025-10-01
- 售價: $900
- 語言: 簡體中文
- 頁數: 354
- ISBN: 7115682631
- ISBN-13: 9787115682635
-
相關分類:
Natural Language Processing
- 此書翻譯自: Knowledge Graphs: Fundamentals, Techniques, and Applications
下單後立即進貨 (約4週~6週)
相關主題
商品描述
知識圖譜以直觀方式呈現實體間的關系,能夠有效整合、表示和挖掘覆雜知識,為信息檢索、智能問答、數據分析等眾多領域提供強大的知識支撐。本書系統講解知識圖譜的完整體系,從基礎到應用層層深入。第一部分介紹基礎知識,內容包括知識圖譜的建模和表示方法。第二部分聚焦知識圖譜構建過程,涵蓋領域發現、命名實體識別、信息提取等技術。第三部分講解知識圖譜補全技術,包括實例匹配、統計關系學習等。第四部分闡述知識圖譜的訪問方式,涉及推理、檢索、結構化查詢及問答。第五部分展現知識圖譜生態系統,介紹關聯數據及知識圖譜在多個領域中的應用。
作者簡介
馬揚克·柯內瓦爾(Mayank Kejriwal)
美國南加州大學工業與系統工程系研究副教授,他擁有計算機科學博士學位,其畢業論文獲2017年語義網科學協會最佳論文獎。他在ISWC、AAAI等頂會/期刊上發表論文40余篇,並入選2019年Forbes 30 Under 30科學榜。
克雷格·A. 諾布洛克(Craig A. Knoblock)
AAAI會士、ACM會士,美國南加州大學信息科學研究所執行所長、知識圖譜研究中心研究主任,卡內基?梅隆大學計算機科學博士,曾任國際人工智能聯合會議(IJCAI)主席及理事,人工智能重要獎項羅伯特·S. 恩格爾莫爾獎得主。
佩德羅·塞凱伊(Pedro Szekely)
亞馬遜首席應用科學家,卡內基?梅隆大學計算機科學博士,曾任職於美國南加州大學信息科學研究所及多個學術會議程序委員會。他在“領域洞察圖譜”方面的研究成果榮獲多項
作者簡介
馬揚克·柯內瓦爾(Mayank Kejriwal)
目錄大綱
第 一部分 知識圖譜基礎知識
第 1章 知識圖譜導論 2
1.1 圖 2
1.2 將知識表示為圖 3
1.3 知識圖譜應用案例 7
1.3.1 案例1:學術出版物和學者 7
1.3.2 案例2:電子商務、產品和公司 8
1.3.3 案例3:社會網絡 8
1.3.4 案例4:地緣政治事件 9
1.4 如何閱讀本書 11
1.5 本章小結 11
1.6 軟件和資源 12
1.7 文獻註釋 12
1.8 習題 14
第 2章 知識圖譜建模與表示 16
2.1 概覽 16
2.1.1 RDF 17
2.1.2 RDF 序列化 20
2.2 RDF 模式 22
2.2.1 RDF 模式的類別 22
2.2.2 RDF 模式的屬性 24
2.3 以屬性為中心的模型 25
2.4 Wikidata 模型 26
2.4.1 Wikidata 數據項 29
2.4.2 Wikidata 屬性 30
2.5 語義網多層蛋糕 32
2.6 模式異質性和語義標記 33
2.7 本章小結 35
2.8 軟件和資源 35
2.9 文獻註釋 36
2.10 習題 38
第二部分 知識圖譜構建
第3章 領域發現 42
3.1 概覽 42
3.2 聚焦抓取 44
3.2.1 設計要素 45
3.2.2 最佳優先爬蟲 47
3.2.3 語義爬蟲 48
3.2.4 學習爬蟲 49
3.2.5 聚焦抓取的性能評估 50
3.3 有影響力的系統和方法 51
3.3.1 語境爬蟲 51
3.3.2 領域發現工具 53
3.4 本章小結 57
3.5 軟件和資源 57
3.6 文獻註釋 58
3.7 習題 60
第4章 命名實體識別 62
4.1 概覽 62
4.2 為什麽很難提取信息 65
4.3 命名實體識別方法 66
4.3.1 監督學習方法 67
4.3.2 半監督學習方法和無監督學習方法 70
4.4 用於命名實體識別的深度學習 71
4.5 具體領域的命名實體識別 73
4.6 評估信息提取質量 73
4.7 本章小結 74
4.8 軟件和資源 75
4.9 文獻註釋 75
4.10 習題 77
第5章 互聯網信息提取 78
5.1 概覽 78
5.2 生成包裝器 81
5.2.1 手動構建的包裝器和監督包裝器 82
5.2.2 半監督包裝器 85
5.2.3 無監督包裝器 86
5.2.4 實證比較分析 89
5.3 不止包裝器:針對結構化數據的信息提取 90
5.4 本章小結 95
5.5 軟件和資源 96
5.6 文獻註釋 97
5.7 習題 98
第6章 關系提取 100
6.1 概覽 100
6.2 本體和相關項目 102
6.2.1 ACE 102
6.2.2 其他本體:簡要入門 104
6.3 關系提取技術 105
6.3.1 監督關系提取 105
6.3.2 評估監督關系提取 108
6.3.3 半監督關系提取 108
6.3.4 無監督關系提取 110
6.4 最近的研究:針對關系提取的深度學習 111
6.5 關系提取拓展:事件提取和聯合信息提取 114
6.6 本章小結 115
6.7 軟件和資源 115
6.8 文獻註釋 116
6.9 習題 117
第7章 非傳統信息提取 118
7.1 概覽 118
7.2 開放信息提取 119
7.2.1 KnowItAll 124
7.2.2 TextRunner 125
7.2.3 評估和比較不同的開放信息提取系統 126
7.3 社交媒體信息提取 128
7.3.1 TWICAL 129
7.3.2 TwitIE 130
7.4 其他非傳統信息提取類型 131
7.5 本章小結 132
7.6 軟件和資源 133
7.7 文獻註釋 134
7.8 習題 135
第三部分 知識圖譜補全
第8章 實例匹配 138
8.1 概覽 138
8.2 形式 140
8.3 為什麽實例匹配具有挑戰性 142
8.4 兩步流程 142
8.4.1 分塊步驟 143
8.4.2 相似性步驟 150
8.5 評估兩步流程 153
8.5.1 評估分塊步驟 154
8.5.2 評估相似性步驟 155
8.6 後相似性步驟 156
8.6.1 聚類和傳遞閉包 156
8.6.2 實體命名系統 158
8.7 用Swoosh 形式化實例匹配 160
8.8 關於研究前沿的說明 162
8.9 不限於實例匹配的數據清理 164
8.10 本章小結 168
8.11 軟件和資源 168
8.12 文獻註釋 170
8.13 習題 171
第9章 統計關系學習 175
9.1 概覽 175
9.2 依存關系建模 176
9.3 統計關系學習框架 177
9.3.1 馬爾可夫邏輯網絡 178
9.3.2 概率軟邏輯 182
9.4 知識圖譜識別 183
9.4.1 表示不確定的提取內容 184
9.4.2 表示實例匹配輸出 185
9.4.3 執行本體約束 185
9.4.4 整合:非確定知識圖譜的概率分布 186
9.4.5 關於實驗性能的說明 186
9.5 其他應用 186
9.5.1 集合分類 187
9.5.2 鏈接預測 187
9.5.3 社會網絡建模 187
9.6 高級研究領域:數據編程 187
9.7 本章小結 188
9.8 軟件和資源 188
9.9 文獻註釋 189
9.10 習題 190
第 10章 知識圖譜表示學習 191
10.1 概覽 191
10.2 嵌入式架構:入門 193
10.2.1 CBOW 模型 194
10.2.2 skip-gram 模型 195
10.3 超越詞嵌入 195
10.4 知識圖譜嵌入 196
10.5 有影響力的知識圖譜嵌入系統 199
10.5.1 結構化嵌入 199
10.5.2 神經張量網絡 201
10.5.3 平移嵌入模型 202
10.5.4 TransE 203
10.5.5 其他Trans*算法 204
10.6 超事實語境 208
10.6.1 實體類型 208
10.6.2 文本描述 209
10.6.3 超越文本和概念:其他信息集 210
10.7 應用 211
10.7.1 鏈接預測 211
10.7.2 三元組分類 212
10.7.3 實體分類 213
10.7.4 重溫實例匹配 213
10.7.5 其他應用 214
10.8 本章小結 214
10.9 軟件和資源 215
10.10 文獻註釋 215
10.11 習題 216
第四部分 訪問知識圖譜
第 11章 推理與檢索 220
11.1 概覽 220
11.2 推理 222
11.2.1 描述邏輯:簡要入門 223
11.2.2 網絡本體語言 224
11.2.3 範例推理框架:Protégé 228
11.3 檢索 229
11.4 對比檢索與推理 231
11.4.1 評估 232
11.4.2 範例檢索框架:Lucene 237
11.5 本章小結 238
11.6 軟件和資源 239
11.7 文獻註釋 239
11.8 習題 240
第 12章 結構化查詢 243
12.1 概覽 243
12.2 SPARQL 243
12.3 知識圖譜查詢的關系處理 246
12.3.1 三元組(垂直)表存儲 247
12.3.2 屬性表存儲 248
12.3.3 水平表存儲 249
12.4 NoSQL 250
12.4.1 鍵 值存儲 251
12.4.2 圖數據庫 254
12.4.3 具有極高可擴展性的NoSQL 數據庫 259
12.5 本章小結 261
12.6 軟件和資源 261
12.7 文獻註釋 262
12.8 習題 263
第 13章 問答 266
13.1 概覽 266
13.2 作為獨立應用的問答 267
13.2.1 從會話式對話中學習:KnowBot 268
13.2.2 BERT 269
13.2.3 知識圖譜的必要性 272
13.3 作為知識圖譜查詢的問答 273
13.3.1 挑戰與解決方法 274
13.3.2 基於模板的解決方案 280
13.3.3 語義問答評估 281
13.4 本章小結 282
13.5 軟件和資源 283
13.5.1 BERT 和基於語言模型的問答系統 283
13.5.2 HOBBIT 283
13.6 文獻註釋 283
13.7 習題 285
第五部分 知識圖譜生態系統
第 14章 關聯數據 288
14.1 概覽 288
14.1.1 原則1 292
14.1.2 原則2 292
14.1.3 原則3 294
14.1.4 原則4 294
14.2 關聯數據原則的影響和采用 295
14.3 關聯開放數據生態系統中的重要知識圖譜 297
14.3.1 DBpedia 298
14.3.2 GeoNames 298
14.3.3 YAGO 299
14.3.4 Wikidata 299
14.3.5 UMBEL 300
14.3.6 FOAF 301
14.3.7 其他例子 302
14.4 本章小結 302
14.5 軟件和資源 303
14.6 文獻註釋 303
14.7 習題 304
第 15章 企業和政府機構 305
15.1 概覽 305
15.2 企業 306
15.2.1 知識寶庫 308
15.2.2 社交媒體和開放圖譜協議 311
15.2.3 Schema 網站 312
15.3 政府機構和非營利組織 313
15.3.1 公開政務數據 313
15.3.2 BBC 315
15.4 未來展望 316
15.5 本章小結 317
15.6 軟件和資源 317
15.7 文獻註釋 318
15.8 習題 320
第 16章 自然科學領域中的知識圖譜和本體 322
16.1 概覽 322
16.2 生物學 323
16.3 化學 328
16.3.1 ChEBI 328
16.3.2 PubChem 330
16.4 地球科學、環境科學和地理科學 ... 330
16.4.1 SWEET 330
16.4.2 GEON 門戶和OpenTopography 332
16.4.3 ENVO 333
16.5 本章小結 335
16.6 軟件和資源 335
16.7 文獻註釋 336
16.8 習題 337
第 17章 在特定領域具有社會影響力的知識圖譜 338
17.1 概覽 338
17.2 DIG 339
17.2.1 領域設置 340
17.2.2 領域探索 344
17.3 替代方案:DeepDive 346
17.4 應用和用例 347
17.4.1 調查領域 347
17.4.2 危機信息學 350
17.5 本章小結 351
17.6 軟件和資源 352
17.7 文獻註釋 352
17.8 習題 354
