自然語言理解與行業知識圖譜:概念、方法與工程落地

王楠,趙宏宇,蔡月

  • 出版商: 機械工業
  • 出版日期: 2022-01-20
  • 售價: $714
  • 貴賓價: 9.5$678
  • 語言: 簡體中文
  • 頁數: 360
  • 裝訂: 平裝
  • ISBN: 7111698304
  • ISBN-13: 9787111698302
  • 相關分類: Text-mining
  • 立即出貨 (庫存 < 4)

買這商品的人也買了...

商品描述

首先闡述自然語言理解的發展脈絡和分析邏輯,主要圍繞語言符號、處理體系、語義理解等進行探討,
引出自然語言理解的自動分析原理和方法,包括對自然語言特徵、統計語言學習、常規機器學習、深度學習、知識圖譜方面的介紹。
在上述基本自然語言處理方法講解基礎上,繼續闡述行業知識圖譜搭建和行業應用的方法。
通過作者團隊幾年來在自然語言處理和行業知識圖譜的實踐經驗,
探討垂直行業認知的邏輯和解決方案。
本書為互聯網企業的文本智能平台構建的提供了很好的案例參考,
也為行業信息化從業者提供了從入門到進階的一整套技術指導,
同時也適合作為自然語言處理、知識圖譜、計算機、人工智能等領域從業者的學習指導書,
若是對自然語言處理、知識圖譜、人工智能感興趣的學生、創業團隊,本書也非常適宜閱讀。

目錄大綱

推薦序一
推薦序二
前言
符號表
第1章 自然語言之“理解”1
1.1 基本脈絡5
1.1.1 文字傳承6
1.1.2 機器處理8
1.1.3 理解困境9
1.2 商業曙光10
1.3 認知落腳點12
1.3.1 文本分析之錨13
1.3.2 走向智能之路14
1.3.3 第一步在何方14
1.4 思辨未來14
1.4.1 語言理解與語義知識的辨析14
1.4.2 行業知識圖譜構建問題15
小結15
參考文獻16
第2章 自然語言理解邏輯17
2.1 符號-連接-融合17
2.2 語言理解任務18
2.2.1 語法類任務20
2.2.2 語義類任務26
2.2.3 語用類任務34
2.3 語言理解體系42
小結43
參考文獻44
第3章 自然語言處理45
3.1 自然語言文本特徵46
3.1.1 通用語言文本特徵46
3.1.2 行業語言文本特徵47
3.1.3 語言文本特徵表示48
3.1.4 語言特徵選擇49
3.2 自然語言統計學習54
3.2.1 統計學習基礎54
3.2.2 語言語料庫65
3.2.3 語料採樣66
3.2.4 語言模型67
3.3 自然語言機器學習69
3.3.1 文本分類方法69
3.3.2 文本標註方法84
3.3.3 文本聚類方法90
3.3.4 文本生成方法95
3.3.5 文本匹配方法97
3.3.6 圖計算方法104
3.4 自然語言深度學習114
3.4.1 神經網絡學習115
3.4.2 神經網絡結構118
3.4.3 深度表示學習136
3.4.4 預訓練語言模型139
3.4.5 前沿與思考148
小結149
參考文獻149
第4章 知識圖譜150
4.1 語言知識與語言知識庫150
4.2 知識圖譜演進152
4.3 知識圖譜工程153
4.3.1 知識表示154
4.3.2 知識加工158
4.3.3 知識建模與計算166
4.3.4 知識存儲與查詢168
4.3.5 知識更新170
4.4 知識圖譜智能171
4.4.1 語義匹配171
4.4.2 搜索推薦172
4.4.3 問答對話174
4.4.4 推理決策175
4.4.5 區塊鏈協作176
4.5 通用知識圖譜177
4.5.1 百科知識圖譜177
4.5.2 常識知識圖譜179
4.5.3 中文類知識圖譜180
4.6 行業知識圖譜181
4.6.1 金融知識圖譜182
4.6.2 醫療知識圖譜186
4.6.3 教育知識圖譜189
4.6.4 公安知識圖譜191
4.6.5 司法知識圖譜193
4.6.6 電商生活知識圖譜194
4.6.7 圖書文獻知識圖譜196
4.6.8 房地產知識圖譜198
小結199
第5章 行業知識工程實踐201
5.1 行業知識庫202
5.1.1 行業語料庫203
5.1.2 行業術語知識庫206
5.1.3 行業文本規則庫216
5.1.4 行業特徵字段庫219
5.1.5 行業本體庫220
5.1.6 行業附圖庫225
5.1.7 行業產品庫227
5.1.8 行業標準庫230
5.1.9 應用知識庫232
5.2 行業模型算法庫233
5.2.1 文本匹配233
5.2.2 文本分類237
5.2.3 文本標註248
5.2.4 文本生成255
5.2.5 關聯圖計算260
5.2.6 價值評估261
5.3 標註、訓練和更新264
5.3.1 標註工具264
5.3.2 訓練框架267
5.3.3 知識更新269
小結269
第6章 行業知識圖譜模塊271
6.1 關鍵詞助手273
6.1.1 術語圖譜274
6.1.2 產品圖譜277
6.2 搜索問答278
6.2.1 語義搜索279
6.2.2 功能搜索281
6.2.3 事實型問答283
6.3 推理計算284
小結288
第7章 行業智能應用平台289
7.1 平台架構初探289
7.1.1 硬件拓撲架構290
7.1.2 平台系統架構290
7.1.3 功能服務架構293
7.2 平台認知功能組件293
7.2.1 文本檢索293
7.2.2 文本分析298
7.2.3 文本挖掘306
7.2.4 監控預警311
7.2.5 價值運營312
7.2.6 信息流管理313
7.3 權限與安全管理314
7.3.1 架構與流程315
7.3.2 平台用戶管理316
7.3.3 安全管理318
小結318
第8章 行業文本智能應用320
8.1 高價值文本發現320
8.1.1 高價值文本定義320
8.1.2 高價值文本評價321
8.1.3 價值發現與價值運營321
8.2 成果分級分類管理322
8.2.1 成果分級323
8.2.2 成果分類323
8.3 新興方向預測324
8.4 技術背景調查326
小結328
附錄A 概率論基礎330
附錄B 信息論基礎339