自然語言處理實踐:語義理解與信息抽取

趙紅燕

  • 出版商: 化學工業
  • 出版日期: 2026-07-01
  • 售價: $534
  • 語言: 簡體中文
  • 頁數: 148
  • ISBN: 7122496600
  • ISBN-13: 9787122496607
  • 相關分類: Natural Language Processing
  • 尚未上市,歡迎預購

相關主題

商品描述

本書聚焦深度學習驅動的語義理解與信息抽取技術,以框架語義分析為支撐,圍繞實體關系抽取、事件抽取等核心任務展開介紹和討論:在實體關系抽取領域,提出多層次框架語義要素融合模型與融合多源信息的關系抽取模型,豐富語義表征的維度與精度;針對遠程監督數據噪聲問題,構建框架語義上下文感知模型,結合實例選擇與層次化註意力機制降低噪聲幹擾,並通過多層級註意力機制與動態閾值的MADT模型,進一步優化抽取性能;針對數據不平衡問題a,將框架語義與多任務學習相結合,有效減弱小樣本、負樣本對模型的影響;在事件抽取研究中,設計基於多尺度閱讀理解和豪斯多夫距離算法的文檔級事件抽取模型,提升長文本中事件類型與論元識別的精準度。此外,通過構建基於知識圖譜的電影問答系統完成理論到應用的閉環驗證。
本書兼具理論深度與實踐價值,內容系統全面,技術方案創新性強,適合自然語言處理、信息抽取領域的科研學者、技術研發人員,以及高校相關專業的師生閱讀參考。

目錄大綱

第1章 緒論  001
1.1 信息抽取技術 002
1.2 實體關系抽取 004
1.2.1 基於模式的關系抽取 005
1.2.2 基於傳統機器學習的關系抽取 005
1.2.3 基於深度學習的關系抽取 006
1.3 事件抽取 011
1.3.1 句子級事件抽取 011
1.3.2 文檔級事件抽取 013
1.4 框架語義分析 015
1.4.1 框架語義分析 015
1.4.2 框架語義應用研究現狀 017
1.5 本書主要內容介紹 019

第2章 框架識別及框架語義要素抽取 023
2.1 框架語義分析 024
2.2 基於DNN的漢語框架識別模型 027
2.2.1 算法模型 027
2.2.2 評測與分析 031
2.3 基於兩級註意力機制的卷積神經網絡框架識別模型 036
2.3.1 算法模型 036
2.3.2 實驗與分析 040
2.4 框架語義要素抽取 044
2.4.1 單框架語義要素抽取算法 044
2.4.2 擴展框架語義要素抽取算法 046

第3章 基於框架語義和序列表示的關系抽取  049
3.1 關系抽取 050
3.2 多層次框架語義要素融合模型 053
3.2.1 基於註意力的單框架語義要素融合模型 054
3.2.2 基於註意力的擴展框架語義要素融合模型 055
3.3 多視角句子表示模型 057
3.3.1 基於序列的句子表示模型 057
3.3.2 基於框架語義的句子表示模型 057
3.3.3 融合框架語義和序列特征的句子表示模型 058
3.4 融合多源信息的關系抽取模型 058
3.4.1 算法模型 058
3.4.2 實驗與分析 059

第4章 基於框架語義上下文感知的遠程監督關系抽取 065
4.1 遠程監督關系抽取 066
4.2 遠程監督實例選擇 070
4.2.1 線索詞抽取 070
4.2.2 實例選擇 070
4.3 融合多粒度框架語義要素的關系抽取模型 071
4.3.1 句子上下文編碼器 073
4.3.2 語義場景編碼器 075
4.3.3 包上下文編碼器 078
4.3.4 關系分類器和訓練 078
4.4 性能評測 079
4.4.1 數據集和評價指標 079
4.4.2 實驗設置 080
4.4.3 基線模型 081
4.4.4 評測結果 082

第5章 基於框架語義及多任務學習的非平衡數據關系抽取 089
5.1 數據不平衡問題 090
5.2 上下文表示學習 092
5.2.1 實體的上下文表示 092
5.2.2 語義場景上下文表示 093
5.3 基於多任務學習的關系抽取模型 094
5.3.1 算法模型 094
5.3.2 結果預測 096
5.4 評測與分析 096
5.4.1 數據集與評價指標 097
5.4.2 評測設置 097
5.4.3 評測結果 098
 
第6章 基於多層級註意力機制和動態閾值的遠程監督關系抽取 103
6.1 噪聲問題 104
6.2 模型描述 105
6.2.1 噪聲詞降噪模塊 105
6.2.2 噪聲句降噪模塊 107
6.2.3 噪聲包降噪模塊 109
6.2.4 關系分類器及網絡優化 110
6.3 評測及分析 110
6.3.1 實驗數據集 110
6.3.2 實驗評估指標 111
6.3.3 訓練與測試 112
6.3.4 參數設置 112
6.3.5 基線模型 112
6.3.6 對比實驗結果與分析 113
6.3.7 消融實驗結果與分析 116
6.3.8 案例分析 117

第7章 基於多尺度閱讀理解和豪斯多夫距離算法的文檔級事件抽取 119
7.1 文檔級事件抽取 120
7.2 模型描述 121
7.2.1 多尺度閱讀理解模塊 122
7.2.2 多尺度解碼器模塊 123
7.2.3 事件識別模塊 124
7.2.4 候選論元識別模塊 125
7.2.5 匹配損失模塊 125
7.2.6 優化算法 126
7.3 評測 126
7.3.1 數據集 126
7.3.2 實驗設置 126
7.3.3 模型評估 127
7.3.4 基線模型 127
7.3.5 對比實驗 128
7.3.6 消融實驗 130

第8章 基於知識圖譜的電影問答系統 133
8.1 電影知識問答系統分析與設計 134
8.1.1 數據來源及知識圖譜構建 134
8.1.2 系統功能需求分析 135
8.1.3 系統架構設計 137
8.2 系統實現 139
8.2.1 系統開發環境 139
8.2.2 系統功能模塊開發 139

參考文獻 143