自然語言處理入門與實戰

徐鵬,張良均

  • 出版商: 電子工業
  • 出版日期: 2025-08-01
  • 售價: $299
  • 語言: 簡體中文
  • 頁數: 196
  • ISBN: 7121511770
  • ISBN-13: 9787121511776
  • 相關分類: Natural Language Processing
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本教材將Python自然語言處理的常用技術與真實案例相結合,深入淺出地介紹Python自然語言處理的重要內容。全書共8章,主要分為兩大部分,第1~3章為基礎篇,包括導論、文本基礎處理、文本預處理與分析,第4~8章為實踐篇,包括新聞自動分類、“天問一號”事件用戶評論情感分析、遊客景區印象分析、論文標題自動生成,以及基於TipDM大數據挖掘建模平臺的遊客景區印象分析。本教材每章都包含課後習題,通過練習和操作實踐,幫助讀者鞏固所學的內容。 本教材可以作為高校數據科學或人工智能等相關專業的教材,也可作為自然語言處理愛好者的自學用書。

目錄大綱

基礎篇
第1章 導論 002
1.1 自然語言處理概述 003
1.1.1 發展歷程及未來展望 003
1.1.2 研究內容與常見應用 003
1.1.3 自然語言處理的基本流程 005
1.2 自然語言處理的開發環境 007
1.2.1 Python的優勢 007
1.2.2 自然語言處理開發環境配置 008
1.3 自然語言與大語言模型 013
本章小結 015
課後習題 015
第2章 文本基礎處理 016
2.1 文本數據源 017
2.2 語料庫 017
2.2.1 語料庫的類型 018
2.2.2 語料庫的用途 019
2.2.3 語料庫的構建與獲取 019
2.3 中文分詞 023
2.3.1 常用中文分詞方法 023
2.3.2 基於jieba庫的中文分詞 029
2.4 詞性標註與命名實體識別 031
2.4.1 詞性標註簡介與規範 031
2.4.2 命名實體識別簡介與常用算法 033
2.4.3 基於jieba庫的詞性標註與命名實體識別 035
2.5 關鍵詞提取 037
2.5.1 常用關鍵詞提取算法 037
2.5.2 提取文本關鍵詞 039
本章小結 043
課後習題 043
第3章 文本預處理與分析 045
3.1 文本向量化與相似度 046
3.1.1 文本向量化與相似度簡介 046
3.1.2 常用文本向量化方法 047
3.1.3 文本向量化實現 055
3.1.4 常用文本相似度算法 057
3.1.5 文本相似度算法實現 060
3.2 文本分析簡介 062
3.2.1 結構化分析 062
3.2.2 語義化分析 064
3.3 文本分析常用算法 065
3.3.1 常用機器學習算法 065
3.3.2 常用深度學習算法 070
本章小結 076
課後習題 076
實踐篇
第4章 新聞類型自動分類 080
4.1 業務背景與項目目標 081
4.1.1 業務背景 081
4.1.2 數據說明 081
4.1.3 分析目標 082
4.2 分析方法與過程 082
4.2.1 數據采集 083
4.2.2 數據探索 083
4.2.3 文本預處理 088
4.2.4 構建SVM模型 092
4.2.5 模型評估 095
本章小結 096
課後習題 097
第5章 “天問一號”事件用戶評論情感分析 098
5.1 業務背景與項目目標 099
5.1.1 業務背景 099
5.1.2 數據說明 099
5.1.3 分析目標 100
5.2 分析方法與過程 101
5.2.1 數據探索 101
5.2.2 文本預處理 106
5.2.3 繪制詞雲圖 110
5.2.4 模型構建與訓練 114
5.2.5 模型評估 119
5.2.6 模型優化 121
本章小結 126
課後習題 126
第6章 遊客景區印象分析 127
6.1 業務背景與項目目標 128
6.1.1 業務背景 128
6.1.2 數據說明 128
6.1.3 分析目標 129
6.2 分析方法與流程 130
6.2.1 文本預處理 130
6.2.2 景區印象分析 133
6.2.3 景區特色分析 134
6.2.4 提升景區美譽度的建議 140
本章小結 141
課後習題 141
第7章 論文標題自動生成 142
7.1 業務背景與項目目標 143
7.1.1 業務背景 143
7.1.2 數據說明 144
7.1.3 分析目標 144
7.2 分析方法與流程 145
7.2.1 文本預處理 145
7.2.2 訓練模型 148
7.2.3 結果與分析 154
本章小結 156
課後習題 156
第8章 基於TipDM大數據挖掘建模平臺的遊客景區印象分析 157
8.1 TipDM大數據挖掘建模平臺簡介 158
8.1.1 共享庫 159
8.1.2 數據連接 159
8.1.3 數據集 160
8.1.4 我的工程 160
8.1.5 個人組件 163
8.2 使用平臺實現遊客景區印象分析 164
8.2.1 使用平臺實現遊客景區印象分析的總體流程 164
8.2.2 配置數據源 165
8.2.3 文本預處理 167
8.2.4 景區印象分析 171
8.2.5 景區特色分析 174
本章小結 177
課後習題 178
參考文獻 179