Python 自然語言處理實戰 Python Natural Language Processing Cookbook: Over 50 recipes to understand, analyze, and generate text for implementing language processing tasks

Zhenya Antic 譯者 於延鎖//劉強

買這商品的人也買了...

商品描述

近年來,基於深度學習的人工智能掀起了學習熱潮。
Python是廣泛使用的自然語言處理(NLP)語言。
本書從NLP的概述開始,介紹了將文本分成句子、詞幹提取和詞形還原、刪除停用詞和詞性標註的方法,以幫助您準備數據。
然後,您將學習提取和表示語法信息的方法,例如依存分析和指代消解,發現使用詞袋、
TF-IDF、詞嵌入和BERT表示語義的不同方法,並使用關鍵字、SVM、LSTM和其他技術開發文本分類技能。
隨著學習的深入,您還將了解如何從文本中提取信息、實施無監督和有監督的主題建模技術,以及對短文本(如推文)進行主題建模。
此外,本書還向您展示瞭如何使用NLTK和Rasa開發聊天機器人並可視化文本數據。
讀完這本NLP書籍,您將掌握使用一組強大的工具進行文本處理工具的技能。
可以說,本書是深度學習和自然語言處理的入門教程,同時也讀者登堂入室,進入機會與挑戰並存的人工智能領域。
這本NLP書籍適於AI工程師、機器學習工程師、數據科學家和深度學習愛好者閱讀。

目錄大綱

譯者序
原書前言
第1章學習NLP基礎知識
1.1 技術要求
1.2 將文本分成句子
1.3 將句子切分成單詞——分詞
1.4 詞性標註
1.5 詞幹提取
1.6 組合相似詞——詞形還原
1.7 刪除停用詞
第2章玩轉語法
2.1 技術要求
2.2 計數名詞——複數名詞和單數名詞
2.3 獲取依存句法
2.4 將句子拆分為從句
2.5 提取名詞塊
2.6 提取實體和關係
2.7 提取句子的主語和賓語
2.8 尋找引用——指代消解
第3章表示文本——捕獲語義
3.1 技術要求
3.2 將文檔放入詞袋中
3.3 構建n-gram模型
3.4 用TF-IDF表示文本
3.5 使用詞嵌入
3.6 訓練您自己的嵌入模型
3.7 表示短語——phrase2vec
3.8 使用BERT代替詞嵌入
3.9 語義搜索入門
第4章文本分類
4.1技術要求
4.2準備好數據集和評估基準
4.3使用關鍵詞執行基於規則的文本分類
4.4使用K-means聚類句子——無監督文本分類
4.5 使用SVM進行有監督的文本分類
4.6 使用LSTM進行有監督的文本分類
第5章信息提取入門
5.1 技術要求
5.2 使用正則表達式
5.3 尋找相似的字符串:Levenshtein距離
5.4 使用spaCy執行命名體識別
5.5 用spaCy訓練您自己的NER模型
5.6 發現情感分析
5.7 使用LSTM的短文本情感分析:Twitter
5.8 使用BERT進行情感分析
第6章主題建模
6.1 技術要求
6.2 使用sklearn進行LDA主題建模
6.3 使用gensim進行LDA主題建模
6.4 NMF主題建模
6.5 使用BERT進行K-means主題建模
6.6 短文本主題建模
第7章構建聊天機器人
7.1 技術要求
7.2 使用關鍵字匹配構建一個基本的聊天機器人
7.3 構建一個基本的Rasa聊天機器人
7.4 使用Rasa創建問答對
7.5 使用Rasa創建和可視化對話路徑
7.6 為Rasa聊天機器人創建操作
第8章可視化文本數據
8.1 技術要求
8.2 可視化依存句法
8.3 可視化詞性
8.4 可視化NER
8.5 構建詞云
8.6 可視化主題
附錄
附錄A spaCy詞性標籤列表
附錄B NLTK詞性標籤列表
附錄C 停用詞列表
附錄D spaCy命名實體標籤