自然語言處理與計算語言學 Natural Language Processing and Computational Linguistics
Bhargav Srinivasa-Desikan 何煒譯
- 出版商: 人民郵電
- 出版日期: 2020-08-01
- 定價: $354
- 售價: 8.5 折 $301
- 語言: 簡體中文
- 頁數: 217
- 裝訂: 平裝
- ISBN: 7115540241
- ISBN-13: 9787115540249
-
相關分類:
Natural Language Processing
- 此書翻譯自: Natural Language Processing and Computational Linguistics
立即出貨
買這商品的人也買了...
-
程序員的數學3 : 線性代數$474$450 -
$474自然語言處理 : 原理與技術實現 -
$594情感分析 : 挖掘觀點、情感和情緒 (Sentiment Analysis: Mining Opinions, Sentiments, and Emotions) -
$403程序員的數學2 : 概率統計 -
$327Keras深度學習實戰 -
$422深入淺出圖神經網絡:GNN 原理解析 -
tf.keras 技術者們必讀!深度學習攻略手冊$1,000$850 -
知識圖譜與深度學習$594$564 -
$611文本機器學習 -
NLP 工程師養成術:自然語言處理入門$690$538 -
$352深度學習筆記 -
$322深度學習算法與實踐 -
$509R語言醫學數據分析實戰 -
$564Python深度學習:邏輯、算法與編程實戰 -
Python 非同步設計|使用 Asyncio (Using Asyncio in Python )$480$379 -
社群網站的資料探勘, 3/e (Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub, and More, 3/e)$780$616 -
$284深度學習自然語言處理實戰 -
$378自然語言處理從入門到實戰 -
使用 Python 搜刮網路資料的 12堂實習課$520$406 -
$403會話式AI:自然語言處理與人機交互 -
Python 遷移學習$534$507 -
$473深度學習實戰 — 基於 TensorFlow 2.0 的人工智能開發應用 -
自然語言處理最佳實務|全面建構真正的 NLP 系統 (Practical Natural Language Processing: A Comprehensive Guide to Building Real-World Nlp Systems)$780$616 -
$254文本數據挖掘與 Python 應用 -
Python 技術者們 -- 實踐!帶你一步一腳印由初學到精通, 2/e$650$514
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
自然語言處理是一門融語言學、計算機科學、數學於一體的科學,
研究人與計算機之間用自然語言進行有效通信的各種理論和方法。
計算語言學是指通過建立形式化的數學模型來分析、處理自然語言,
並在計算機上用程序來實現分析和處理的過程,旨在以機器來模擬人的部分或全部語言能力的目的。
《自然語言處理與計算語言學》作為一本借助於Python編程語言以及各種開源工具(如Gensim、spaCy等)
來執行文本分析、自然語言處理和計算語言學算法的圖書,
從應用層面介紹了相關的理論知識和所涉及的技術。
《自然語言處理與計算語言學》共分為15章,其內容涵蓋了文本分析的定義、
使用Python進行文本分析的技巧、spaCy語言模型、Gensim工具、
詞性標註及其應用、NER標註及其應用、依存分析、主題模型、
高級主題建模、文本聚類和文本分類、查詢詞相似度計算和文本摘要、
詞嵌入、使用深度學習處理文本、使用Keras和spaCy進行深度學習、
情感分析與聊天機器人的原理介紹等。
《自然語言處理與計算語言學》適合對自然語言處理的實現細節感興趣的Python程序開發人員閱讀。
如果讀者俱備統計學的基本知識,對學習本書內容會大有裨益。
作者簡介
Bhargav Srinivasa-Desikan
是就職於法國INRIA公司(位於裏爾)的一名研究人員。
作為MODAL(數據分析與機器建模)小組的一員,致力於度量學習、預測聚合和數據可視化等研究領域。
同時,他也是Python開源社區的一名活躍貢獻者,
在2016年度Google的夏季編程賽上,他通過Gensim實現了動態主題模型。
Bhargav是歐洲和亞洲PyCons和PyDatas的常客,並使用Python進行文本分析教學。
他也是Python機器學習軟件包pycobra的維護者,
還在Machine Learning Research雜誌上發表過相關文章。
目錄大綱
第 1章 什麼是文本分析 1
1.1 什麼是文本分析 1
1.2 蒐集數據 5
1.3 若輸入錯誤數據,則輸出亦為錯誤數據(garbage in,garbage out) 8
1.4 為什麼你需要文本分析 9
1.5 總結 11
第 2章 Python文本分析技巧 12
2.1 為什麼用Python來做文本分析 12
2.2 用Python進行文本操作 14
2.3 總結 18
第3章 spaCy語言模型 19
3.1 spaCy庫 19
3.2 spaCy的安裝步驟 21
3.3 故障排除 22
3.4 語言模型 22
3.5 安裝語言模型 23
3.6 安裝語言模型的方式及原因 25
3.7 語言模型的基本預處理操作 25
3.8 分詞 26
3.9 詞性標註 28
3.10 命名實體識別 29
3.11 規則匹配 30
3.12 預處理 31
3.13 總結 33
第4章 Gensim:文本向量化、向量變換和n-grams的工具 34
4.1 Gensim庫介紹 34
4.2 向量以及為什麼需要向量化 35
4.3 詞袋(bag-of-words) 36
4.4 TF-IDF(詞頻-反向文檔頻率) 37
4.5 其他表示方式 38
4.6 Gensim中的向量變換 38
4.7 n-grams及其預處理技術 42
4.8 總結 44
第5章 詞性標註及其應用 45
5.1 什麼是詞性標註 45
5.2 使用Python實現詞性標註 49
5.3 使用spaCy進行詞性標註 50
5.4 從頭開始訓練一個詞性標註模型 53
5.5 詞性標註的代碼示例 57
5.6 總結 59
第6章 NER標註及其應用 60
6.1 什麼是NER標註 60
6.2 用Python實現NER標註 64
6.3 使用spaCy實現NER標註 67
6.4 從頭開始訓練一個NER標註器 72
6.5 NER標註應用實例和可視化 77
6.6 總結 79
第7章 依存分析 80
7.1 依存分析 80
7.2 用Python實現依存分析 85
7.3 用spaCy實現依存分析 87
7.4 從頭開始訓練一個依存分析器 91
7.5 總結 98
第8章 主題模型 99
8.1 什麼是主題模型 99
8.2 使用Gensim構建主題模型 101
8.3 隱狄利克雷分配(Latent Dirichlet Allocation) 102
8.4 潛在語義索引(Latent Semantic Indexing) 104
8.5 分層狄利特雷過程(Hierarchical Dirichlet Process) 105
8.6 動態主題模型 108
8.7 使用scikit-learn構建主題模型 109
8.8 總結 112
第9章 高級主題建模 113
9.1 高級訓練技巧 113
9.2 探索文檔 117
9.3 主題一致性和主題模型的評估 121
9.4 主題模型的可視化 123
9.5 總結 127
第 10章 文本聚類和文本分類 128
10.1 文本聚類 128
10.2 聚類前的準備工作 129
10.3 K-means 132
10.4 層次聚類 134
10.5 文本分類 136
10.6 總結 138
第 11章 查詢詞相似度計算和文本摘要 139
11.1 文本距離的度量 139
11.2 查詢詞相似度計算 145
11.3 文本摘要 147
11.4 總結 153
第 12章 Word2Vec、Doc2Vec和Gensim 154
12.1 Word2Vec 154
12.2 用Gensim實現Word2Vec 155
12.3 Doc2Vec 160
12.4 其他詞嵌入技術 166
12.5 總結 172
第 13章 使用深度學習處理文本 173
13.1 深度學習 173
13.2 深度學習在文本上的應用 174
13.3 文本生成 177
13.4 總結 182
第 14章 使用Keras和spaCy進行深度學習 183
14.1 Keras和spaCy 183
14.2 使用Keras進行文本分類 185
14.3 使用spaCy進行文本分類 191
14.4 總結 201
第 15章 情感分析與聊天機器人 202
15.1 情感分析 202
15.2 基於Reddit的新聞數據挖掘 205
15.3 基於Twitter的微博數據挖掘 207
15.4 聊天機器人 209
15.5 總結 217
