Java 自然語言處理, 2/e Natural Language Processing with Java - Second Edition: Advanced machine learning and neural networks for building NLP applications
Richard M. Reese, AshishSingh Bhatia 鄒偉 李妍 武現臣譯
- 出版商: 機械工業
- 出版日期: 2020-07-01
- 定價: $474
- 售價: 7.9 折 $374
- 語言: 簡體中文
- 頁數: 234
- 裝訂: 平裝
- ISBN: 711165787X
- ISBN-13: 9787111657873
-
相關分類:
Natural Language Processing、Java 程式語言
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
HTML5 在 iPhone/iPad/Android 的應用程式開發實作$450$351 -
深入淺出 USB 系統開發 : 基於 ARM Cortex-M3$312$296 -
Effective SQL 中文版 | 寫出良好 SQL 的 61個具體做法 (Effective SQL : 61 Specific Ways to Write Better SQL)$450$356 -
Java SE 14 技術手冊$680$537 -
NLP 工程師養成術:自然語言處理入門$690$538 -
$301CSS 圖鑒 -
$403Java 遊戲服務器架構實戰 -
AI 語音辨識:用 Kaldi 實作應用全集$880$440 -
架構師修煉之道 — 思維、方法與實踐$594$564 -
$356自然語言處理與Java語言實現 -
自然語言處理最佳實務|全面建構真正的 NLP 系統 (Practical Natural Language Processing: A Comprehensive Guide to Building Real-World Nlp Systems)$780$616 -
$479Java 從入門到精通, 6/e -
$280基於 Java 的深度學習 (Java Deep Learning Cookbook : Train neural networks for classification, NLP, and reinforcement learning using Deeplearning4j) -
$559自然語言處理:基於預訓練模型的方法 -
全自動化智慧系統運行維護 - 善用 Ansible + Kubernetes$700$553 -
圖像 Angular 開發入門:打造高靈活度的網頁應用程式 (iT邦幫忙鐵人賽系列書)$600$468 -
Keras 大神歸位:深度學習全面進化!用 Python 實作 CNN、RNN、GRU、LSTM、GAN、VAE、Transformer$1,200$948 -
現代決策樹模型及其編程實踐:從傳統決策樹到深度決策樹$774$735 -
真槍實彈做專案:PyQt 極速開發視窗軟體, 2/e$880$695 -
自然語言處理與醫療文本的知識抽取$539$512 -
Hugging Face 模型及資料大公開 - 利用 BERT 建立全中文 NLP 應用$720$569 -
台灣之光物件辨識 - 最新 YOLO 原理精讀+實戰$800$632 -
LLM 大型語言模型的絕世祕笈:27路獨步劍法,帶你闖蕩生成式 AI 的五湖四海 (iThome鐵人賽系列書)$650$507 -
生成式 AI 專案實踐指南:從模型挑選、上線、RAG 技術到 AI Agent 整合$650$507 -
每個程式設計師都應該知道的 60個演算法 (AI 強化版)$850$663
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書將教會讀者如何在Java庫的幫助下執行語言分析,同時不斷地從結果中獲得見解。
首先介紹NLP及其各種概念是如何工作的,然後探索Java中用於NLP的重要工具和庫,
如CoreNLP、OpenNLP、Neuroph、Mallet等。
之後,讀者將開始對不同的輸入和任務執行NLP,例如標記、模型訓練、部分語音、解析樹等。
讀者會學習到統計機器翻譯、摘要、對話系統、複雜搜索、有監督和無監督的NLP,以及其他內容。
在本書的最後,讀者也會學習到更多關於NLP、神經網絡和其他各種Java中用於增強NLP應用程序性能的訓練模型。
目錄大綱
譯者序
前言
作者簡介
審校者簡介
第1章NLP概論1
1.1 NLP是什麼2
1.2為什麼使用NLP 2
1.3為什麼NLP這麼難3
1.4 NLP工具匯總4
1.4.1 Apache OpenNLP 5
1.4.2 Stanford NLP 7
1.4 .3 LingPipe 8
1.4.4 GATE 9
1.4.5 UIMA 9
1.4.6 Apache Lucene Core 10
1.5 Java深度學習10
1.6文本處理任務概述11
1.6.1查找文本的各部分11
1.6.2文本斷句13
1.6.3特徵工程14
1.6.4查找人物和事件14
1.6.5詞性判斷16
1.6.6對文本和文檔進行分類17
1.6.7關係提取17
1.6.8使用組合方法19
1.7理解NLP方法19
1.7.1識別任務19
1.7.2選擇模型20
1.7.3建立並訓練模型20
1.7.4驗證模型20
1.7.5運用模型21
1.8準備數據21
1.9總結22
第2章查找文本的各部分24
2.1理解文章的各個部分24
2.2分詞是什麼25
2.3簡單的Java分詞器27
2.3.1使用Scanner類27
2.3.2使用split方法29
2.3 .3使用BreakIterator類29
2.3.4使用StreamTokenizer類30
2.3.5使用StringTokenizer類32
2.3.6 Java核心分詞的性能考慮32
2.4 NLP分詞器API 33
2.4.1使用OpenNLPTokenizer類33
2.4.2使用Stanford分詞器35
2.4.3訓練分詞器找出文本的各部分38
2.4.4分詞器比較41
2.5瞭解規範化42
2.5.1轉換成小寫42
2.5.2刪除停用詞43
2.5.3使用詞幹分析45
2.5. 4使用詞元化48
2.5.5使用管道進行標準化處理51
2.6總結52
第3章文本斷句53
3.1 SBD方法53
3.2 SBD難在何處54
3.3理解LingPipe的HeuristicSentenceModel類的SBD規則55
3.4簡單的Java SBD 56
3.4.1使用正則表達式56
3.4.2使用BreakIterator類58
3.5使用NLP API 59
3.5.1使用OpenNLP 60
3.5.2使用Stanford API 62
3.5 .3使用LingPipe 69
3.6訓練文本斷句模型73
3.6.1使用訓練好的模型75
3.6.2使用SentenceDetector-Evaluator類評估模型75
3.7總結76
第4章人物識別77
4.1 NER難在何處78
4.2 NER方法78
4.2.1列表和正則表達式79
4.2.2統計分類器80
4.3使用正則表達式進行NER 80
4.3.1使用Java的正則表達式來尋找實體80
4.3.2使用LingPipe的RegEx-Chunker類82
4.4使用NLP API 83
4.4.1使用OpenNLP進行NER 83
4.4.2使用Stanford API進行NER 88
4.4.3使用LingPipe進行NER 89
4.5使用NER註釋工具構建新數據集93
4.6訓練模型98
4.7總結101
第5章詞性判斷102
5.1詞性標註102
5.1.1詞性標註器的重要性104
5.1.2詞性標註難在何處105
5.2使用NLP API 106
5.2.1使用OpenNLP POS標註器107
5.2.2使用Stanford POS標註器115
5.2.3使用LingPipe POS標註器120
5.2.4訓練OpenNLP POSModel 124
5.3總結125
第6章用特徵表示文本127
6.1 n- gram 127
6.2詞嵌入129
6.3 GloVe 131
6.4 word2vec 133
6.5降維134
6.6主成分分析134
6.7 t-SNE 135
6.8總結138
第7章信息檢索139
7.1布爾檢索139
7.2字典和容錯性檢索141
7.2.1通配符查詢141
7.2.2拼寫校正142
7.2.3 Soundex 143
7.3向量空間模型143
7.4計分和術語加權144
7.5逆文檔頻率145
7.6 TF-IDF加權145
7.7信息檢索系統的評估145
7.8總結146
第8章對文本和文檔進行分類147
8.1如何使用分類147
8.2理解情感分析148
8.3文本分類技術150
8.4使用API對文本進行分類151
8.4.1使用OpenNLP 151
8.4.2使用Stanford API 154
8.4.3使用LingPipe對文本進行分類158
8.5總結165
第9章主題建模166
9.1什麼是主題建模166
9.2 LDA的基礎167
9.3使用MALLET進行主題建模168
9.3.1訓練168
9.3.2評價168
9.4總結171
第10章使用解析器提取關係172
10.1關係類型173
10.2理解解析樹174
10.3使用提取的關係175
10.4提取關係178
10.5使用NLP API 178
10.5.1使用OpenNLP 178
10.5.2使用Stanford API 181
10.5.3查找共指消解實體184
10.6為問答系統提取關係186
10.6.1查找單詞依賴關係186
10.6.2確定問題類型187
10.6.3尋找答案188
10.7總結190
第11章組合管道192
11.1準備數據193
11.1.1使用Boilerpipe從HTML抽取文本193
11.1.2使用POI從Word文檔中抽取文本195
11.1.3使用PDFBox從PDF文檔抽取文本200
11.1.4使用Apache Tika進行內容分析和抽取201
11.2管道203
11.2.1使用Stanford管道203
11.2.2在Stanford管道中使用多核處理器205
11.3創建用於搜索文本的管道206
11.4總結211
第12章創建一個聊天機器人212
12.1聊天機器人架構213
12.2人工語言網絡計算機實體214
12.2.1瞭解AIML 214
12.2.2使用ALICE和AIML開發聊天機器人216
12.3總結221
