自然語言處理與Java語言實現

羅剛

預覽內頁

出版商: 人民郵電
出版日期: 2020-08-01
定價: $419
售價: 8.5 折 $356
語言: 簡體中文
頁數: 352
裝訂: 平裝
ISBN: 7115525072
ISBN-13: 9787115525079
相關分類: Natural Language Processing、Java 程式語言

立即出貨 (庫存=1)

買這商品的人也買了...

$354

神經網絡編程實戰 : Java 語言實現, 2/e (Neural Network Programming with Java, 2/e)
~~$540~~ $459

不插電：用 Java 手刻一個類神經網路
~~$800~~ $760

大數據分析與應用實戰：統計機器學習之資料導向程式設計
~~$520~~ $405

輕鬆學會 LINE 程式設計與 AI 聊天機器人實作開發
~~$680~~ $578

Java SE 14 技術手冊
$504

雲原生應用構建：基於 OpenShift
$402

Java 自然語言處理, 2/e
~~$490~~ $417

晉升成 HTTP 一代宗師：用 java 實作 (好評絕賣版)
~~$880~~ $695

極速開發 Java 大型系統：Spring Boot 又輕又快又好學
~~$480~~ $379

高生產力軟體開發實務｜以 Java 專案驅動的基礎指南 (Real-World Software Development)
$402

現代自然語言生成
~~$560~~ $436

Kent Beck 的測試驅動開發：案例導向的逐步解決之道 (Test-Driven Development: By Example)(TDD)
~~$550~~ $467

Python 與 LINE Bot 機器人全面實戰特訓班 -- Flask 最強應用 (附210分鐘影音教學/範例程式)
$478

Java 從入門到精通, 6/e
~~$700~~ $553

全自動化智慧系統運行維護 - 善用 Ansible + Kubernetes
~~$600~~ $468

圖像 Angular 開發入門：打造高靈活度的網頁應用程式 (iT邦幫忙鐵人賽系列書)
~~$600~~ $468

給全端工程師的職涯生存筆記：從「履歷×面試×職場」打造無可取代的軟實力 (iThome鐵人賽系列書)
~~$620~~ $409

NestJS 基礎必學實務指南：使用強大且易擴展的 Node.js 框架打造網頁應用程式 (iThome鐵人賽系列書)
~~$880~~ $695

真槍實彈做專案：PyQt 極速開發視窗軟體, 2/e
~~$550~~ $495

文圖互織的資料寫作學：使用 R Markdown
~~$800~~ $632

台灣之光物件辨識 - 最新 YOLO 原理精讀+實戰
$448

了不起的 Markdown：大語言模型時代的通用語言
~~$1,080~~ $853

Vibe Coding CLI 頂級開發 - Claude Code 前瞻菁英育成手冊
~~$880~~ $695

勝過 AI 的技能 - 玩熟 Mermaid 做出最專業的圖表
~~$980~~ $774

Coding Agent 大神 - Google Antigravity 最強實戰指南

商品描述

本書詳細介紹以Java實現的自然語言處理常用的應用。
從基本的文本挖掘技術到語音識別、問答系統和機器翻譯技術，
包括中文分詞、詞性標註、依存句法分析等。
其中詳細介紹了中文分詞和詞性標註的過程及相關算法，如隱馬爾可夫模型等。
在自然語言處理的應用領域主要介紹了信息抽取、自動文摘、
文本排重、文本分類、文本傾向性分析等領域的基本理論和實現過程，
此外還有問答系統、機器翻譯等目前應用非常廣泛的領域。

作者簡介

主要研究項目及領域：自然語言處理、人工智能、搜索引擎以前出版的圖書：
《自然語言處理原理與技術實現》其他社會頭銜、榮譽：
東南大學社會導師北京石油化工學院社會導師解放軍報社
技術顧問北京安妮福克斯信息諮詢有限公司兼職軟件工程師

目錄大綱

前言
基礎篇
第1章自然語言處理實踐基礎
1.1 開發環境準備
1.1.1 Windows命令行cmd
1.1.2 在Windows下使用Java
1.1.3 Linux終端
1.1.4 在Linux下使用Java
1.1.5 Eclipse集成開發環境
1.2 技術基礎
1.2.1 機器學習
1.2.2 Java基礎
1.2.3 信息採集
1.2.4 文本挖掘
1.2.5 SWIG擴展Java性能
1.2.6 代碼移植
1.2.7 語義
1.2.8 Hadoop分佈式計算框架
1.3 專業術語
開發篇
第2章中文分詞原理與實現
2.1 接口
2.1.1 切分方案
2.1.2 詞典格式
2.2 散列表最長匹配中文分詞
2.2.1 算法實現
2.2.2 使用Ant構建分詞jar包
2.2.3 使用Maven構建分詞jar包
2.2.4 使用Gradle構建分詞jar包
2.2.5 生成JavaDoc
2.3 查找詞典算法
2.3.1 標準Trie樹
2.3.2 三叉Trie樹
2.4 Trie樹最大長度匹配法
2.4.1 正向最大長度匹配法
2.4.2 逆向最大長度匹配法
2.4.3 有限狀態機識別未登錄串
2.5 概率語言模型的分詞方法
2.5.1 一元模型
2.5.2 整合基於規則的方法
2.5.3 表示切分詞圖
2.5.4 形成切分詞圖
2.5.5 數據基礎
2.5.6 改進一元模型
2.5.7 二元詞典
2.5.8 完全二叉樹組
2.5.9 三元詞典
2.5.10 N元模型
2.5.11 N元分詞
2.5.12 生成語言模型
2.5.13 評估語言模型
2.5.14 概率分詞的流程與結構
2.5.15 可變長N元分詞
2.5.16 條件隨機場
2.6 新詞發現
2.7 Android系統中文輸入法
2.8 詞性標註
2.8.1 數據基礎
2.8.2 隱馬爾可夫模型
2.8.3 存儲數據
2.8.4 統計數據
2.8.5 整合切分與詞性標註
2.8.6 大詞表
2.8.7 詞性序列
2.8.8 基於轉換的學習方法
2.8.9 實現詞性標註
2.9 詞類模型
2.10 未登錄詞識別
2.10.1 未登錄人名
2.10.2 提取候選人名
2.10.3 最長人名切分
2.10.4 一元概率人名切分
2.10.5 二元概率人名切分
2.10.6 未登錄地名
2.10.7 未登錄企業名
2.11 中文分詞總體結構
2.12 平滑算法
2.12.1 最大熵
2.12.2 實現中文分詞
2.13 地名切分
2.13.1 識別未登錄地名
2.13.2 整體流程
2.14 企業名切分
2.14.1 識別未登錄詞
2.14.2 整體流程
2.15 結果評測
2.16 專業術語
第3章語義分析
3.1 句法分析樹
3.2 依存文法
3.2.1 中文依存文法
3.2.2 英文依存文法
3.2.3 生成依存文法樹
3.2.4 機器學習的方法
3.3 依存語言模型
3.4 使用Java計算機語言的語義分析
3.5 專業術語
第4章文章分析
4.1 分詞
4.1.1 句子切分
4.1.2 識別未登錄串
4.1.3 切分邊界
4.2 詞性標註
4.3 重點詞彙提取
4.4 句子時態分析
4.5 專業術語
第5章文檔語義
5.1 相似度計算
5.1.1 夾角餘弦
5.1.2 最長公共子串
5.1.3 同義詞替換
5.1.4 地名相似度
5.1.5 企業名相似度
5.2 文檔排重
5.2.1 關鍵詞排重
5.2.2 語義指紋排重
5.2.3 分佈式文檔排重
5.2.4 使用文檔排重
5.3 在搜索引擎中使用文檔排重
5.4 專業術語
第6章信息提取
6.1 指代消解
6.2 中文關鍵詞提取
6.2.1 關鍵詞提取的基本方法
6.2.2 HITS算法應用於關鍵詞提取
6.2.3 從網頁中提取關鍵詞
6.3 信息提取
6.3.1 提取聯繫方式
6.3.2 從因特網提取信息
6.3.3 提取地名
6.4 拼寫糾錯
6.4.1 模糊匹配問題
6.4.2 正確詞表
6.4.3 英文拼寫檢查
6.4.4 中文拼寫檢查
6.5 輸入提示
6.6 專業術語
第7章自動摘要
7.1 自動摘要技術
7.1.1 英文文本摘要
7.1.2 中文文本摘要
7.1.3 基於篇章結構的自動摘要
7.1.4 句子壓縮
7.2 指代消解
7.3 多文檔摘要
7.4 分佈式部署
7.5 專業術語
第8章文本分類
8.1 地名分類
8.2 文本模板分類
8.3 特徵提取
8.4 線性分類器
8.4.1 關鍵詞加權法
8.4.2 樸素貝葉斯
8.4.3 貝葉斯文本分類
8.4.4 支持向量機
8.4.5 多級分類
8.4.6 使用sklearn實現文本分類
8.4.7 規則方法
8.4.8 網頁分類
8.5 FastText文本分類
8.5.1 詞向量
8.5.2 JavaCPP包裝Java接口
8.5.3 使用JFastText
8.6 最大熵分類器
8.7 文本聚類
8.7.1 K均值聚類算法
8.7.2 K均值聚類算法的實現
8.7.3 深入理解DBScan算法
8.7.4 使用DBScan算法聚類實例
8.8 持續集成
8.9 專業術語
第9章文本傾向性分析
9.1 確定詞語的褒貶傾向
9.2 實現情感識別
9.3 專業術語
系統篇
第10章語音識別
10.1 總體結構
10.1.1 識別中文
10.1.2 自動問答
10.2 語音庫
10.3 語音
10.3.1 標註語音
10.3.2 動態時間規整計算相似度
10.4 Sphinx語音識別
10.4.1 中文訓練集
10.4.2 使用Sphinx4
10.4.3 ARPA文件格式
10.4.4 PocketSphinx語音識別引擎
10.5 說話人識別
10.6 專業術語
第11章問答系統
11.1 問答系統的結構
11.1.1 提取問答對
11.1.2 等價問題
11.2 問句分析
11.2.1 問題類型
11.2.2 句型
11.2.3 業務類型
11.2.4 依存文法樹
11.2.5 指代消解
11.2.6 二元關係
11.2.7 問句模板
11.2.8 結構化問句模板
11.2.9 檢索方式
11.2.10 問題重寫
11.2.11 提取事實
11.2.12 驗證答案
11.3 知識庫
11.4 AIML聊天機器人
11.4.1 交互式問答
11.4.2 垂直領域問答系統
11.4.3 語料庫
11.4.4 客戶端
11.5 自然語言生成
11.6 JavaFX開發界面
11.7 專業術語
第12章機器翻譯
12.1 使用機器翻譯API
12.2 翻譯日期
12.3 神經機器翻譯
12.4 輔助機器翻譯
12.5 機器翻譯的評價
12.6 專業術語
參考文獻
後記

自然語言處理與Java語言實現

羅剛

買這商品的人也買了...

商品描述

作者簡介

目錄大綱

類似商品

最後瀏覽商品 (19)