Python 自然語言處理與開發
葉虎
- 出版商: 清華大學
- 出版日期: 2020-01-01
- 定價: $534
- 售價: 7.9 折 $422
- 語言: 簡體中文
- 頁數: 286
- ISBN: 7302543429
- ISBN-13: 9787302543428
-
相關分類:
Python、Text-mining、Natural Language Processing
立即出貨
買這商品的人也買了...
-
$301精通 Python 自然語言處理 (Mastering Natural Language Processing with Python) -
AWS Lambda 實戰 : 開發事件驅動的無服務器應用程序 (AWS Lambda in Action: Event-Driven Serverless Applications)$474$450 -
為你自己學 Git$500$425 -
$352關聯數據:萬維網上的結構化數據 -
$352Python 自然語言處理實戰:核心技術與算法 -
Python 深度學習實作:Keras 快速上手$500$390 -
$352面向自然語言處理的深度學習:用 Python 創建神經網絡 (Deep Learning for Natural Language Processing: Creating Neural Networks with Python) -
$301特徵工程入門與實踐 (Feature Engineering Made Easy) -
自然語言處理入門$594$564 -
$327Python數據預處理技術與實踐 -
$653Django Web 應用開發實戰 -
機器學習工程師面試全破解:嚴選 124道 AI 演算法決勝題完整剖析$650$507 -
$294圖解 LeetCode 初級算法 (Python版) -
機器學習的數學基礎 : AI、深度學習打底必讀$580$458 -
$454Python 3 反爬蟲原理與繞過實戰 -
$654企業數字化基石——阿裡巴巴雲計算基礎設施實踐 -
$474實時流計算系統設計與實現 -
$270Oracle 從入門到精通, 3/e -
$301Python 高級機器學習 (Advanced Machine Learning with Python) -
特徵工程不再難:資料科學新手也能輕鬆搞定! (Feature Engineering Made Easy: Identify unique features from your dataset in order to build powerful machine learning systems)$520$406 -
$354實戰 Python 設計模式:可復用面向對象軟件開發實踐 -
深度學習的數學地圖 -- 用 Python 實作神經網路的數學模型 (附數學快查學習地圖)$580$458 -
Python 聊天機器人開發:基於自然語言處理與機器學習 (Building Chatbots with Python: Using Natural Language Processing and Machine Learning)$414$393 -
$594Python 第三方庫開發應用實戰 -
$254Python 爬蟲開發實戰教程
商品描述
自然語言處理技術在構建智能社會中發揮越來越重要的作用。本書介紹如何學習和使用流行的Python編程語言開發自然語言處理應用。主要內容包括面向自然語言處理開發的Python編程語言入門,使用Python開發中文分詞,實現Word文檔自動校對基礎,文本相似度計算和排重的原理與實現,文本摘要的原理與實現,問答式聊天機器人算法與代碼實現、機器翻譯技術及其實現與評測。本書是獵兔搜索技術在Python自然語言處理領域的實際應用。
目錄大綱
第1章 Python自然語言處理技術基礎
1.1 體驗自然語言處理技術
1.2 Linux基礎
1.2.1 常用命令
1.2.2 Micro編輯器
1.3 開發環境
1.4 變量
1.5 註釋
1.6 簡單數據類型
1.6.1 數值
1.6.2 字符串
1.6.3 數組
1.7 字面值
1.8 控制流
1.8.1 if語句
1.8.2 循環
1.9 列表
1.10 元組
1.11 集合
1.12 字典
1.13 位數組
1.14 模塊
1.15 函數
1.15.1 print函數
1.15.2 定義函數
1.16 面向對象編程
1.17 文件操作
1.17.1 讀寫文件
1.17.2 重命名文件
1.17.3 遍歷文件
1.18 疊代器
1.18.1 zip函數
1.18.2 itertools模塊
1.19 數據庫
1.20 讀取Excel文件
1.21 pytest單元測試
1.22 異常處理
1.23 日誌
1.24 Flask Web框架
1.25 本章小結
第2章 中文分詞原理與實現
2.1 切分方案
2.2 查找詞典算法
2.2.1 標準檢索樹
2.2.2 三叉檢索樹
2.3 最長匹配中文分詞
2.3.1 正向最大長度匹配法
2.3.2 逆向最大長度匹配法
2.4 概率語言模型的分詞方法
2.4.1 一元模型
2.4.2 數據基礎
2.4.3 二元詞典
2.4.4 用二元連接改進一元模型
2.4.5 N元模型
2.4.6 N元分詞
2.4.7 生成語言模型
2.4.8 評估語言模型
2.4.9 有限狀態機識別未登錄串
2.4.10 概率分詞的流程與結構
2.5 詞性標註
2.5.1 數據基礎
2.5.2 隱馬爾可夫模型
2.5.3 存儲數據
2.5.4 整合切分與詞性標註
2.5.5 基於轉換的錯誤學習方法
2.6 詞類模型
2.7 命名實體識別
2.7.1 人名識別
2.7.2 地名識別
2.8 地名切分
2.8.1 識別未登錄地名
2.8.2 整體流程
2.9 結果評測
2.10 本章小結
第3章 文檔分析
3.1 自動校對
3.1.1 讀取Word文檔
3.1.2 ARPA文件格式
3.1.3 使用KenLM語言模型工具包
3.1.4 拼寫糾錯
3.1.5 模糊匹配問題
3.1.6 正確詞表
3.1.7 英文拼寫檢查
3.1.8 中文拼寫檢查
3.2 句子結構分析
3.2.1 句法分析樹
3.2.2 依存文法
3.2.3 中文依存文法
3.2.4 英文依存文法
3.2.5 機器學習的方法
3.3 本章小結
第4章 文檔排重
4.1 相似度計算
4.1.1 夾角余弦
4.1.2 最長公共子串
4.1.3 同義詞替換
4.2 SimHash文檔排重
4.3 本章小結
第5章 信息提取
5.1 指代消解
5.2 關鍵詞提取
5.2.1 關鍵詞提取的TF-IDF算法
5.2.2 textrank算法
5.2.3 從網頁中提取關鍵詞
5.3 從互聯網提取信息
5.4 從日期字符串提取信息
5.5 本章小結
第6章 自動摘要
6.1 自動摘要技術
6.1.1 英文文本摘要
6.1.2 中文文本摘要
6.1.3 基於篇章結構的自動摘要
6.1.4 句子壓縮
6.2 評測
6.3 本章小結
第7章 文本分類
7.1 樸素貝葉斯
7.2 TensorFlow實現文本分類
7.3 本章小結
第8章 情感分析
8.1 情感詞
8.1.1 確定詞語的褒貶傾向
8.1.2 匹配情感詞
8.2 情感識別
8.3 本章小結
第9章 語音識別
9.1 語音信號處理
9.1.1 WAV文件格式
9.1.2 語音活動檢測
9.2 JSGF語言模型
9.3 DeepSpeech語音識別引擎
9.4 強制對齊
9.5 本章小結
第10章 開發聊天機器人
10.1 問答系統
10.1.1 問句類型
10.1.2 答案提取
10.2 AIML聊天機器人
10.3 意圖
10.4 使用DeepPavlov構建對話系統
10.5 本章小結
第11章 機器翻譯
11.1 語言檢測
11.2 信道模型
11.3 詞表
11.4 詞義消歧
11.5 詞對齊
11.6 神經網絡機器翻譯
11.7 機器翻譯的評價
11.8 本章小結
後記
參考文獻
參考網址



