文本上的算法 深入淺出自然語言處理 文本上的算法 深入浅出自然语言处理

路彥雄

買這商品的人也買了...

商品描述

《文本上的算法 深入淺出自然語言處理》
結合-作者多年學習和從事自然語言處理相關工作的經驗,
力圖用生動形象的方式深入淺出地介紹自然語言處理的理論、方法和技術。
本書拋棄掉繁瑣的證明,提取出算法的核心,
幫助讀者盡快地掌握自然語言處理所必需的知識和技能。

本書主要分兩大部分。
第 一部分是理論篇,包含前3章內容,
主要介紹一些基礎的數學知識、*優化理論知識和一些機器學習的相關知識。
第 二部分是應用篇,包含第4章到第8章,分別針對計算性能、
文本處理的術語、相似度計算、搜索引擎、推薦系統、
自然語言處理和對話系統等主題展開介紹和討論。

本書適合從事自然語言處理相關研究和工作的讀者參考,
尤其適合想要瞭解和掌握機器學習或者自然語言處理技術的讀者閱讀。

作者簡介

路彥雄

西安電子科技大學碩士畢業,
從事自然語言處理和機器學習相關工作多年,具有豐富經驗。
曾任微信小微機器人技術負責人,現任微信整合搜索算法組組長。

目錄大綱

理論篇
第1章你必須知道的一些基礎知識………………………………………3 
1.1概率論………………………………………………… …………3 
1.2信息論……………………………………………………………4 
1.3貝葉斯法則…………………………………… …………………7 
1.4問題與思考………………………………………………………10 

第2章我們生活在一個尋求最優解的世界裡…… ………………………11 
2.1最優化問題………………………………………………………11 
2.2最大似然估計/最大後驗估計………… ………………………15 
2.3梯度下降法………………………………………………………17 
2.4問題與思考………………………… ……………………………22 

第3章讓機器可以像人一樣學習…………………………………………23 
3.1何謂機器學習…………… ………………………………………23 
3.2邏輯回歸/因子分解機…………………………………………29 
3.3最大熵模型/條件隨機場…… …………………………………34 
3.4主題模型…………………………………………………………40
3.5深度學習…………………………………………………………50 
3.6其他模型……………………………………………………… …88 
3.7問題與思考………………………………………………………97 
應用篇

第4章如何計算得更快……………………………… …………………101 
4.1程序優化………………………………………………………101 
4.2分佈式系統………………………………… …………………105 
4.3 Hadoop …………………………………………………………107 
4.4問題與思考………………………………… …………………114 

第5章你要知道的一些術語……………………………………………115 
5.1 tf/df/idf ……………………… …………………………………115 
5.2 IG/CHI/MI ………………………………………………………116 
5.3 PageRank ……………… …………………… ………………118 
5.4相似度計算……………………………………………………119 
5.5問題與思考…………………………………… ………………125

第6章搜索引擎是什麼玩意兒…………………………………………126 
6.1搜索引擎原理…………………………………………………126 
6.2搜索引擎架構…………………………………………………129 
6.3搜索引擎核心模塊……………………………………………130 
6.4搜索廣告………………………………………………………148 
6.5問題與思考……………………………………………………153 

第7章如何讓機器猜得更準……………………………………………155 
7.1基於協同過濾的推薦算法……………………………………156 
7.2基於內容的推薦算法…………………………………………158 
7.3混合推薦算法…………………………………………………159 
7.4問題與思考…… ………………………………………………163 

第8章理解語言有多難………………………………………… ……164 
8.1自然語言處理…………………………………………………164 
8.2對話系統…………………………………………………… …176 
8.3語言的特殊性…………………………………………………186
8.4問題與思考……………………………………………………190 
結語……………………………………………………………… …………191 
參考文獻……………………………………………………………………193