自然語言處理技術入門與實戰 自然语言处理技术入门与实战

蘭紅雲

  • 出版商: 電子工業
  • 出版日期: 2017-11-01
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • 頁數: 200
  • 裝訂: 平裝
  • ISBN: 7121327635
  • ISBN-13: 9787121327636
  • 相關分類: Text-mining
  • 立即出貨(限量) (庫存=3)

買這商品的人也買了...

商品描述

《自然語言處理技術入門與實戰》內容提要
《自然語言處理技術入門與實戰》主要從語義模型詳解、自然語言處理系統基礎算法和系統案例實戰三個方面,介紹了自然語言處理中相關的一些技術。對於每一個算法又分別從應用原理、數學原理、代碼實現,以及對當前方法的思考四個方面進行講解。
《自然語言處理技術入門與實戰》面向的讀者為有志於從事自然語言處理相關工作的在校學生、企事業單位工作人員等人群。本書的結構是由淺入深地進行相關內容的介紹,以滿足不同層次讀者的學習需求。


海報:

作者簡介

蘭紅雲,湖北襄陽人。
曾任職於獵豹移動,現為阿里影業數據挖掘專家,擁有多年的算法和數據挖掘的工作經驗,申請過多項算法專利。

研究方向包括自然語言處理和機器學習。

目錄大綱

第1篇語義模型詳解

第1章關鍵詞抽取模型3 
1.1 TF-IDF算法實現關鍵詞抽取4 
1.2 TextRank算法實現關鍵詞抽取11 
1.3基於語義的統計語言模型實現關鍵詞抽取16 

第2章短語抽取模型22 
2.1基於互信息和左右信息熵實現短語抽取23 
2.2 TextRank算法實現短語抽取28 
2.3 LDA算法實現短語抽取31 

第3章自動摘要抽取模型38 
3.1決策樹算法實現自動摘要39 
3.2基於邏輯回歸算法實現自動摘要44 
3.3貝葉斯算法實現自動摘要50 

第4章深度學習——計算任意詞距離模型55 
4.1 FP-Growth算法實現詞距離計算56 
4.2 N-Gram算法實現詞距離計算61 
4.3 BP算法實現詞距離計算65 

第5章拼音漢字混合識別模型70 
5.1貝葉斯模型實現拼音漢字混合識別71 
5.2 HMM模型實現拼音漢字混合識別75 
5.3 RNN神經網絡模型實現拼音漢字混合識別80
 
第6章文本自動生成模型87 
6.1基於關鍵詞的文本自動生成模型88 
6.2 RNN模型實現文本自動 成93 

第2篇自然語言處理系統基礎算法

第7章Dijkstra算法101 
7.1算法應用原理介紹102 
7.2算法數學原理介紹102 
7.3算法源碼說明106 
7.4算法應用擴展107 

第8章AC-DoubleArrayTrie算法108 
8.1算法應用原理介紹109 
8.2算法數學原理介紹111 
8.3算法應用擴展116 

第9章最大熵算法117 
9.1算法應用原理介紹118 
9.2算法數學原理介紹119 
9.3算法源碼說明124 
9.4算法應用擴展125 

第10章CRF算法126 
10.1算法應用原理介紹127 
10.2算法數學原理介紹130 
10.3算法源碼說明135 
10.4算法應用擴展136 

第11章馬爾可夫邏輯網算法137 
11.1算法應用原理介紹138 
11.2算法數學原理介紹142 
11.3算法源碼說明144 
11.4算法應用擴展145 

第12章DIPRE算法147 
12.1算法應用原理介紹148 
12.2算法數學原理介紹151 
12.3算法源碼說明152 
12.4算法應用擴展153

第13章LSTM算法155 
13.1算法應用原理介紹156 
13.2算法數學原理介紹158 
13.3算法源碼說明163 
13.4算法應用擴展165 

第14章TransE算法166 
14.1算法應用原理介紹167 
14.2算法數學原理介紹170 
14.3算法源碼說明172 
14.4算法應用擴展174 

第3篇系統案例實戰

第15章搭建輿情分析與挖掘的系統177 
15.1系統功能設計簡述178 
15.2系統模塊實現詳解181 
15.3系統實現源碼說明186