Python 自然語言處理實戰:核心技術與算法 Python自然语言处理实战:核心技术与算法
塗銘, 劉祥, 劉樹春
- 出版商: 機械工業
- 出版日期: 2018-05-01
- 定價: $414
- 售價: 8.5 折 $352
- 語言: 簡體中文
- 頁數: 280
- 裝訂: 平裝
- ISBN: 7111597672
- ISBN-13: 9787111597674
-
相關分類:
Python、Text-mining、Natural Language Processing
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$659Python 自然語言處理 (Natural Language Processing with Python) -
$250Python 機器學習及實踐 --- 從零開始通往 Kaggle 競賽之路 -
$588NLP 漢語自然語言處理原理與實踐 -
寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)$390$308 -
$280精通 Python 自然語言處理 (Mastering Natural Language Processing with Python) -
$474深度學習入門之 PyTorch -
$474OpenCV 算法精解:基於 Python 與 C++ -
為你自己學 Git$500$390 -
$301自然語言處理技術入門與實戰 -
自然語言處理:用人工智慧看懂中文$690$587 -
$294自然語言處理與深度學習:通過 C語言模擬 -
$147程序員的數學 -
$611深度捲積網絡 : 原理與實踐 -
$327文本上的算法 深入淺出自然語言處理 -
精通數據科學 從線性回歸到深度學習$594$564 -
人工智能基礎 (高中版)(*封面書況瑕疵,不介意再下單)$210$200 -
Python 資料科學與人工智慧應用實務$650$553 -
$308GAN : 實戰生成對抗網絡 -
Python 深度學習實作:Keras 快速上手$500$390 -
$403自然語言處理理論與實戰 -
$714Python 深度學習 (Deep Learning with Python) -
$714機器學習實戰:基於 Scikit-Learn 和 TensorFlow (Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques for Building Intelligent Systems) -
$403Python 自然語言處理 -
$327面向自然語言處理的深度學習:用 Python 創建神經網絡 (Deep Learning for Natural Language Processing: Creating Neural Networks with Python) -
Deep Learning 2|用 Python 進行自然語言處理的基礎理論實作$680$537
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
這是一本自然語言處理理論和實踐完美結合的教材。
讀者在瞭解自然語言處理全貌的同時,可以根據本書的一些實踐案例快速上手並應用於自己的項目中。
作者結合自己的實踐經驗,重點介紹了真實場景下快速構建一些自然語言處理項目所需的技能,並提供了一些工具推薦或算法實現。
本書著眼於實際應用場景,主要介紹了分詞、詞性標註和名實體識別、句法分析等基本技術,並通過剖析近年來在自然語言處理領域大放光彩的深度學習技術,力求快速地帶領讀者入門自然語言處理。
作者在後還通過在大數據平臺上的實戰項目,完整呈現了真實場景下自然語言處理項目的整個環節,以供讀者參考。
作者簡介
塗銘,阿裡巴巴數據架構師,對大數據、自然語言處理、Python、Java相關技術有深入的研究,積累了豐富的實踐經驗。曾就職於北京明略數據,是大數據方面的高級諮詢顧問。
在工業領域參與了設備故障診斷項目,在零售行業參與了精準營銷項目。在自然語言處理方面,擔任導購機器人項目的架構師,主導開發機器人的語義理解、短文本相似度匹配、上下文理解,以及通過自然語言檢索產品庫,在項目中構建了NoSQL+文本檢索等大數據架構,同時也負責問答對的整理和商品屬性的提取,帶領NLP團隊構建語義解析層。劉祥,百煉智能自然語言處理專家,主要研究知識圖譜、NLG等前沿技術,參與機器自動寫作產品的研發與設計。
曾在明略數據擔當數據技術合夥人兼數據科學家,負責工業、金融等業務領域的數據挖掘工作,在這些領域構建了諸如故障診斷、關聯賬戶分析、新聞推薦、商品推薦等模型。
酷愛新技術,活躍於開源社區,是SparkMLlib和Zeppelin的Contributor。劉樹春,七牛雲高級算法專家,七牛AI實驗室NLP&OCR方向負責人,主要負責七牛NLP以及OCR相關項目的研究與落地。在七牛人工智能實驗室工作期間,參與大量NLP相關項目,例如知識圖譜、問答系統、文本摘要、語音相關係統等;同時重點關註NLP與CV的交叉研究領域,主要包括視覺問答(VQA),圖像標註(Image Caption)等前沿問題。
曾在Intel DCSG數據與雲計算部門從事機器學習與雲平臺的融合開發,項目獲得IDF大獎。碩士就讀於華東師範大學機器學習實驗室,在校期間主攻機器學習、機器視覺、圖像處理,並在相關國際會議發表多篇SCI/EI論文。
目錄大綱
目錄
序一
序二
前言
第1章NLP基礎1
1.1什麼是NLP 1
1.1.1 NLP的概念1
1.1.2 NLP的研究任務3
1.2 NLP的發展歷程5
1.3 NLP相關知識的構成7
1.3.1基本術語7
1.3.2知識結構9
1.4語料庫10
1.5探討NLP的幾個層面11
1.6 NLP與人工智能13
1.7本章小結15
第2章NLP前置技術解析16
2.1搭建Python開發環境16
2.1.1 Python的科學計算發行版——Anaconda 17
2.1.2 Anaconda的下載與安裝19
2.2正則表達式在NLP的基本應用21
2.2.1匹配字符串22
2.2.2使用轉義符26
2.2.3抽取文本中的數字26
2.3 Numpy使用詳解27
2.3.1創建數組28
2.3.2獲取Numpy中數組的維度30
2.3.3獲取本地數據31
2.3.4正確讀取數據32
2.3.5 Numpy數組索引32
2.3.6切片33
2.3.7數組比較33
2.3.8替代值34
2.3.9數據類型轉換36
2.3.10 Numpy的統計計算方法36
2.4本章小結37
第3章中文分詞技術38
3.1中文分詞簡介38
3.2規則分詞39
3.2.1正向最大匹配法39
3.2.2逆向最大匹配法40
3.2.3雙向最大匹配法41
3.3統計分詞42
3.3.1語言模型43
3.3.2 HMM模型44
3.3.3其他統計分詞算法52
3.4混合分詞52
3.5中文分詞工具——Jieba 53
3.5.1 Jieba的三種分詞模式54
3.5.2實戰之高頻詞提取55
3.6本章小結58
第4章詞性標註與命名實體識別59
4.1詞性標註59
4.1.1詞性標註簡介59
4.1.2詞性標註規範60
4.1.3 Jieba分詞中的詞性標註61
4.2命名實體識別63
4.2.1命名實體識別簡介63
4.2.2基於條件隨機場的命名實體識別65
4.2.3實戰一:日期識別69
4.2.4實戰二:地名識別75
4.3總結84
第5章關鍵詞提取算法85
5.1關鍵詞提取技術概述85
5.2關鍵詞提取算法TF/IDF算法86
5.3 TextRank算法88
5.4 LSA/LSI/LDA算法91
5.4.1 LSA/LSI算法93
5.4.2 LDA算法94
5.5實戰提取文本關鍵詞95
5.6本章小結105
第6章句法分析106
6.1句法分析概述106
6.2句法分析的數據集與評測方法107
6.2.1句法分析的數據集108
6.2.2句法分析的評測方法109
6.3句法分析的常用方法109
6.3.1基於PCFG的句法分析110
6.3.2基於最大間隔馬爾可夫網絡的句法分析112
6.3.3基於CRF的句法分析113
6.3.4基於移進–歸約的句法分析模型113
6.4使用Stanford Parser的PCFG算法進行句法分析115
6.4. 1 Stanford Parser 115
6.4.2基於PCFG的中文句法分析實戰116
6.5本章小結119
第7章文本向量化120
7.1文本向量化概述120
7.2向量化算法word2vec 121
7.2.1神經網絡語言模型122
7.2.2 C&W模型124
7.2.3 CBOW模型和Skip-gram模型125
7.3向量化算法doc2vec/str2vec 127
7.4案例:將網頁文本向量化129
7.4.1詞向量的訓練129
7.4.2段落向量的訓練133
7.4.3利用word2vec和doc2vec計算網頁相似度134
7.5本章小結139
第8章情感分析技術140
8.1情感分析的應用141
8.2情感分析的基本方法142
8.2.1詞法分析143
8.2.2機器學習方法144
8.2.3混合分析144
8.3實戰電影評論情感分析145
8.3.1捲積神經網絡146
8.3.2循環神經網絡147
8.3.3長短時記憶網絡148
8.3.4加載數據150
8.3.5輔助函數154
8.3.6模型設置155
8.3.7調參配置158
8.3.8訓練過程159
8.4本章小結159
第9章NLP中用到的機器學習算法160
9.1簡介160
9.1.1機器學習訓練的要素161
9.1.2機器學習的組成部分162
9.2幾種常用的機器學習方法166
9.2.1文本分類166
9.2.2特徵提取168
9.2.3標註169
9.2.4搜索與排序170
9.2.5推薦系統170
9.2.6序列學習172
9.3分類器方法173
9.3.1樸素貝葉斯Naive Bayesian 173
9.3.2邏輯回歸174
9.3.3支持向量機175
9.4無監督學習的文本聚類177
9.5文本分類實戰:中文垃圾郵件分類180
9.5.1實現代碼180
9.5.2評價指標187
9.6文本聚類實戰:用K-means對豆瓣讀書數據聚類190
9.7本章小結194
第10章基於深度學習的NLP算法195
10.1深度學習概述195
10.1.1神經元模型196
10.1.2激活函數197
10.1.3感知機與多層網絡198
10.2神經網絡模型201
10.3多輸出層模型203
10.4反向傳播算法204
10.5最優化算法208
10.5.1梯度下降208
10.5.2隨機梯度下降209
10.5.3批量梯度下降210
10.6丟棄法211
10.7激活函數211
10.7.1 tanh函數212
10.7.2 ReLU函數212
10.8實現BP算法213
10.9詞嵌入算法216
10.9.1詞向量217
10.9.2 word2vec簡介217
10.9.3詞向量模型220
10.9.4 CBOW和Skip-gram模型222
10.1
