自然語言處理基礎教程
王剛,郭蘊,王晨
- 出版商: 機械工業
- 出版日期: 2021-11-01
- 定價: $414
- 售價: 8.5 折 $352
- 語言: 簡體中文
- 頁數: 232
- 裝訂: 平裝
- ISBN: 7111692594
- ISBN-13: 9787111692591
-
相關分類:
Natural Language Processing
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
Python 資料運算與分析實戰:一次搞懂 NumPy, SciPy, Matplotlib, Pandas 最強套件$590$502 -
用 Python 實作強化學習|使用 TensorFlow 與 OpenAI Gym (Hands-On Reinforcement Learning with Python)$520$411 -
自然語言處理入門$594$564 -
$559知識圖譜:概念與技術 -
強化式學習:打造最強 AlphaZero 通用演算法$780$663 -
$505深度學習與圍棋 -
$505實戰低代碼 -
Power BI 入門 大數據視覺化 + 智慧決策 + 雲端分享 王者歸來 (全彩印刷)$620$490 -
基於 BERT 模型的自然語言處理實戰$828$787 -
$236數據結構基礎教程 (Python版) -
Big Data 大數據分析使用 Power BI 視覺化應用與 Azure 雲端平台$520$468 -
$534每個人的 Python : 數學、算法和遊戲編程訓練營 -
$407從 Power BI 到 Analysis Services:企業級數據分析實戰 -
$374人工智能數學基礎與 Python 機器學習實戰 -
$356Python 自然語言處理 (微課版) -
$284Python App 網絡編程項目實戰 (微課視頻版) -
$331從零開始構建深度前饋神經網絡(Python+TensorFlow 2.x) -
$615PyTorch 深度學習和圖神經網絡 捲2 開發應用 -
$615PyTorch 深度學習和圖神經網絡 捲1 基礎知識 -
寫給新手的深度學習2 — 用 Python 實現的循環神經網絡 RNN 和 VAE、GAN$539$512 -
$305Python 中文自然語言處理基礎與實戰 -
$403可解釋機器學習:模型、方法與實踐 -
$509Python 自然語言處理入門 -
$280自然語言處理實踐 -
全中文自然語言處理:Pre-Trained Model 方法最新實戰$880$695
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書面向初學者介紹了自然語言處理的基礎知識,包括詞法分析、句法分析、基於機器學習的文本分析、
深度學習與神經網絡、詞嵌入與詞向量以及自然語言處理與捲積神經網絡、循環神經網絡技術及應用。
本書深入淺出,案例豐富,可作為高校人工智能、大數據、計算機及相關專業本科生的教材,
也可供對自然語言處理有興趣的技術人員作為參考書。
作者簡介
王剛,博士,南開大學電腦學院講師,碩士生導師。研究方向包括機器學習、自然語言處理等。天津市級一流課程負責人,天津市級教學團隊成員,主持並參與國家級和省部級校企計畫、教改項目10餘項,發表科研和教學論文9篇,主持並參與編寫教材十餘部。
目錄大綱
目錄
前言
第1章 自然語言處理概述1
1.1 自然語言處理的基本概念1
1.1.1 什麼是自然語言處理1
1.1.2 自然語言處理的層次2
1.1.3 自然語言處理的發展歷程3
1.2 自然語言處理技術面臨的困難6
1.2.1 歧義6
1.2.2 知識的獲取、表達及運用7
1.2.3 計算問題8
1.3 自然語言處理的主要研究任務和應用8
1.3.1 自然語言處理的主要研究任務8
1.3.2 自然語言處理的典型應用10
1.4 搭建自然語言處理開發環境11
1.4.1 Anaconda11
1.4.2 scikit-learn15
1.4.3 Jupyter tebook15
1.5 本章小結16
1.6 習題17
第2章 詞法分析18
2.1 什麼是詞法分析18
2.2 分詞19
2.2.1 中文分詞簡介19
2.2.2 基於詞典的分詞方法20
2.2.3 基於統計的分詞方法21
2.2.4 實例—使用N-gram語言模型進行語法糾正24
2.2.5 中文分詞工具簡介27
2.2.6 實例—使用jieba進行高頻詞提取30
2.3 關鍵詞提取32
2.3.1 TF-IDF算法32
2.3.2 TetRank算法33
2.3.3 實例—提取文本關鍵詞34
2.4 詞性標註40
2.4.1 詞性標註簡介40
2.4.2 隱馬爾可夫模型41
2.4.3 Viterbi算法43
2.4.4 大熵模型44
2.5 命名實體識別46
2.5.1 命名實體識別簡介46
2.5.2 條件隨機場模型47
2.5.3 實例—使用jieba進行日期識別48
2.6 本章小結52
2.7 習題53
第3章 句法分析54
3.1 什麼是句法分析54
3.2 句法分析樹庫及性能評測56
3.2.1 句法分析語料庫56
3.2.2 句法分析模型的性能評測59
3.3 概率上下文無關文法59
3.4 依存句法分析62
3.4.1 基於圖模型的依存句法分析63
3.4.2 基於轉移模型的依存句法分析63
3.5 中文句法分析工具簡介65
3.6 實例—中文句法分析66
3.7 本章小結68
3.8 習題68
第4章 基於機器學習的文本分類69
4.1 機器學習簡介69
4.1.1 scikit-learn簡介71
4.1.2 機器學習基本概念72
4.1.3 機器學習問題分類73
4.2 樸素貝葉斯分類器76
4.3 邏輯回歸分類器80
4.4 支持向量機分類器84
4.5 文本聚類89
4.6 實例—垃圾郵件分類94
4.7 本章小結99
4.8 習題99
第5章 深度學習與神經網絡101
5.1 深度學習與神經網絡簡介101
5.2 人工神經網絡102
5.2.1 生物神經元102
5.2.2 感知器103
5.2.3 激活函數105
5.2.4 神經網絡110
5.3 前饋神經網絡110
5.3.1 前饋神經網絡的結構110
5.3.2 前向傳播111
5.3.3 損失函數112
5.3.4 反向傳播算法113
5.3.5 優化方法114
5.4 深度學習框架116
5.4.1 TensorFlow116
5.4.2 Keras118
5.4.3 PyTorch119
5.4.4 PaddlePaddle120
5.5 實例—使用MLP實現手寫數字識別122
5.5.1 數據準備122
5.5.2 創建MLP122
5.5.3 模型訓練123
5.5.4 模型評價124
5.6 本章小結125
5.7 習題126
第6章 詞嵌入與詞向量127
6.1 文本向量化127
6.2 One-Hot編碼128
6.3 詞嵌入130
6.3.1 什麼是詞嵌入130
6.3.2 詞嵌入的實現131
6.3.3 語義信息132
6.4 Word2Vec133
6.4.1 Word2Vec簡介133
6.4.2 Word2Vec的應用134
6.4.3 使用gensim包訓練詞向量136
6.5 Doc2Vec138
6.5.1 PV-DM139
6.5.2 PV-DBOW140
6.6 實例—利用Doc2Vec計算文檔相似度140
6.6.1 準備語料庫140
6.6.2 定義和訓練模型141
6.6.3 分析文本相似度142
6.7 本章小結145
6.8 習題145
第7章 捲積神經網絡與自然語言處理146
7.1 捲積神經網絡簡介146
7.1.1 深層神經網絡用於圖像處理存在的問題146
7.1.2 什麼是捲積148
7.1.3 填充150
7.1.4 步長151
7.1.5 什麼是捲積神經網絡151
7.2 應用捲積神經網絡解決自然語言處理問題152
7.2.1 NLP中的捲積層152
7.2.2 NLP中的池化層154
7.2.3 NLP中CNN的基本架構155
7.3 CNN在應用中的參數選擇156
7.3.1 激活函數156
7.3.2 捲積核的大小和個數156
7.3.3 dropout層156
7.3.4 softma分類器157
7.4 實例—使用CNN實現新聞文本分類158
7.4.1 準備數據158
7.4.2 定義和訓練模型163
7.5 本章小結165
7.6 習題166
第8章 循環神經網絡與自然語言處理167
8.1 循環神經網絡的基本結構168
8.2 循環神經網絡應用於自然語言處理170
8.2.1 序列到類別170
8.2.2 同步序列到序列171
8.2.3 異步序列到序列172
8.3 循環神經網絡的訓練173
8.3.1 隨時間反向傳播算法173
8.3.2 權重的更新174
8.3.3 梯度消失與梯度爆炸175
8.4 長短期記憶網絡175
8.4.1 細胞狀態177
8.4.2 門控機制 177
8.5 門控循環單元網絡 181
8.6 更深的網絡184
8.6.1 堆疊循環神經網絡184
8.6.2 雙向循環神經網絡185
8.7 實例—使用LSTM網絡實現文本情感分析186
8.7.1 數據準備186
8.7.2 構建和訓練模型187
8.8 本章小結190
8.9 習題191
第9章 序列到序列模型與註意力機制192
9.1 序列到序列模型192
9.1.1 什麼是序列到序列模型192
9.1.2 編碼–解碼架構193
9.1.3 編碼器194
9.1.4 解碼器195
9.1.5 模型訓練197
9.2 註意力機制198
9.2.1 什麼是註意力機制198
9.2.2 計算語義向量200
9.2.3 自註意力機制200
9.2.4 Transformer模型202
9.3 實例—基於註意力機制的機器翻譯203
9.3.1 準備數據203
9.3.2 構建並訓練模型207
9.3.3 使用模型進行翻譯211
9.4 本章小結212
9.5 習題213
參考文獻215
