自然語言處理中的貝葉斯分析, 2/e (Bayesian Analysis in Natural Language Processing, 2/e)
Shay Cohen 楊偉袁科譯譯
- 出版商: 機械工業
- 出版日期: 2020-12-01
- 定價: $534
- 售價: 7.9 折 $422
- 語言: 簡體中文
- 頁數: 236
- 裝訂: 平裝
- ISBN: 7111669576
- ISBN-13: 9787111669579
-
相關分類:
Natural Language Processing
- 此書翻譯自: Bayesian Analysis in Natural Language Processing, 2/e (Paperback)
立即出貨
買這商品的人也買了...
-
貝葉斯方法:概率編程與貝葉斯推斷 (Bayesian Methods for Hackers: Probabilistic Programming and Bayesian Inference)$534$507 -
$474差分進化算法 -
演算法圖鑑:26種演算法 + 7種資料結構,人工智慧、數據分析、邏輯思考的原理和應用 step by step 全圖解$450$356 -
$414Python 貝葉斯分析 -
簡潔的 Python|重構你的舊程式 (Clean Code in Python: Refactor your legacy codebase)$480$379 -
tf.keras 技術者們必讀!深度學習攻略手冊$1,000$850 -
練好深度學習的基本功|用 Python 進行基礎數學理論的實作$560$442 -
寫給大家的統計學|秒懂機率與統計,你也可以是人生勝利組 (Bayesian Statistics the Fun Way: Understanding Statistics and Probability with Star Wars, Lego, and Rubber Ducks)$480$379 -
Effective Python 中文版|寫出良好 Python 程式的 90個具體做法, 2/e (Effective Python: 90 Specific Ways to Write Better Python, 2/e)$580$458 -
$403Python 並行編程實戰, 2/e (Python Parallel Programming Cookbook, 2/e) -
$403機器學習中的概率統計:Python 語言描述 -
統計學習要素:機器學習中的數據挖掘、推斷與預測, 2/e (The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2/e)$954$906 -
大話資料結構:全新彩色版$780$616 -
Kaggle 競賽攻頂秘笈 -- 揭開 Grandmaster 的特徵工程心法,掌握制勝的關鍵技術$1,000$850 -
$236Python 編程練習與解答, 2/e (The Python Workbook: A Brief Introduction with Exercises and Solutions, 2/e) -
$327Python 深度學習 -
$250數據科學博弈論 (Game Theory for Data Science: Eliciting Truthful Information) -
資料科學的建模基礎 : 別急著 coding!你知道模型的陷阱嗎?$599$539 -
核心開發者親授!PyTorch 深度學習攻略 (Deep Learning with Pytorch)$1,000$790 -
$284Python 數據分析與可視化, 2/e (微課視頻版) -
$458貝葉斯統計導論 -
集成式學習:Python 實踐!整合全部技術,打造最強模型 (Hands-On Ensemble Learning with Python: Build highly optimized ensemble machine learning models using scikit-learn and Keras)$750$638 -
$403貝葉斯算法與機器學習 -
$602Python 機器學習原理與算法實現 -
$611Python 貝葉斯分析, 2/e
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書涵蓋了流利閱讀NLP中貝葉斯學習方向的論文以及從事該領域的研究所需的方法和算法。
這些方法和算法部分來自於機器學習和統計學,部分是針對NLP開發的。
我們涵蓋推理技術,如馬爾科夫鏈、蒙特卡羅抽樣和變分推理、貝葉斯估計和非參數建模。
為了應對該領域的快速變化,本書新版增加了一個新的章節,關於貝葉斯背景下的表現學習和神經網絡。
我們還將介紹貝葉斯統計的基本概念,如先驗分佈、共軛性和生成式建模。
後,我們回顧了一些基本的NLP建模技術,如語法建模、神經網絡和表示學習,以及它們在貝葉斯分析中的應用。
作者簡介
謝伊·科恩(Shay Cohen)
愛丁堡大學信息學院語言、認知和計算研究所的講師,他於2000年和2004年在特拉維夫大學分別取得數學和計算機科學學士學位與計算機科學碩士學位,並於2011年在卡內基-梅隆大學取得語言技術博士學位,在哥倫比亞大學(2011~2013)和愛丁堡大學(2013~2018)的博士後研究期間,分別獲得計算創新獎學金和大學校長獎學金。
他的研究方向是自然語言處理和機器學習,重點研究結構化預測中的問題,比如句法和語義解析。
目錄大綱
譯者序
第2版前言
第1版前言
第1版致謝
第1章基礎知識 1
1.1 概率測度 1
1.2 隨機變量 2
1.2.1 連續隨機變量和離散隨機變量 2
1.2.2 多元隨機變量的聯合分佈 3
1.3 條件分佈 4
1.3.1 貝葉斯法則 5
1.3.2 獨立隨機變量與條件獨立隨機變量 6
1.3.3 可交換的隨機變量 6
1.4 隨機變量的期望 7
1.5 模型 9
1.5.1 參數模型與非參數模型 9
1.5.2 模型推斷10
1.5.3 生成模型11
1.5.4 模型中的獨立性假定13
1.5.5 有向圖模型13
1.6 從數據場景中學習15
1.7 貝葉斯學派和頻率學派的哲學(冰山一角) 17
1.8 本章小結17
1.9 習題18
第2章緒論19
2.1 貝葉斯統計與自然語言處理的結合點概述19
2.2 第一個例子:隱狄利克雷分配模型22
2.2.1 狄利克雷分佈26
2.2.2 推斷28
2.2.3 總結29
2.3 第二個例子:貝葉斯文本回歸30
2.4 本章小結31
2.5 習題31
第3章先驗33
3.1 共軛先驗33
3.1.1 共軛先驗和歸一化常數36
3.1.2 共軛先驗在隱變量模型中的應用37
3.1.3 混合共軛先驗38
3.1.4 重新歸一化共軛分佈39
3.1.5 是否共軛的討論39
3.1.6 總結40
3.2 多項式分佈和類別分佈的先驗40
3.2.1 再談狄利克雷分佈41
3.2.2 Logistic正態分佈44
3.2.3 討論48
3.2.4 總結49
3.3 非信息先驗49
3.3.1 均勻不正常先驗50
3.3.2 Jeffreys先驗51
3.3.3 討論51
3.4 共軛指數模型52
3.5 模型中的多參數抽取53
3.6 結構先驗54
3.7 本章小結55
3.8 習題56
第4章貝葉斯估計57
4.1 隱變量學習:兩種觀點58
4.2 貝葉斯點估計58
4.2.1 最大後驗估計59
4.2.2 基於最大後驗解的後驗近似64
4.2.3 決策-理論點估計65
4.2.4 總結66
4.3 經驗貝葉斯66
4.4 後驗的漸近行為68
4.5 本章小結69
4.6 習題69
第5章採樣算法70
5.1 MCMC算法:概述71
5.2 MCMC推斷的自然語言處理模型結構71
5.3 吉布斯採樣73
5.3.1 坍塌吉布斯採樣76
5.3.2 運算符視圖79
5.3.3 並行化的吉布斯採樣器80
5.3.4 總結81
5.4 Metropolis-Hastings算法82
5.5 切片採樣84
5.5.1 輔助變量採樣85
5.5.2 切片採樣和輔助變量採樣在自然語言處理中的應用85
5.6 模擬退火86
5.7 MCMC算法的收斂性86
5.8 馬爾可夫鏈:基本理論88
5.9 MCMC領域外的採樣算法89
5.10 蒙特卡羅積分91
5.11 討論93
5.11.1 分佈的可計算性與採樣93
5.11.2 嵌套的MCMC採樣93
5.11.3 MCMC方法的運行時間93
5.11.4 粒子濾波93
5.12 本章小結95
5.13 習題95
第6章變分推斷97
6.1 邊緣對數似然的變分界97
6.2 平均場近似99
6.3 平均場變分推斷算法100
6.3.1 狄利克雷-多項式變分推斷101
6.3.2 與期望最大化算法的聯繫104
6.4 基於變分推斷的經驗貝葉斯106
6.5 討論106
6.5.1 推斷算法的初始化107
6.5.2 收斂性診斷107
6.5.3 變分推斷在解碼中的應用107
6.5.4 變分推斷最小化KL散度108
6.5.5 在線的變分推斷109
6.6 本章小結109
6.7 習題109
第7章非參數先驗111
7.1 狄利克雷過程:三種視角112
7.1.1 折棍子過程112
7.1.2 中餐館過程114
7.2 狄利克雷過程混合模型115
7.2.1 基於狄利克雷過程混合模型的推斷116
7.2.2 狄利克雷過程混合是混合模型的極限118
7.3 層次狄利克雷過程119
7.4 Pitman?Yor過程120
7.4.1 Pitman-Yor過程用於語言建模121
7.4.2 Pitman-Yor過程的冪律行為122
7.5 討論123
7.5.1 高斯過程124
7.5.2 印度自助餐過程124
7.5.3 嵌套的中餐館過程125
7.5.4 距離依賴的中餐館過程125
7.5.5 序列記憶器126
7.6 本章小結126
7.7 習題127
第8章貝葉斯語法模型128
8.1 貝葉斯隱馬爾可夫模型129
8.2 概率上下文無關語法131
8.2.1 作為多項式分佈集的PCFG 133
8.2.2 PCFG的基本推斷算法133
8.2.3 作為隱馬爾可夫模型的PCFG 136
8.3 貝葉斯概率上下文無關語法137
8.3.1 PCFG的先驗137
8.3.2 貝葉斯PCFG的蒙特卡羅推斷138
8.3.3 貝葉斯PCFG的變分推斷139
8.4 適配器語法140
8.4.1 Pitman-Yor適配器語法141
8.4.2 PYAG的折棍子視角142
8.4.3 基於PYAG的推斷143
8.5 層次狄利克雷過程PCFG 144
8.6 依存語法147
8.7 同步語法148
8.8 多語言學習149
8.8.1 詞性標註149
8.8.2 語法歸納151
8.9 延伸閱讀152
8.10 本章小結153
8.11 習題153
第9章表徵學習與神經網絡155
9.1 神經網絡與表徵學習:為什麼是現在155
9.2 詞嵌入158
9.2.1 詞嵌入的skip-gram模型158
9.2.2 貝葉斯skip-gram詞嵌入160
9.2.3 討論161
9.3 神經網絡162
9.3.1 頻率論估計和反向傳播算法164
9.3.2 神經網絡權值的先驗166
9.4 神經網絡在自然語言處理中的現代應用168
9.4.1 循環神經網絡和遞歸神經網絡168
9.4.2 梯度消失與梯度爆炸問題169
9.4.3 神經編碼器-解碼器模型172
9.4.4 捲積神經網絡175
9.5 調整神經網絡177
9.5.1 正則化177
9.5.2 超參數調整178
9.6 神經網絡生成建模180
9.6.1 變分自編碼器180
9.6.2 生成對抗網絡185
9.7 本章小結186
9.8 習題187
結束語189
附錄A 基本概念191
附錄B 概率分佈清單197
參考文獻203
