語音識別理論與實踐
莫宏偉
- 出版商: 中國水利水電
- 出版日期: 2023-10-31
- 定價: $252
- 售價: 8.5 折 $214
- 語言: 簡體中文
- 頁數: 180
- 裝訂: 平裝
- ISBN: 7522619025
- ISBN-13: 9787522619026
-
相關分類:
語音辨識 Speech-recognition
立即出貨
買這商品的人也買了...
-
秋聲教你玩 -- C語言底層破解基礎篇 : 給挑戰者的11堂課$320$250 -
$230語音信號處理, 3/e -
$539直擊招聘 : 程序員面試筆試數據結構深度解析 -
秋聲教你玩組合語言 : 指令精華篇$450$351 -
管理資訊系統概論, 13/e (Laudon: Essentials of Mis, 13/e)$580$568 -
$505低功耗藍牙智能硬件開發實戰 -
語音信號處理, 3/e$534$507 -
$594實時語音處理實踐指南 -
$301圖解語音識別 -
TQC+ Python 3.x 機器學習基礎與應用特訓教材$590$466 -
$862人與機器聽覺:聽見聲音的意義 -
現代 C++ 語言核心特性解析$719$683 -
$517C++20 高級編程 -
Hey Siri 及 Ok Google原理 - AI語音辨識專案真應用開發$880$695 -
$759Android Studio 開發實戰:從零基礎到 App 上線, 3/e -
人手一本的資安健診實作課:不是專家也能自己動手做!(Win10 / Win11適用)$560$560 -
$414語音識別:原理與應用, 2/e -
語音辨識:模式、演算法設計與實踐$594$564 -
跟 NVIDIA 學深度學習!從基本神經網路到 ......、GPT、BERT...,紮穩機器視覺與大型語言模型 (LLM) 的建模基礎$880$748 -
$250智能語音應用開發 -
$414PyTorch 語音識別實戰 -
數位訊號處理 - Python 程式實作, 3/e (附範例光碟)$620$558 -
Vue3 從零開始:基礎邁向實務$780$616 -
CPython 設計與實現$599$569 -
Android 智能座艙開發:從源碼到實踐$594$564
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書主要介紹語音識別原理及其相關應用。
全書共9章,分為五大部分:
第一部分(第1章)介紹語音識別的發展歷史和語音識別領域常用的數據集與工具箱;
第二部分(第2章)介紹在語音識別領域常用的語音信號基礎知識和聲學特徵的提取;
第三部分(第3章至第7章)詳細介紹語音識別的聲學模型、語言模型、
解碼工具,並對語音識別領域的研究熱點(端到端語音識別)進行探討;
第四部分(第8章)利用語音識別開源工具包Kaldi進行語音識別實戰,包括Kaldi的安裝以及如何訓練aishell語音識別工程;
第五部分(第9章)結合序列到序列的語音識別模型和序列到序列的問答模型來構建語音交互系統。
本書既可作為計算機科學與技術、電子科學與技術、控制工程與科學、智能科學與技術等專業的本科教材,
也可作為研究生教材,還可供從事語音識別、人工智能等研究的科研人員參考。
目錄大綱
前言
第1章緒論
1.1 語音辨識簡史
1.1.1 語音辨識早期探索
1.1.2 機率模型一統江湖
1.1.3 神經網絡異軍突起
1.1.4 商業應用推波助瀾
1.2 國內發展現狀
1.3 語音辨識框架
1.3.1 經典方法
1.3 .2 機率模型
1.3.3 深度神經網絡一隱馬可夫(DNN—HMM)模型
1.3.4 端對端語音辨識
1.4 開源工具與資料集
1.4.1 深度學習架構
1.4.2 開源工具
1.4.3 資料集
本章小結
課後習題
第2章語音基礎知識
2.1 語音訊號基礎
2.1.1 聲波的特性
2.1.2 聲音的擷取裝置
2.1.3 聲音的取樣
2.1.4 聲音的量化
2.1.5 語音的編碼
2.2 聲學特徵擷取
2.2.1 預處理
2.2.2 傅立葉變換
2.2.3 聽覺特性
2.2.4 線性預測
2.2.5 倒譜分析
2.2.6 聲學特徵
本章小結
課後習題
第3章聲學模型
3.1 高斯混合模型
3.1. 1 機率統計
3.1.2 高斯分佈
3.1.3 GMM的組成與表示
3.2 隱馬可夫模型
3.2.1 隱馬可夫模型基本概念
3.2.2 隱馬可夫模型的定義
3.2.3 隱馬可夫模型的三個基本問題
3.3 高斯混合模型一隱馬可夫模型
3.4 基於隱馬可夫模型的語音辨識
3.4.1 建模單元
3.4.2 發音過程與隱馬可夫模型狀態
3.4.3 串接隱馬爾可夫模型
本章小結
課後習題
第4章語言模型
4.1 n—gram模型
4.2 評估指標
4.3 平滑技術
4.3.1 Good—Turing折扣法
4.3.2 Jelinek—Mercer插值法
4.3.3 Kneser—Ney內插法
4.3. 4 Katz回退法
4.4 語言模型的訓練
4.5 預訓練語言模型
4.5.1 基於自回歸語言模型的預訓練技術
4.5.2 基於自編碼語言模型的預訓練技術
4.5.3 基於序列到序列語言模型的預訓練技術
4.5.4 基於前綴語言模型的預訓練技術
4.5.5 基於排列語言模型的預訓練技術
4.5.6 預訓練技術的改進方法
本章小結 課後
習題
第5章加權有限狀態解碼器
5.1 基於動態網絡的Viterbi解碼
5.2 加權有限狀態轉換器理論
5.2.1 基本概念
5.2.2 半環
5.3 HCLG建構
5.3.1 語料準備
5.3.2 建構語法模型
5.3.3 建構發音字典模型
5.3.4 合併發音字典與語法模型
5.3.5 建構情境模型與發音字典模型與文法模型
5.3.6 建構HCLG
本章小結
課後習題
第6章深度神經網絡模型
6.1 深度學習
6.2 神經網絡
6.2.1 人腦神經網絡
6.2.2 人工神經網絡
6.2 .3 神經網絡的發展歷史
6.2.4 深度神經網絡
6.3 正向學習過程
6.3.1 正向學習概述
6.3.2 正向傳播的流程
6.3.3 正向傳播的原理
6.4 反向調整過程
6.4.1 反向調整概述
6.4.2 反向傳播過程詳解
6.4.3 深層模型反向調整的問題與對策
6.5 神經網絡結構
6.5.1 捲積神經網絡
6.5.2 長短時間記憶網絡
6.5.3 門控循環單元
6.5.4 時延神經網絡
本章小結
課後習題
第7章端對端語音辨識
7.1 CTC
7.2 RNN
7.3 Encoder.Decoder框架與Attention模型
7.4 Hybrid CTC/Attention
7.5 Transforxner
本章小結
課後習題
第8章Kaldi實戰
