深度學習與音樂生成 Deep Learning Techniques for Music Generation
[法]讓·皮埃爾·布賴特(Jean-Pierre Briot),[法]加埃坦·哈傑裡斯(Ga?tan Hadjeres),[法]弗朗索瓦·大衛·帕凱特(Fran?ois-
- 出版商: 清華大學
- 出版日期: 2023-04-01
- 定價: $474
- 售價: 8.5 折 $403
- 語言: 簡體中文
- ISBN: 7302627231
- ISBN-13: 9787302627234
-
相關分類:
DeepLearning
- 此書翻譯自: Deep Learning Techniques for Music Generation
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
Raspberry Pi 超炫專案與完全實戰, 2/e$580$458 -
Unity 3D 遊戲設計實戰, 2/e (適用Unity 5.X)$620$490 -
深度學習快速入門 — 使用 TensorFlow (Getting started with TensorFlow)
$360$281 -
職業駭客的修練 ─ 指標實務篇 : 從門外漢到職業駭客的最短路程,收錄作者心得$490$382 -
Tor And The Deep Web: The Complete Guide To Stay Anonymous In The Dark Net$760$722 -
打下最紮實的 AI 基礎:從 scikit-learn 一步一腳印$560$476 -
機器學習工程師面試全破解:嚴選 124道 AI 演算法決勝題完整剖析$650$507 -
極詳細 + 超深入:最新版 TensorFlow 1.x/2.x 完整工程實作$1,200$948 -
機器學習的數學基礎 : AI、深度學習打底必讀$580$458 -
特徵工程不再難:資料科學新手也能輕鬆搞定! (Feature Engineering Made Easy: Identify unique features from your dataset in order to build powerful machine learning systems)$520$406 -
生成深度學習|訓練機器繪畫、作曲、寫作與玩遊戲 (Generative Deep Learning)$580$458 -
$454音樂聲學與心理聲學, 4/e -
GAN 對抗式生成網路 (GANs in Action: Deep learning with Generative Adversarial Networks)$750$593 -
強化式學習:打造最強 AlphaZero 通用演算法$780$663 -
$454AI 探視人類情感原理與實踐 — 人工智能驅動的音樂信息檢索 -
GPU 編程實戰 : 基於 Python 和 CUDA (Hands-On GPU Programming with Python and CUDA: Boost your application's performance and productivity with CUDA: Explore high-performance parallel computing with CUDA)$479$455 -
TensorFlow + Android 經典模型從理論到實戰 (微課視頻版)$539$512 -
Smaller C|用於小型機器之精實程式碼 (Smaller C: Lean Code for Small Machines)$680$537 -
ROS 機械臂開發與實踐$468$445 -
持續買進:資料科學家的投資終極解答,存錢及致富的實證方法$400$316 -
約耳趣談軟體 (Joel on Software)$580$435 -
現代 Linux 學習手冊 (Learning Modern Linux: A Handbook for the Cloud Native Practitioner)$580$458 -
TVM 編譯器原理與實踐$714$678 -
Python 推薦系統實戰:基於深度學習、NLP 和圖算法的應用型推薦系統$594$564 -
$419特徵工程訓練營
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
一、大致內容:本書主要講述了深度學習在音樂生成領域的研究意義、具體方法、方向目標、表現力、挑戰策略、框架融合等,對於表現力與框架融合方面作了更詳細的描述;表現力部分講了深度學習與音樂生成相結合的方式策略、該領域研究結果的評判標準以及交叉知識的具體體現,是本書籍新穎立意的重要部分。二:特色:將音樂生成和深度學習相融合,是一個新穎研究方向,而本書沒有拘泥於使用哪種框架進行實現,而是對比了多種實現方式,提供了多方面的思路,對於後續學者的探究有很強的引導作用。三:讀者對象:本書對於對音樂感興趣的人以及對深度學習前沿方向的學者有好的學習價值,能夠開拓他們的視野,對廣大的音樂和電腦愛好者均有較大的參考價值。
目錄大綱
目錄
第1章引言1
1.1動機2
1.1.1基於電腦的音樂系統2
1.1.2自主創作與輔助創作3
1.1.3符號化人工智能與次符號化人工智能4
1.1.4深度學習4
1.1.5現狀和未來5
1.2這本書是講什麼的5
1.2.1其他書籍和資料來源5
1.2.2其他模型6
1.2.3深度學習與馬爾可夫模型6
1.2.4學習需求和路線圖7
1.2.5本書涉及的範圍8第2章方法9
2.1五個維度9
2.1.1目標9
2.1.2表示9
2.1.3架構9
2.1.4挑戰10
2.1.5策略10
2.2討論10第3章目標11
3.1屬性11
3.1.1音樂類型11
3.1.2目標與應用12
3.1.3生成模式12
3.1.4音樂風格13第4章表示14
4.1數據的階段和類型14
4.2音頻數據與符號化數據15
4.3基於音頻的表示16
4.3.1波形表示16
4.3.2轉換表示17
4.3.3聲音頻譜圖17
4.3.4聲色譜圖17
4.4符號化表示18
4.5主要概念19
4.5.1音符19
4.5.2休止符19
4.5.3音程20
4.5.4和弦20
4.5.5節奏21
4.6多聲部/多軌道22
4.7音樂格式22
4.7.1MIDI格式22
4.7.2鋼琴打孔紙捲格式23
4.7.3文本格式24
4.7.4標記語言26
4.7.5領譜26
4.8時間範圍和粒度28
4.8.1時間範圍28
4.8.2時間粒度29
4.9元數據29
4.9.1音符保持/結束30
4.9.2音名錶示(與異名同音)31
4.9.3特徵提取31
4.10音樂表現力32
4.10.1時間節奏32
4.10.2音樂力度32
4.10.3音頻33
4.11編碼33
4.11.1編碼策略33
4.11.2OneHot、ManyHot及MultiOneHot編碼34
4.11.3編碼小結34
4.11.4Binning35
4.11.5優缺點35
4.11.6和弦36
4.11.7特殊的音符保持與休止符36
4.11.8鼓和打擊樂器37
4.12數據集37
4.12.1移調和對齊37
4.12.2音樂數據集和語料庫38第5章架構39
5.1神經網絡簡介40
5.1.1線性回歸40
5.1.2符號41
5.1.3模型訓練41
5.1.4梯度下降訓練算法42
5.1.5從模型到體系架構43
5.1.6從模型到線性代數表示43
5.1.7從簡單模型到多元模型44
5.1.8激活函數45
5.2基本組件47
5.2.1前饋計算47
5.2.2同時計算多個輸入數據48
5.3機器學習48
5.3.1定義48
5.3.2機器學習分類49
5.3.3組成50
5.3.4優化50
5.4體系架構50
5.5多層神經網絡50
5.5.1抽象表示法51
5.5.2深度52
5.5.3輸出激活函數54
5.5.4代價函數54
5.5.5解釋55
5.5.6熵與交叉熵58
5.5.7前饋傳播60
5.5.8訓練61
5.5.9過擬合61
5.5.10正則化62
5.5.11超參數62
5.5.12平臺和庫63
5.6自動編碼器63
5.6.1稀疏自動編碼器64
5.6.2變分自動編碼器65
5.6.3堆棧式自動編碼器69
5.7受限玻爾茲曼機69
5.7.1訓練70
5.7.2採樣70
5.7.3變量的類型71
5.8遞歸神經網絡71
5.8.1可視表示73
5.8.2訓練73
5.8.3長短時記憶(LSTM)74
5.8.4註意力機制75
5.9捲積架構模式76
5.9.1原理76
5.9.2捲積的階段77
5.9.3池化77
5.9.4多層捲積結構77
5.9.5基於時變的捲積78
5.10基於調控的架構模式78
5.11生成對抗網絡(GAN)體系架構模式80
5.12強化學習82
5.13復合架構83
5.13.1復合的類型83
5.13.2雙向RNN84
5.13.3RNN編碼器解碼器85
5.13.4變分RNN編碼器解碼器86
5.13.5面向復調的循環網絡87
5.13.6進一步的復合架構87
5.13.7組合的局限性87第6章挑戰及策略88
6.1架構和表示維度的符號88
6.2入門示例89
6.2.1單步前饋策略89
6.2.2示例: MiniBach——《聖詠曲》對位伴奏符號音樂生成系統89
6.2.3第一個分析91
6.3局限性及挑戰92
6.4基於Ex Nihilo的生成92
6.4.1解碼器前饋93
6.4.2採樣95
6.5音樂長度的可變性97
6.6音樂內容的可變性101
6.7音樂表現力106
6.8RNN與疊代前饋的再探討108
6.8.1#1示例: TimeWindowed——旋律符號音樂生成系統108
6.8.2#2示例: Sequential——旋律符號音樂生成系統109
6.8.3#3示例: BLSTM——和弦伴奏符號音樂生成系統111
6.8.4總結114
6.9旋律和弦交互114
6.9.1#1示例: RNNRBM——面向復調的符號音樂生成系統114
6.9.2#2示例: Hexahedria——面向復調的符號音樂生成架構117
6.9.3#3示例: BiAxial LSTM——面向復調的符號音樂生成架構119
6.10控制121
6.10.1控制策略的維度121
6.10.2採樣122
6.10.3調控127
6.10.4輸入操縱139
6.10.5輸入操控和採樣146
6.10.6強化學習149
6.10.7Unit Selection152
6.11風格遷移155
6.11.1作曲風格轉移155
6.11.2音色風格遷移156
6.11.3演奏風格遷移157
6.11.4示例: FlowComposer——作曲支持環境158
6.12架構160
6.12.1示例: MusicVAE——面向多聲道層次符號音樂生成系統160
6.12.2其他時間架構層次164
6.13原創性165
6.13.1調控165
6.13.2創新對抗網絡165
6.14漸進性167
6.14.1音符實例化策略167
6.14.2示例: DeepBach——面向多聲部《聖詠曲》的符號音樂
生成系統168
6.15交互性171
6.15.1#1示例: deepAutoController——音頻音樂生成系統171
6.15.2#2示例: DeepBach——面向《聖詠曲》的符號音樂生成系統172
6.15.3接口定義172
6.16適應性173
6.17可解釋性173
6.17.1#1示例: BachBot——面向復調《聖詠曲》的符號音樂
生成系統174
6.17.2#2示例: deepAutoController——音頻音樂生成系統176
6.17.3自動分析176
6.18討論177第7章分析178
7.1引用和縮略語178
7.2系統分析183
7.3相關分析191第8章討論與結論197
8.1全局與時值步長197
8.2捲積與遞歸198
8.3風格遷移與遷移學習199
8.4協作199
8.5專業化200
8.6評價與創造力200
8.7結論202參考文獻203術語215



