聲音信號(hào)處理與項(xiàng)目實(shí)踐
定 價(jià):69.8 元
當(dāng)前圖書已被 2 所學(xué)校薦購(gòu)過!
查看明細(xì)
- 作者:應(yīng)娜
- 出版時(shí)間:2024/6/1
- ISBN:9787121487521
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TN912.3
- 頁(yè)碼:248
- 紙張:
- 版次:01
- 開本:16開
本書系統(tǒng)介紹了聲音信號(hào)處理的背景知識(shí)、發(fā)展歷史以及研究現(xiàn)狀與趨勢(shì),并詳細(xì)闡述了基礎(chǔ)原理、處理方法、實(shí)踐應(yīng)用、新成果與新技術(shù)。 全書共9章。第1章緒論,第2章聲音信號(hào)簡(jiǎn)介,第3章短時(shí)時(shí)域處理技術(shù),第4章短時(shí)傅里葉變換,第5章聲音信號(hào)的線性預(yù)測(cè),第6章語音編碼,第7章聲音合成與轉(zhuǎn)換,第8章語音識(shí)別,第9章基于深度學(xué)習(xí)技術(shù)的聲音技術(shù)應(yīng)用。 本書體系完整,結(jié)構(gòu)嚴(yán)謹(jǐn),系統(tǒng)性強(qiáng),原理闡述透徹,聯(lián)系實(shí)際應(yīng)用,凸顯理論與實(shí)踐結(jié)合,包含豐富的實(shí)踐案例。本書可作為高等院校信號(hào)與信息處理、通信與電子工程、模式識(shí)別與人工智能等專業(yè)高年級(jí)本科生及研究生教材,也可供該領(lǐng)域的科研及工程技術(shù)人員參考。
應(yīng)娜,杭州電子科技大學(xué)通信工程學(xué)院副院長(zhǎng)。負(fù)責(zé)通信工程學(xué)院教學(xué)工作,國(guó)家一流專業(yè)"通信工程專業(yè)”的負(fù)責(zé)人。負(fù)責(zé)《信息論與編碼》、《隨機(jī)信號(hào)原理》、《語音信號(hào)處理》、《認(rèn)識(shí)實(shí)習(xí)》、《綜合創(chuàng)新實(shí)踐1/2/3》等課程。負(fù)責(zé)省級(jí)校企培養(yǎng)基地2項(xiàng);負(fù)責(zé)省級(jí)一流課程2門;主持校級(jí)課程教改3項(xiàng)和核心課程建設(shè)1項(xiàng);指導(dǎo)學(xué)生獲得國(guó)家級(jí)、省級(jí)競(jìng)賽獲獎(jiǎng)多項(xiàng),獲得大唐杯、研究生電子設(shè)計(jì)大賽等優(yōu)秀指導(dǎo)教師多項(xiàng);獲得校級(jí)優(yōu)秀班主任、優(yōu)秀指導(dǎo)教師多次。該教材獲批浙江省普通本科高校"十四五”重點(diǎn)教材建設(shè)項(xiàng)目。
目 錄
第1章 緒論 1
1.1 聲音信號(hào)處理的研究?jī)?nèi)容 1
1.2 聲音信號(hào)處理的發(fā)展歷史 2
1.2.1 語音編碼算法的發(fā)展歷史 3
1.2.2 語音識(shí)別算法的發(fā)展歷史 4
1.2.3 語音去噪及增強(qiáng)算法的發(fā)展歷史 5
1.2.4 語音合成轉(zhuǎn)換等其他算法的發(fā)展歷史 7
1.2.5 基于語音和視覺信息的多模態(tài)融合方法 11
1.3 聲音效果評(píng)價(jià) 14
1.3.1 主觀評(píng)價(jià)方法 14
1.3.2 客觀評(píng)價(jià)方法 15
練習(xí)題 16
第2章 聲音信號(hào)簡(jiǎn)介 17
2.1 人類語音信號(hào)的產(chǎn)生 17
2.2 語音信號(hào)的基本特征 18
2.3 聲音的特征提取 19
2.3.1 手工聲音特征 19
2.3.2 深度語音情感特征 19
2.4 人類的聽覺感知 20
2.5 語音數(shù)據(jù)庫(kù) 22
2.5.1 語音識(shí)別數(shù)據(jù)集 22
2.5.2 語音情感數(shù)據(jù)庫(kù) 23
2.5.3 多模態(tài)情感數(shù)據(jù)集 24
練習(xí)題 26
第3章 短時(shí)時(shí)域處理技術(shù) 27
3.1 語音信號(hào)的短時(shí)處理方法 27
3.1.1 語音端點(diǎn)檢測(cè) 27
3.1.2 預(yù)加重 28
3.1.3 分幀與加窗 28
3.2 短時(shí)能量和短時(shí)平均幅度 30
3.3 短時(shí)過零率 33
3.4 短時(shí)自相關(guān)函數(shù) 35
3.5 短時(shí)時(shí)域處理技術(shù)案例:基音提取 35
3.5.1 基音檢測(cè)估計(jì)方法1:三電平削波法 36
3.5.2 基音檢測(cè)估計(jì)方法2:SHR諧波檢測(cè)法 40
練習(xí)題 42
第4章 短時(shí)傅里葉變換 44
4.1 短時(shí)傅里葉變換的定義 44
4.2 短時(shí)傅里葉變換的理解 45
4.3 短時(shí)傅里葉變換的實(shí)現(xiàn) 49
4.4 語音短時(shí)傅里葉變換的應(yīng)用案例 50
4.4.1 梅爾頻率倒譜系數(shù)的提取和應(yīng)用 50
4.4.2 聲音去噪算法的實(shí)現(xiàn) 57
4.4.3 聲音信號(hào)熵的提取應(yīng)用 62
練習(xí)題 69
第5章 聲音信號(hào)的線性預(yù)測(cè)編碼 70
5.1 線性預(yù)測(cè)基本原理 70
5.2 線性預(yù)測(cè)的解析算法 73
5.3 線性預(yù)測(cè)的應(yīng)用案例 76
5.3.1 基音檢測(cè)估計(jì) 77
5.3.2 共振峰估計(jì) 81
練習(xí)題 85
第6章 語音編碼 86
6.1 脈沖編碼調(diào)制 87
6.1.1 均勻量化脈沖編碼調(diào)制 87
6.1.2 非均勻量化脈沖編碼調(diào)制 87
6.1.3 自適應(yīng)量化脈沖編碼調(diào)制 88
6.2 差分脈沖編碼 89
6.2.1 差分脈沖編碼原理 89
6.2.2 自適應(yīng)差分脈沖編碼 91
6.3 增量調(diào)制 95
6.3.1 增量調(diào)制原理 95
6.3.2 自適應(yīng)增量調(diào)制原理 95
6.4 基于線性預(yù)測(cè)編碼的聲碼器 96
6.4.1 LPC-10聲碼器 96
6.4.2 碼激勵(lì)線性預(yù)測(cè)編碼 102
練習(xí)題 107
第7章 聲音合成與轉(zhuǎn)換 109
7.1 語音合成方法 109
7.1.1 參數(shù)合成方法 110
7.1.2 波形合成方法 115
7.2 漢語基于音節(jié)的規(guī)則合成方法 120
7.2.1 韻律規(guī)則合成 121
7.2.2 多音節(jié)協(xié)同發(fā)音規(guī)則合成 129
7.2.3 輕聲音節(jié)規(guī)則合成 130
7.3 語音轉(zhuǎn)換方法 131
7.3.1 語音轉(zhuǎn)換系統(tǒng)的總體框架 131
7.3.2 語音轉(zhuǎn)換常見的特征參數(shù) 132
7.4 語音轉(zhuǎn)換評(píng)價(jià)指標(biāo) 134
7.4.1 客觀評(píng)價(jià) 135
7.4.2 主觀評(píng)價(jià) 135
7.5 語音轉(zhuǎn)換應(yīng)用案例 136
7.5.1 平行語音轉(zhuǎn)換方法 136
7.6 非平行語音轉(zhuǎn)換應(yīng)用案例 139
7.6.1 循環(huán)生成對(duì)抗網(wǎng)絡(luò) 139
7.6.2 星型生成對(duì)抗網(wǎng)絡(luò) 140
7.6.3 變分自動(dòng)編碼器 141
7.6.4 自適應(yīng)實(shí)例規(guī)范化 141
7.6.5 激活引導(dǎo)和自適應(yīng)實(shí)例歸一化 142
練習(xí)題 150
第8章 語音識(shí)別 151
8.1 采用矢量量化的說話人識(shí)別 151
8.1.1 矢量量化的原理 151
8.1.2 矢量量化的訓(xùn)練 152
8.1.3 矢量量化說話人識(shí)別的實(shí)現(xiàn) 153
8.2 采用動(dòng)態(tài)時(shí)間規(guī)整的孤立詞識(shí)別 154
8.3 基于隱馬爾可夫模型的語音(語句)識(shí)別 159
8.3.1 HMM模型 159
8.3.2 HMM的概率求解 161
8.3.3 HMM的解碼 164
8.3.4 HMM的訓(xùn)練 166
8.3.5 HMM-GMM模型 171
8.3.6 基于HMM的語音識(shí)別應(yīng)用案例 173
練習(xí)題 180
第9章 基于深度學(xué)習(xí)模型的聲音技術(shù)應(yīng)用 183
9.1 深度學(xué)習(xí)網(wǎng)絡(luò)基礎(chǔ) 183
9.1.1 深度學(xué)習(xí)網(wǎng)絡(luò)基本結(jié)構(gòu) 183
9.1.2 深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練 185
9.1.3 卷積神經(jīng)網(wǎng)絡(luò) 187
9.1.4 循環(huán)神經(jīng)網(wǎng)絡(luò) 191
9.1.5 注意力機(jī)制 197
9.2 基于深度學(xué)習(xí)的聲音去噪算法 198
9.2.1 基于深度神經(jīng)網(wǎng)絡(luò)幅度譜估計(jì)的深度學(xué)習(xí)聲音去噪算法 198
9.2.2 基于多尺度時(shí)頻卷積網(wǎng)絡(luò)的多通道聲音去噪 201
9.3 基于深度學(xué)習(xí)的語音識(shí)別應(yīng)用案例 205
9.3.1 基于循環(huán)神經(jīng)網(wǎng)絡(luò)-連續(xù)時(shí)序分類的語音識(shí)別 206
9.3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的語音識(shí)別 209
9.3.3 基于Transformer的語音識(shí)別 211
9.4 基于ResNet的語音情感識(shí)別應(yīng)用案例 220
9.5 聲音與呼吸信號(hào)聯(lián)合識(shí)別應(yīng)用案例 225
9.6 聲音與人臉聯(lián)合識(shí)別應(yīng)用案例 228
練習(xí)題 231
參考文獻(xiàn) 232