-->

免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

違規(guī)提示

請您遵循相關(guān)法律法規(guī),避免再次出現(xiàn)類似問題

如有任何疑問,請聯(lián)系support@tmtpost.com

關(guān)閉
第四課:語音合成技術(shù)的研究進展
溫正棋 / 人機交互技術(shù)的發(fā)展
第四課:語音合成技術(shù)的研究進展

第四課:語音合成技術(shù)的研究進展

小欣:這節(jié)課,溫老師會為我們講解語音合成技術(shù)的研究進展。

溫正棋:語音合成是建立文本參數(shù)到聲學(xué)參數(shù)的影射模型,目前的方法有拼接合成、參數(shù)合成還有端對端的語音合成。

基于HMM統(tǒng)計參數(shù)的語音合成是在訓(xùn)練過程中建立文本參數(shù),如韻律參數(shù)、普參數(shù)和基頻參數(shù)的映射模型通過決策數(shù)聚類的方法對每一個上下文相關(guān)的文本特征構(gòu)建GMM模型,訓(xùn)練其GMM模型。

在合成時對輸入文本預(yù)測出GMM后通過參數(shù)生成算法,生成語音參數(shù)然后再輸出語音。在這個過程中有三個地方會產(chǎn)生語音音質(zhì)的下降:第一是決策樹的聚類,第二是聲碼器,第三是參數(shù)生成算法。針對這三個問題我們接下來看看各位研究者提出的解決方法。

針對決策樹聚類的問題,我們可以將里面的HMM決策樹據(jù)類變成一個DNN模型。文本參數(shù)到語音參數(shù)的一個映射可以很容易通過DNN來實現(xiàn),而且實驗效果會比決策樹好一點。

除了DNN,RNN也用到了統(tǒng)計參數(shù)語音合成中,而且RNN里單元采用LSTM模型。我們可以把這個參數(shù)生成算法模塊從統(tǒng)計參數(shù)語音合成中去掉。

這樣在基于LSTM-RNN中直接預(yù)測出語音參數(shù)通過聲碼器就可以合成語音,跟RNN-LSTM預(yù)測出一階二階統(tǒng)計量以后采用參數(shù)生成算法、生成語音參數(shù)合成語音的效果差不多,所以RNN-LSTM可以把里面的參數(shù)生成算法給去掉。

最近幾年大家在聲碼器問題上做了很多工作。比如WaveNet其實也屬于聲碼器的模型,建立一個現(xiàn)今預(yù)測的模型通過前面采樣點預(yù)測出后面的采樣點。但是存在幾個問題比如剛開始速度比較慢,這個問題后期被很多公司都解決了。

而且它并不是一個傳統(tǒng)的vocoder需要文本參數(shù)作為它的輸入,它有好處是在輸入過程中可以很容易的在后端控制說話人的特征,比如不同說話人情感特征這些屬于外部特征我們都可以進行很好的加入。

下面兩個端對端的語音合成。第一個是Char2Wav,這個模型是直接對輸入的文本進行編碼采用的模型。直接對輸入的叫字母進行編碼然后生成中間的一個編碼信息放到解碼器里進行最后的合成,合成采用SimpleRNN的合成器來合成語音,效果也是比較理想的而且是純粹的End-To-End的語音合成模型。

語音合成前期工作主要放在前端文本分析上。因為我們在聽感上可能更關(guān)注,但是如果有一些很好的End-to-End的模型出來以后文本分析的工作就并不是很重要。

我們也可以在后端中加入一些文本分析的結(jié)果進行預(yù)測,這即是一種嘗試也是一種很好的辦法。現(xiàn)有合成器的音質(zhì)不再首先考慮我們采用哪種聲碼器,而是采用直接生成的方法在實域上直接進行合成。語音合成更重要的是一些音庫,我們不能忽略音庫在語音合成中所占據(jù)的位置以及它的重要性。

小欣:下節(jié)課,溫老師會為我們講解聲紋識別技術(shù)的研究進展。

【版權(quán)歸鈦媒體所有,未經(jīng)許可不得轉(zhuǎn)載】

分享課程:
大家都在學(xué)
72問 有聲書系列 / 中國經(jīng)濟2021
精品小課 揭秘黃金投資:2022年以來上漲表現(xiàn)最好的資產(chǎn)之一
精品小課 阿里人力資源體系課

Oh! no

您是否確認要刪除該條評論嗎?

全部課程 ( 6 )
倒序播放

00:00
/
00:00
X1.0

注冊郵箱未驗證

我們已向下方郵箱發(fā)送了驗證郵件,請查收并按提示驗證您的郵箱。

如果您沒有收到郵件,請留意垃圾郵件箱。

更換郵箱

您當(dāng)前使用的郵箱可能無法接收驗證郵件,建議您更換郵箱

賬號合并

經(jīng)檢測,你是“鈦媒體”和“商業(yè)價值”的注冊用戶。現(xiàn)在,我們對兩個產(chǎn)品因進行整合,需要您選擇一個賬號用來登錄。無論您選擇哪個賬號,兩個賬號的原有信息都會合并在一起。對于給您造成的不便,我們深感歉意。