-->
請(qǐng)您遵循相關(guān)法律法規(guī),避免再次出現(xiàn)類似問(wèn)題
如有任何疑問(wèn),請(qǐng)聯(lián)系support@tmtpost.com
關(guān)閉
第五課:聲紋識(shí)別技術(shù)的研究進(jìn)展
小欣:這節(jié)課,溫老師會(huì)為我們講解聲紋識(shí)別的研究原理。
溫正棋:說(shuō)話人識(shí)別也就是聲紋識(shí)別,簡(jiǎn)單介紹一下現(xiàn)有的I-vector系統(tǒng)以及如何將DNN應(yīng)用到對(duì)應(yīng)的I-vector系統(tǒng),同時(shí)我們也跟蹤了最近end to end的一種方法。
基于Ivector系統(tǒng)通過(guò)UBM模型來(lái)訓(xùn)練數(shù)據(jù),然后訓(xùn)練得到混合高斯模型,通過(guò)統(tǒng)計(jì)量的提取比如零階、一階、二階我們來(lái)訓(xùn)練它的差異空間T從而提取出它的Ivector。
最后考慮到不同的補(bǔ)償方式進(jìn)行信道補(bǔ)償使性能更加完善,同時(shí)我們?cè)诤铣啥?、最后識(shí)別端也可以考慮不同系統(tǒng)的融合提高最終的準(zhǔn)確率。
將DNN用到說(shuō)話人識(shí)別主要是針對(duì)Ivector的系統(tǒng)。UBM訓(xùn)練是一個(gè)無(wú)監(jiān)督的訓(xùn)練方式不考慮音速相關(guān)的信息,因此就不考慮每個(gè)人說(shuō)話音速在聲學(xué)空間上的不同。
我們可以將這部分信息運(yùn)用到說(shuō)話人識(shí)別中,將前面提到的Ivector需要的臨界統(tǒng)計(jì)量通過(guò)DNN模型的輸出進(jìn)行替換。在訓(xùn)練Ivector的過(guò)程中考慮每個(gè)人音速、發(fā)音音速相關(guān)的不同特征,這樣會(huì)更好的對(duì)說(shuō)話人進(jìn)行識(shí)別。
DNN還有一種應(yīng)用形式采用bottleneck特征替換掉原來(lái)的MFCC、PLP相關(guān)的特征,這也是從音速區(qū)分性、每個(gè)人發(fā)音音速不一樣來(lái)考慮的。
小欣:下節(jié)課,溫老師會(huì)為我們講解未來(lái)人機(jī)交互的研究方向。
【版權(quán)歸鈦媒體所有,未經(jīng)許可不得轉(zhuǎn)載】

注冊(cè)郵箱未驗(yàn)證
我們已向下方郵箱發(fā)送了驗(yàn)證郵件,請(qǐng)查收并按提示驗(yàn)證您的郵箱。
如果您沒(méi)有收到郵件,請(qǐng)留意垃圾郵件箱。
賬號(hào)合并
經(jīng)檢測(cè),你是“鈦媒體”和“商業(yè)價(jià)值”的注冊(cè)用戶。現(xiàn)在,我們對(duì)兩個(gè)產(chǎn)品因進(jìn)行整合,需要您選擇一個(gè)賬號(hào)用來(lái)登錄。無(wú)論您選擇哪個(gè)賬號(hào),兩個(gè)賬號(hào)的原有信息都會(huì)合并在一起。對(duì)于給您造成的不便,我們深感歉意。
Oh! no
您是否確認(rèn)要?jiǎng)h除該條評(píng)論嗎?