鈦媒體App 7月27日消息,
微軟日前推出語(yǔ)音合成模型NaturalSpeech2,該模型采用潛在擴(kuò)散式設(shè)計(jì),可提供“商業(yè)級(jí)”語(yǔ)音/歌唱解決方案。在零樣本情況下,該模型可以生成具有不同說(shuō)話人身份、韻律和風(fēng)格(如唱歌)的語(yǔ)音的能力。且其在零樣本條件下生成的語(yǔ)音與語(yǔ)音提示,和真實(shí)語(yǔ)音的韻律近乎一致,并在LibriTTS和VCTK測(cè)試集上的自然度(以CMOS為度量)與真人語(yǔ)音難以區(qū)分。
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論