【常寧/ 鈦媒特約】如今技術(shù)的發(fā)展已經(jīng)遠(yuǎn)遠(yuǎn)超出我們的想象,像智能手機(jī)能識(shí)別到最近的商店、公交車(chē)站等等已經(jīng)不算什么新鮮事兒了。研究人員并不滿(mǎn)足智能手機(jī)是人的輔助工具,他們希望智能手機(jī)不只是冷冰冰的機(jī)器,而是有情商,能洞察人的情緒,成為人的親密伙伴。
美國(guó)羅徹斯特大學(xué)的一個(gè)研究團(tuán)隊(duì)就在做這樣的事情,他們的項(xiàng)目叫做Bridge,目的是為了開(kāi)發(fā)能從人類(lèi)語(yǔ)音、面部表情或身體姿勢(shì)中探測(cè)出情緒的方法。并且該團(tuán)隊(duì)已經(jīng)開(kāi)發(fā)出一個(gè)新軟件,它不需要收集說(shuō)話(huà)的內(nèi)容信息,僅通過(guò)分析說(shuō)話(huà)語(yǔ)氣就可以知道人的情緒,比如悲傷、幸福、害怕和厭惡等。也就是說(shuō),它跟人說(shuō)什么內(nèi)容沒(méi)有關(guān)系,而是能洞察人是怎么說(shuō)的。
新軟件對(duì)語(yǔ)音情緒的判斷精確度可達(dá)到81%,而以往研究的準(zhǔn)確度只有大約55%,所以新軟件在準(zhǔn)確度方面有很大突破。研究人員在剛剛閉幕的IEEE語(yǔ)音技術(shù)研討會(huì)上對(duì)該軟件進(jìn)行了展示。
說(shuō)什么內(nèi)容不重要 怎么說(shuō)才重要?
情感和情緒是人的一種復(fù)雜心理狀態(tài)的體驗(yàn),而這種體驗(yàn)是隨著人自身的生理和周?chē)h(huán)境的影響而變化的。許多現(xiàn)有的情感和情緒探測(cè)方法主要是以人主觀(guān)的自我陳述作為基礎(chǔ)數(shù)據(jù),整個(gè)過(guò)程耗時(shí)耗力,且準(zhǔn)確性不高。目前研究已經(jīng)發(fā)現(xiàn),語(yǔ)言中韻律的變化與人們的情感和情緒有很大的聯(lián)系,所以研究人員想利用這一點(diǎn)來(lái)開(kāi)發(fā)出能自動(dòng)探測(cè)人類(lèi)情緒的方法。
情緒會(huì)影響人的說(shuō)話(huà)方式,比如通過(guò)人說(shuō)話(huà)的聲音大小和音高就能大概判斷人的情緒狀態(tài)。要想教計(jì)算機(jī)去理解人們的情緒,那么首先要認(rèn)識(shí)人是如何通過(guò)聲音表達(dá)情緒的。
所以,在新軟件的情緒探測(cè)系統(tǒng)中,研究人員利用語(yǔ)音信號(hào)處理方法來(lái)提取語(yǔ)音特征,并且給語(yǔ)音確立了12種特殊的語(yǔ)音特征,比如語(yǔ)音的音高、音量、活力等,這些語(yǔ)音特征都能被統(tǒng)計(jì)出來(lái),并作為測(cè)量標(biāo)準(zhǔn)。隨后研究人員會(huì)根據(jù)這些特征繪制出語(yǔ)音的波形、頻譜、共振峰,以此來(lái)發(fā)現(xiàn)語(yǔ)音信號(hào)中與情緒情感相關(guān)聯(lián)的模式,并將語(yǔ)音進(jìn)行分類(lèi),最終教計(jì)算機(jī)判斷出語(yǔ)音中包含的情緒。
首款情緒探測(cè)App原型出現(xiàn)?
Wendi Heinzelman是羅徹斯特大學(xué)電子與計(jì)算機(jī)工程教授,也是該團(tuán)隊(duì)的負(fù)責(zé)人。她的學(xué)生Na Yang已經(jīng)基于該研究開(kāi)發(fā)出一款app原型,在記錄并分析用戶(hù)的聲音后,這款app會(huì)顯示出用戶(hù)是處于高興或悲傷的情緒中。不過(guò)這款app的功能還是還是非常簡(jiǎn)單。
Heinzelman表示,雖然處于早期階段,但要作出一款更復(fù)雜app也不是什么難事兒。他們將繼續(xù)開(kāi)發(fā)可以推向市場(chǎng)的情緒探測(cè)app,比如可根據(jù)用戶(hù)的聲音了解用戶(hù)的情緒,然后播放符合用戶(hù)心境的音樂(lè)等等。并且她認(rèn)為他們的新方法要比之前的任何研究方法都更有效。
但這款軟件還是存在一定的問(wèn)題,那就是在多人聊天談話(huà)中,系統(tǒng)容易受到干擾,對(duì)情緒的判斷準(zhǔn)確性就會(huì)下降,這也是Heinzelman的團(tuán)隊(duì)下一步要解決的問(wèn)題。
相比Siri的機(jī)械化 新軟件更貼心?
業(yè)界對(duì)語(yǔ)音分析的研究早已開(kāi)始,但在準(zhǔn)確率方面一直表現(xiàn)不佳,就連備受關(guān)注的蘋(píng)果Siri也差強(qiáng)人意。所以談到這里,肯定有人會(huì)將新軟件與蘋(píng)果的Siri來(lái)比較。
Siri在回答人們所提的問(wèn)題方面,確實(shí)有吸引人之處,但回答準(zhǔn)確率并不太高。據(jù)去年7月份美國(guó)投資銀行派杰(Piper Jaffray)的分析師對(duì)Siri進(jìn)行的一次測(cè)試顯示,在鬧市區(qū),Siri問(wèn)題理解準(zhǔn)確度為83%,回答準(zhǔn)確度為62%。在安靜的房間內(nèi),Siri問(wèn)題理解準(zhǔn)確度為89%,回答準(zhǔn)確度為68%。從這些數(shù)字來(lái)看,Siri的語(yǔ)音分析水平并不是很高。
但是,Siri只停留在根據(jù)人們提問(wèn)的問(wèn)題進(jìn)行詞語(yǔ)分析,進(jìn)而來(lái)匹配答案,在程度上多少有些機(jī)械化。
新技術(shù)也屬于語(yǔ)音分析的范疇,然而與Siri不同的是,它不需要去解釋語(yǔ)音的內(nèi)容或像其他語(yǔ)音技術(shù)去捕捉圖像,所以不會(huì)涉入太多復(fù)雜條件,更容易操作,準(zhǔn)確性也更強(qiáng)。所以,這種情緒探測(cè)系統(tǒng)可能會(huì)更具吸引力。而且,新技術(shù)要解決的是更高級(jí)的情感問(wèn)題,希望盡可能的感受到人的情緒,而不是簡(jiǎn)單的分析詞語(yǔ)。因此,從這方面來(lái)講,新軟件似乎更勝一籌,更人性化和貼心。
商用價(jià)值有空間?
未來(lái),醫(yī)療研究人員可以在移動(dòng)設(shè)備上利用這種情緒探測(cè)和感知技術(shù),用于監(jiān)護(hù)病人或?qū)θ说男袨檫M(jìn)行研究。另外,目前業(yè)界一直在研究比較復(fù)雜的情景感知系統(tǒng),而情緒探測(cè)技術(shù)將會(huì)成為情景感知系統(tǒng)研究的入口點(diǎn)。而情景感知系統(tǒng)將會(huì)是未來(lái)消費(fèi)電子產(chǎn)品或服務(wù)的重要功能,并且也是未來(lái)推動(dòng)移動(dòng)廣告發(fā)展的重要技術(shù)。這一點(diǎn)來(lái)講,其商用價(jià)值有極大的開(kāi)發(fā)空間。
更多該技術(shù)的具體介紹可查看羅徹斯特大學(xué)網(wǎng)站






快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論