從2011年10月4日,蘋果在iPhone4s機型上開創(chuàng)性地配置Siri語音控制功能,并相繼在2012年宣布支持中文語音識別和互動開始,語音助手浪潮首先在手機端應(yīng)用掀起。
經(jīng)過五年的發(fā)展,原本通過手動的人機交互模式已衍生出許多口令式應(yīng)用場景,與此同時,在炙手可熱的智能家居市場中,以語音交互為基礎(chǔ)的人機互動模式也逐步成為標(biāo)準(zhǔn)性功能配置。
雖然,語音交互領(lǐng)域儼然被吹捧為又一智能藍海、智能領(lǐng)域的入口之一,國內(nèi)外科技大佬也因此沒少在其投錢。
然而,回到現(xiàn)實應(yīng)用場景里,我們當(dāng)中有多少人真的像手動觸屏操作那樣信任語音助手?一天中有多少次開啟過語音互動功能?從我們身邊的用戶和自身的使用習(xí)慣看,用戶對語音操控仍然極度缺乏信任。
當(dāng)今語音技術(shù)格局
從語音智能生態(tài)系統(tǒng)來看,主要有基于Nuance的蘋果Siri與三星S-Voice、谷歌Android的Google Now、微軟Windows Phone的Cortana三大版圖。專注于中文語音智能領(lǐng)域而言:
以傳統(tǒng)的語音技術(shù)提供商科大訊飛為首,無論在技術(shù)還是市場者占有領(lǐng)先地位,已知的合作廠商如京東微聯(lián)、錘子科技、長虹、創(chuàng)維、三星等家電廠商;
騰訊,百度兩大科技巨頭也通過其團隊實力的優(yōu)越性展現(xiàn)了后來者居上的姿態(tài);
蘇州思必馳,捷通華聲,云知聲等相對較年輕的技術(shù)服務(wù)商在整體識別率十分搶眼;以及一些背靠其他學(xué)術(shù)或技術(shù)團隊的小公司也正在積聚力量。
基礎(chǔ):手機使用場景
從iPhone的Siri開始,通過語音助手在手機上實現(xiàn)讀短信、介紹餐廳、詢問天氣、設(shè)置鬧鐘、自然語言輸入、調(diào)用天氣預(yù)報、日程安排、搜索資料等功能已不再新鮮,通過后期的技術(shù)迭代,學(xué)習(xí)新的聲音和語調(diào),提供對話式的應(yīng)答等能力也不在話下。
同時,在應(yīng)用類層面,如微信、新浪微博、語音搜索、365日歷、掌閱、91熊貓看書以及各大導(dǎo)航類應(yīng)用也全面引入了語音識別、語義理解等功能。
潛力:家居物聯(lián)網(wǎng)
隨著物聯(lián)時代的興起,家居物聯(lián)這塊藍海市場也吸引了眾多科技公司的押注,而其最基本的接入方式。
在國外,三大科技大佬已開始布局,蘋果就在今年6月初的蘋果全球開發(fā)者大會(WWDC)上,推出了自家首個智能家居平臺Homekit,其亮點也正是整合了Siri——具有語音控制功能,對于借用第三方應(yīng)用或其它硬件而實現(xiàn)智能操控的國內(nèi)智能家居系統(tǒng)無疑更容易打動用戶。
與此同時,微軟近日也宣布將把微軟語音助手Cortana引入家庭自動化設(shè)備制造商Insteon在Windows Phone的應(yīng)用程序中。
而谷歌早在去年也通過收購收購Nest Labs成功進軍智能家居市場,并在今年5月份的谷歌I/O開發(fā)者大會上推出了以Android為核心的Brillo系統(tǒng),以及Google Now新的智能應(yīng)用功能。
國內(nèi)市場方面,借由語音交互功能作為物聯(lián)家居的入口、以及通過類似布丁機器人等家庭機器人的人機語音互動入駐智能家居等模式也屢見不鮮。
所謂的“標(biāo)配”真的實用嗎?
如果僅從配置要求方面而言,如上所述,語音智能技術(shù)確實已成為主流,但根據(jù)相關(guān)數(shù)據(jù)顯示這一功能的使用率并不高。
在大多數(shù)情況下,語音交互變成了消遣娛樂的“游戲”,并未成為真正幫助人們操控設(shè)備的工具。究其原因,筆者認(rèn)為主要在以下幾個方面:
1. 語音識別率、語義理解力不足。雖然國外有迭代數(shù)次的蘋果Siri語音助手、以及谷歌、微軟等硬實力派的加盟,但據(jù)業(yè)界人士表示,從目前語音識別率提升至99%甚至100%的路還很長。這主要是語音易受場合、情緒、身體狀況、內(nèi)容上下文等影響的特性決定;
2. 中文語音的復(fù)雜性。由于中文的復(fù)雜性,其語音、語調(diào)、方言等多重因素的影響,造成漢語語音識別比英語在準(zhǔn)確性更具挑戰(zhàn),以及在不同的語境內(nèi)使用不同的字和語氣,甚至包括隱語之類的東西,在英文里都是很少有的,所以偏重英文識別性能的外國技術(shù)在中文語音識別和語義理解方面顯得“水土不服”,而這一點也需我國自主技術(shù)廠商的努力;
3. 缺少極為匹配的應(yīng)用場景。雖然智能語音功能已在車載、智能家居、手機端等場景中實現(xiàn),但更多的情況是為了添加語音互動功能而硬造出的應(yīng)用場景;與此同時,不同機型在語音識別率、反應(yīng)速度、功耗方面差異巨大且存在諸多問題,這一點使得智能語音功能在產(chǎn)品應(yīng)用上更顯雞肋;
4. 此外,為使用戶更好地實現(xiàn)語音操作的過渡和轉(zhuǎn)化,在語音技術(shù)與觸控、體感等其他操控方式的結(jié)合也顯得十分重要,如果簡單地將之定位于觸摸、按鍵等主流操作方式的替代品,必將導(dǎo)致較低的市場接受。
目前的語音操控仍面臨很多亟待解決的問題,用戶實際應(yīng)用情況并不像其產(chǎn)品覆蓋面那樣廣泛,即所謂的語音智能還并不能稱之為真正的標(biāo)配。
但不可否認(rèn),語音交互已作為人機交互發(fā)展的重要方向,正逐步滲入到我們的日常生活與應(yīng)用當(dāng)中,引起了智能硬件行業(yè)的變革。
而誰能率先為智能語音交互創(chuàng)造更人性化的操作體驗,在其算法的準(zhǔn)確率、反應(yīng)時間以及處理性能進行實質(zhì)性的突破,定將為智能領(lǐng)域的發(fā)展創(chuàng)造豐厚的附加值。
【鈦媒體作者介紹:智東西;微信公眾號:zhidxcom】






快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論
體驗性錯是關(guān)鍵。
傳統(tǒng)語音,減少資費、減少偷扣費現(xiàn)象,用戶便不會減少
騰訊有用戶就不會倒閉,有你這種狗也不會倒閉
從KNN到隱含馬爾科夫,語音識別已經(jīng)很久沒有新的算法誕生了,靠這些古董算法,加一點優(yōu)化肯定無法滿足現(xiàn)在的需求了
很明顯,你把電子競技和游戲混為一談。
騰訊就知道死不要臉的山寨,搞壟斷,憑借龐大的用戶群,山寨別人的東西卻比別人火,讓國內(nèi)敢于創(chuàng)新的公司沒有飯吃,這是對中國游戲產(chǎn)業(yè)的一種破壞
百度云服務(wù),阿里的大數(shù)據(jù),騰訊的LBS,這些靠時間和用戶沉淀下來的數(shù)據(jù)和服務(wù),才是他們立足之本。把目光局限在假貨,盜版?可笑!
都沒怎么用過
來了一個
開始了,我最近物聯(lián)戰(zhàn)略布局的三塊中的第一塊快完成了,其中一塊和這個有關(guān)。不過基本構(gòu)思以完成。戰(zhàn)略還在寫。