Q.ai核心團(tuán)隊(duì)部分成員與Spark Capital投資人Nabeel Hyatt合影,來源:Nabeel Hyatt
在Q.ai的核心團(tuán)隊(duì)中,Yonatan Wexler是馬爾獎(jiǎng)(計(jì)算機(jī)視覺領(lǐng)域的最高榮譽(yù))獲得者,他的成果OrCam MyEye 2(幫助視障人士“看”到文字和識(shí)別物體)曾獲《時(shí)代周刊》“年度最佳發(fā)明”。Avi Barliya是一位曾參與從自動(dòng)駕駛系統(tǒng)到SpaceIL月球探測(cè)器研發(fā)的連續(xù)創(chuàng)業(yè)者。
有趣的是,幾周前,一家叫Lyte的公司獲得了1.07億美元的早期融資,Lyte由Alexander Shpunt、Arman Hajati和Yuval Gerson共同創(chuàng)立,Alexander Shpunt曾聯(lián)合創(chuàng)立PrimeSense并擔(dān)任CTO。
Lyte做的是軟硬件結(jié)合的端到端視覺感知系統(tǒng),為物理AI提供一個(gè)連接智能層的感知層。讓機(jī)器人的“眼睛”與“大腦”直接對(duì)話。
而Q.ai做的事情,與PrimeSense時(shí)期的思路,似乎一脈相承。
無論是Xbox Kinect,還是iPhone FaceID ,本質(zhì)上都是基于感知的交互。
Kinect通過視覺感知,實(shí)現(xiàn)體感/手勢(shì)交互, FaceID通過視覺感知,實(shí)現(xiàn)解鎖,支付認(rèn)證等交互和功能。
Q.ai目前公布的技術(shù)有兩項(xiàng),一項(xiàng)是利用AI讓設(shè)備能夠在嘈雜環(huán)境中也能識(shí)別人類的低聲交談,在復(fù)雜環(huán)境中優(yōu)化音頻表現(xiàn),另一項(xiàng)是檢測(cè)和識(shí)別面部肌肉的細(xì)微活動(dòng),來檢測(cè)口型或語音,進(jìn)而識(shí)別用戶身份,并評(píng)估其情緒、心率及呼吸頻率等生理指標(biāo)。它們都是感知技術(shù)。
這兩項(xiàng)感知技術(shù)怎么應(yīng)用在交互上?我們推測(cè),可能會(huì)是耳語識(shí)別與唇語識(shí)別相結(jié)合。目前的AI原生硬件,交互方式以按鍵+語音為主,但相比傳統(tǒng)的純觸摸屏,語音交互需要清晰的發(fā)聲,在一些場(chǎng)合中會(huì)出現(xiàn)“社交羞恥”,讓用戶在與設(shè)備交互時(shí)有顧慮。
蘋果一向?qū)换ズ陀脩艚缑媸种匾?,是打?ldquo;隱形界面”的大師,它們希望讓技術(shù)仿佛成為用戶自身的自然延伸。
加入蘋果后,Q.ai 的技術(shù)有望觸達(dá)數(shù)十億用戶,從根本上重塑人與機(jī)器之間,人與人之間的交互方式。這不禁讓人好奇,當(dāng)AI硬件最終“消融”于我們的日常生活之中時(shí),會(huì)是怎么一種體驗(yàn)?
個(gè)人計(jì)算設(shè)備的發(fā)展和普及,是算力、智能(功能)、體積、交互界面這些因素,聯(lián)合推動(dòng)的。
在摩爾定律下,設(shè)備在單位體積和成本下的算力,不斷變強(qiáng)。這推動(dòng)了個(gè)人計(jì)算設(shè)備從PC到手機(jī),不斷變小。并且,在算力的支持下,個(gè)人計(jì)算設(shè)備的功能也越來越豐富。
而在交互界面上,它的進(jìn)化是一個(gè)阻力不斷變小,門檻不斷降低的過程。
最初,個(gè)人計(jì)算機(jī)的交互界面是命令行(CLI),這時(shí)候它的用戶群集中在開發(fā)者和計(jì)算機(jī)愛好者這個(gè)小群體。
之后,GUI和鼠標(biāo)鍵盤被引入PC,精確的文字編輯和表格制作成為可能,這讓各行業(yè)的專業(yè)人士得以用上PC,并隨著之后用戶的進(jìn)一步增長,推動(dòng)了互聯(lián)網(wǎng)的普及。
iPhone的橫空出世,帶來了多點(diǎn)觸控的交互方式,這讓個(gè)人計(jì)算設(shè)備的普及率進(jìn)一步提高,開始出現(xiàn)用戶量達(dá)到十億級(jí)別的超級(jí)應(yīng)用。
交互界面的阻力變小,為什么會(huì)帶來門檻的降低?本質(zhì)上它是提高了人機(jī)交互的“帶寬”。從命令行到GUI,再到多點(diǎn)觸控,人們?cè)诓僮鲿r(shí),“想”得越來越少,操作起來越來越直觀。
在AI時(shí)代,智能可穿戴設(shè)備出現(xiàn)了,人和機(jī)器的關(guān)系開始出現(xiàn)轉(zhuǎn)變,以往是人去精確的操控機(jī)器,現(xiàn)在機(jī)器將學(xué)會(huì)理解人類。
在人與智能可穿戴設(shè)備交互時(shí),什么方式是目前最普遍的?是多模態(tài)交互。所謂多模態(tài)交互,既包括語音,也包括一些手勢(shì)之類。總之,它是基于感知的交互。
這種基于感知的交互,是主動(dòng)的、直接的捕捉并解析人類的思維活動(dòng),有望建立迄今為止帶寬最高的人機(jī)接口,也有潛力彌合人類思維與機(jī)器交互之間的鴻溝。
現(xiàn)階段,對(duì)于智能可穿戴設(shè)備,智能有AI模型不斷地發(fā)展,因?yàn)橹爸悄苁謾C(jī)打下的基礎(chǔ),在體積(通常與續(xù)航和端側(cè)算力相關(guān))上也已經(jīng)初步找到路徑,如果交互方式在未來收斂,形成與多點(diǎn)觸控一樣的默認(rèn)交互方式。那么AI與物理世界交織,迸發(fā)出的能量是巨大的。AI智能硬件,在未來的普及率,很可能不會(huì)低于智能手機(jī)。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論