Lyte的創(chuàng)始團(tuán)隊(duì)

Alexander Shpunt曾聯(lián)合創(chuàng)立3D傳感公司PrimeSense并擔(dān)任其首席技術(shù)官。從2005年開始,他就致力于一個問題:如何教會機(jī)器感知深度?他想讓機(jī)器像人類一樣感知空間——看到的不是扁平的像素,而是維度、距離,以及三維空間中物體間的關(guān)系。

為此,他和團(tuán)隊(duì)創(chuàng)造了“光編碼技術(shù)”:紅外投影儀將不可見的點(diǎn)陣投射在整個場景上;攝像頭負(fù)責(zé)讀取這些點(diǎn)陣在不同距離上如何扭曲,并通過三角定位法將其轉(zhuǎn)換成實(shí)時深度圖。  

五年后,這項(xiàng)技術(shù)催生了一款革命性的體感設(shè)備——微軟Kinect,它在六十天內(nèi)售出了八百萬臺。

2013年,他的公司被蘋果收購,他和團(tuán)隊(duì)成員進(jìn)入蘋果,將這個核心技術(shù)繼續(xù)演進(jìn),2017年,蘋果FaceID面世,如今已應(yīng)用于數(shù)十億臺設(shè)備中。

在2021年,Alexander Shpunt就看到了“物理AI”的早期趨勢,AI不僅要閱讀文本和識別圖像,它還被用于在在倉庫中導(dǎo)航、操作機(jī)械、與行人和車輛共享道路——AI正走向?qū)嶓w化,融入現(xiàn)實(shí)世界。

但是風(fēng)險隨之出現(xiàn),對于感知,相比在智能手機(jī)上偶爾不穩(wěn)定,當(dāng)它用在倉庫里,開放道路上,出現(xiàn)錯誤的后果將是災(zāi)難性的。

Alexander Shpunt認(rèn)為,“物理AI”能否順利發(fā)展,一個重要的因素是能否對物理世界的可靠理解。機(jī)器人必須能夠在復(fù)雜、動態(tài)的環(huán)境中安全運(yùn)行,而不僅僅是在受控的環(huán)境中。

他以自己在蘋果的班底為基礎(chǔ)組建團(tuán)隊(duì)再次出發(fā),這個團(tuán)隊(duì)橫跨傳感、芯片和實(shí)體AI領(lǐng)域。除了Alexander Shpunt自己外,Arman Hajati(CTO)曾主導(dǎo)了多代iPhone和Apple Watch的Taptic Engine架構(gòu)設(shè)計;Yuval Gerson(工程副總裁)專注于復(fù)雜的機(jī)械和微機(jī)電系統(tǒng)(MEMS),Reza Nasiri Mahalati(硬件負(fù)責(zé)人)對于先進(jìn)傳感模塊在硬件、軟件和算法層面的集成工作有豐富經(jīng)驗(yàn)。   

補(bǔ)上結(jié)構(gòu)光缺失的第四維度:速度

根據(jù)Grand View Research的預(yù)測,AI機(jī)器人市場規(guī)模到2030年將達(dá)到1250億美元。然而,麥肯錫的數(shù)據(jù)顯示,超過60%的工業(yè)企業(yè)缺乏自主實(shí)施機(jī)器人自動化的內(nèi)部能力,包括傳感器集成能力。

企業(yè)的傳統(tǒng)解決方式,是從多家供應(yīng)商處拼湊感知系統(tǒng),然后花費(fèi)數(shù)月時間校準(zhǔn)傳感器、編寫融合軟件并調(diào)試集成故障。

Lyte要解決的就是這個結(jié)構(gòu)性問題,他們以垂直整合技術(shù)棧的思路,將傳感硬件、定制芯片和感知軟件統(tǒng)一整合到單一平臺中,為自主機(jī)器(包括但不限于具身智能機(jī)器人)提供在現(xiàn)實(shí)世界中運(yùn)行所需的清晰而可靠的感知層。

結(jié)構(gòu)光(光編碼更通用的名稱)是一種重要的感知技術(shù),它成功應(yīng)用于室內(nèi)空間和人臉識別。但結(jié)構(gòu)光有其局限:它只在近距離有效,且只能捕捉物體身在何處,而非去向何方。

對于在世界中移動的機(jī)器而言,這還遠(yuǎn)遠(yuǎn)不夠。一臺在倉庫中導(dǎo)航的機(jī)器人,不僅需要知道叉車在哪里,還需要知道叉車正以每秒四米的速度向它駛來。一個在人行道上行駛的配送機(jī)器人,不僅需要看見孩子,還需要看見孩子正在奔跑。

傳統(tǒng)傳感器捕捉的是位置。為了理解運(yùn)動,軟件需要比較不同的幀畫面:此刻的位置與前一刻的位置。這會引入延遲。在一個動態(tài)的世界里運(yùn)行,延遲是風(fēng)險的根源。

Lyte團(tuán)隊(duì)此前開發(fā)的體感設(shè)備不僅能看到人們的身體位置,還能追蹤他們的運(yùn)動方式。面部識別技術(shù)也不僅是繪制人們的的面容,更能確認(rèn)這張臉是活生生的、在場的、真實(shí)的。這兩項(xiàng)技術(shù)都能理解動態(tài)演進(jìn)的場景,而非靜止的瞬間。

現(xiàn)在,Lyte團(tuán)隊(duì)將同樣的能力應(yīng)用于更遠(yuǎn)的距離、更快的速度,以及在開放空間中運(yùn)行的機(jī)器。

他們開發(fā)了一個新的核心技術(shù)——“相干視覺”。這項(xiàng)技術(shù)在運(yùn)用光時,不再是投射圖案并讀取扭曲,而是發(fā)射連續(xù)信號并測量其返回信號。位置與速度,在同一瞬間被同時捕捉,無需事后計算,此能力內(nèi)建于測量本身。

運(yùn)用光的不同方式。它不再是投射圖案并讀取扭曲,而是發(fā)射連續(xù)信號并測量其返回信號。位置與速度,在同一瞬間被同時捕捉,無需事后計算,此能力內(nèi)建于測量本身。它為感知引入了第四個維度,就是速度。一個物體的位置及其運(yùn)動方向,被同時獲知。

通俗的說,過去需要靠算法補(bǔ)齊速度信息,所以有延遲,而“相干視覺”是靠物理層直接獲取速度信息,所以無延遲。

LyteVision,讓機(jī)器的“眼睛”與“大腦”直接對話

基于這個核心技術(shù),Lyte團(tuán)隊(duì)打造了LyteGalaxy這個統(tǒng)一的空間智能平臺,它集傳感器、計算單元、軟件與算法于一體,為機(jī)器人構(gòu)筑起一個完整統(tǒng)一的感知技術(shù)棧。

LyteVision

而在感知方面,他們的核心硬件產(chǎn)品是LyteVision,這是一個端到端的感知系統(tǒng),它在2026年CES上榮獲機(jī)器人技術(shù)“最佳創(chuàng)新獎”。這個新產(chǎn)品將先進(jìn)的4D傳感、RGB成像和運(yùn)動感知能力集成到單一平臺中,通過一個連接即可提供統(tǒng)一的空間與視覺數(shù)據(jù)。

它不僅統(tǒng)一了傳感器,還統(tǒng)一了從感知到智能的整條路徑:傳感器與芯片融合,芯片為軟件定制,軟件為AI計算而生。從光子觸及傳感器,到?jīng)Q策返回至機(jī)器的完整技術(shù)棧——單一架構(gòu),無縫銜接。

具體來說,它經(jīng)過三大集成階段,將原始傳感器數(shù)據(jù)轉(zhuǎn)化為可執(zhí)行的智能信息。

第一步,感知。在即插即用、任務(wù)就緒的模塊中集成了4D相干視覺、RGB(可見光)和IMU(慣性測量單元)。這個模塊具備完整而緊湊的傳感功能,采用單電纜部署,是開箱即用的感知系統(tǒng)。

第二步,融合與處理。這套系統(tǒng)的定制芯片在硬件層面即時處理多傳感器融合,提供統(tǒng)一、時間同步的感知數(shù)據(jù)。讓開發(fā)者專注于構(gòu)建機(jī)器人行為,免除調(diào)試傳感器同步的麻煩。

第三步,理解。眼睛通過神經(jīng)系統(tǒng)連接大腦,而一個能看見世界的機(jī)器人,仍需理解它所見的一切。這意味著要將傳感器、芯片、軟件與人工智能計算連接起來,然后數(shù)據(jù)從邊緣流向云端再返回,模型處理機(jī)器感知到的信息,做出決策,發(fā)出指令。而且這整個閉環(huán),在毫秒間完成。保證了即時性。

最終的成果是:LyteVision這個僅有單個連接器的獨(dú)立模塊,能將多個傳感器,統(tǒng)一輸出;而且能實(shí)時捕捉位置與速度,即刻部署。因?yàn)槟K的統(tǒng)一性,它讓每一臺使用它的機(jī)器都能共享對世界的一致“看法”。

感知物理世界是復(fù)雜的,但Lyte將這些復(fù)雜性內(nèi)部消化了,然后提供一個連接智能層的感知層。讓“眼睛”與“大腦”直接對話。

這讓“物理AI”在感知上,不再面對發(fā)展的限制因素。

在適應(yīng)性上,LyteVision能夠賦能廣泛的實(shí)體AI平臺,包括自主移動機(jī)器人、機(jī)械臂、四足機(jī)器人、自動駕駛出租車和人形機(jī)器人。

“物理AI”還在早期,機(jī)會還有很多

隨著技術(shù)進(jìn)步,AI進(jìn)入越來越多的場景,而隨著物理AI的崛起,AI對感知的需求從靜止化、單一化向通用化、實(shí)時化發(fā)展。

以往,AI只需要識別出一個靜態(tài)的人臉,現(xiàn)在它要在開放而復(fù)雜的物理環(huán)境中自由行進(jìn),隨時都可能有訓(xùn)練數(shù)據(jù)之外的“意外”發(fā)生。

Lyte團(tuán)隊(duì)從2005年開始就開始涉足機(jī)器的“感知”,他們沿著這個主要方向前進(jìn),面對“物理AI”的新趨勢和新需求,創(chuàng)造出新的技術(shù)解決方案。

端到端是感知系統(tǒng)的下一個趨勢,特斯拉就是很好的例子。它沒有復(fù)雜的雷達(dá)和攝像頭結(jié)合的硬件系統(tǒng),采用了純攝像頭方案,但是前端的攝像頭收集的巨量數(shù)據(jù)與后端的深度學(xué)習(xí)模型相結(jié)合,形成了數(shù)據(jù)飛輪,就能在不增加硬件復(fù)雜性的前提下,越來越強(qiáng)。

Lyte的產(chǎn)品,也是端到端的,它通過軟硬件結(jié)合的垂直整合技術(shù),將感知系統(tǒng)的復(fù)雜性(硬件+軟件)內(nèi)化了,提供給客戶的是一個簡單的產(chǎn)品。而且這個產(chǎn)品足夠通用,能夠適應(yīng)客戶的各種硬件形態(tài)和應(yīng)用場景。

目前,“物理AI”還很早期,我們在此前的文章里總結(jié)過,它有賦能智能硬件的AI操作系統(tǒng)、掣肘世界模型發(fā)展的具身智能數(shù)據(jù),以及“世界模型”不完善等缺項(xiàng);但是用更細(xì)的眼光去看行業(yè),缺項(xiàng)其實(shí)并不止這三大項(xiàng),例如我們以為已經(jīng)成熟的感知,就有Lyte來進(jìn)行革新。

那么,無論是智能、感知,還是行動控制,無論是硬件層面,還是軟件層面,“物理AI”都還有很多突破的機(jī)會,值得創(chuàng)業(yè)者們?nèi)リJ。

本文系作者 阿爾法公社 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點(diǎn)擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

掃描下載App