国产区在线观看网址,做嗳视频免费在线播放器91

Alexander Shpunt曾聯(lián)合創(chuàng)立3D傳感公司PrimeSense并擔(dān)任其首席技術(shù)官。從2005年開始，他就致力于一個問題：如何教會機(jī)器感知深度？他想讓機(jī)器像人類一樣感知空間——看到的不是扁平的像素，而是維度、距離，以及三維空間中物體間的關(guān)系。

為此，他和團(tuán)隊(duì)創(chuàng)造了“光編碼技術(shù)”：紅外投影儀將不可見的點(diǎn)陣投射在整個場景上；攝像頭負(fù)責(zé)讀取這些點(diǎn)陣在不同距離上如何扭曲，并通過三角定位法將其轉(zhuǎn)換成實(shí)時深度圖。

五年后，這項(xiàng)技術(shù)催生了一款革命性的體感設(shè)備——微軟Kinect，它在六十天內(nèi)售出了八百萬臺。

2013年，他的公司被蘋果收購，他和團(tuán)隊(duì)成員進(jìn)入蘋果，將這個核心技術(shù)繼續(xù)演進(jìn)，2017年，蘋果FaceID面世，如今已應(yīng)用于數(shù)十億臺設(shè)備中。

在2021年，Alexander Shpunt就看到了“物理AI”的早期趨勢，AI不僅要閱讀文本和識別圖像，它還被用于在在倉庫中導(dǎo)航、操作機(jī)械、與行人和車輛共享道路——AI正走向?qū)嶓w化，融入現(xiàn)實(shí)世界。

但是風(fēng)險隨之出現(xiàn)，對于感知，相比在智能手機(jī)上偶爾不穩(wěn)定，當(dāng)它用在倉庫里，開放道路上，出現(xiàn)錯誤的后果將是災(zāi)難性的。

Alexander Shpunt認(rèn)為，“物理AI”能否順利發(fā)展，一個重要的因素是能否對物理世界的可靠理解。機(jī)器人必須能夠在復(fù)雜、動態(tài)的環(huán)境中安全運(yùn)行，而不僅僅是在受控的環(huán)境中。

他以自己在蘋果的班底為基礎(chǔ)組建團(tuán)隊(duì)再次出發(fā)，這個團(tuán)隊(duì)橫跨傳感、芯片和實(shí)體AI領(lǐng)域。除了Alexander Shpunt自己外，Arman Hajati（CTO）曾主導(dǎo)了多代iPhone和Apple Watch的Taptic Engine架構(gòu)設(shè)計；Yuval Gerson（工程副總裁）專注于復(fù)雜的機(jī)械和微機(jī)電系統(tǒng)（MEMS），Reza Nasiri Mahalati（硬件負(fù)責(zé)人）對于先進(jìn)傳感模塊在硬件、軟件和算法層面的集成工作有豐富經(jīng)驗(yàn)。

補(bǔ)上結(jié)構(gòu)光缺失的第四維度：速度

根據(jù)Grand View Research的預(yù)測，AI機(jī)器人市場規(guī)模到2030年將達(dá)到1250億美元。然而，麥肯錫的數(shù)據(jù)顯示，超過60%的工業(yè)企業(yè)缺乏自主實(shí)施機(jī)器人自動化的內(nèi)部能力，包括傳感器集成能力。

企業(yè)的傳統(tǒng)解決方式，是從多家供應(yīng)商處拼湊感知系統(tǒng)，然后花費(fèi)數(shù)月時間校準(zhǔn)傳感器、編寫融合軟件并調(diào)試集成故障。

Lyte要解決的就是這個結(jié)構(gòu)性問題，他們以垂直整合技術(shù)棧的思路，將傳感硬件、定制芯片和感知軟件統(tǒng)一整合到單一平臺中，為自主機(jī)器（包括但不限于具身智能機(jī)器人）提供在現(xiàn)實(shí)世界中運(yùn)行所需的清晰而可靠的感知層。

結(jié)構(gòu)光（光編碼更通用的名稱）是一種重要的感知技術(shù)，它成功應(yīng)用于室內(nèi)空間和人臉識別。但結(jié)構(gòu)光有其局限：它只在近距離有效，且只能捕捉物體身在何處，而非去向何方。

對于在世界中移動的機(jī)器而言，這還遠(yuǎn)遠(yuǎn)不夠。一臺在倉庫中導(dǎo)航的機(jī)器人，不僅需要知道叉車在哪里，還需要知道叉車正以每秒四米的速度向它駛來。一個在人行道上行駛的配送機(jī)器人，不僅需要看見孩子，還需要看見孩子正在奔跑。

傳統(tǒng)傳感器捕捉的是位置。為了理解運(yùn)動，軟件需要比較不同的幀畫面：此刻的位置與前一刻的位置。這會引入延遲。在一個動態(tài)的世界里運(yùn)行，延遲是風(fēng)險的根源。

Lyte團(tuán)隊(duì)此前開發(fā)的體感設(shè)備不僅能看到人們的身體位置，還能追蹤他們的運(yùn)動方式。面部識別技術(shù)也不僅是繪制人們的的面容，更能確認(rèn)這張臉是活生生的、在場的、真實(shí)的。這兩項(xiàng)技術(shù)都能理解動態(tài)演進(jìn)的場景，而非靜止的瞬間。

現(xiàn)在，Lyte團(tuán)隊(duì)將同樣的能力應(yīng)用于更遠(yuǎn)的距離、更快的速度，以及在開放空間中運(yùn)行的機(jī)器。

他們開發(fā)了一個新的核心技術(shù)——“相干視覺”。這項(xiàng)技術(shù)在運(yùn)用光時，不再是投射圖案并讀取扭曲，而是發(fā)射連續(xù)信號并測量其返回信號。位置與速度，在同一瞬間被同時捕捉，無需事后計算，此能力內(nèi)建于測量本身。

運(yùn)用光的不同方式。它不再是投射圖案并讀取扭曲，而是發(fā)射連續(xù)信號并測量其返回信號。位置與速度，在同一瞬間被同時捕捉，無需事后計算，此能力內(nèi)建于測量本身。它為感知引入了第四個維度，就是速度。一個物體的位置及其運(yùn)動方向，被同時獲知。

通俗的說，過去需要靠算法補(bǔ)齊速度信息，所以有延遲，而“相干視覺”是靠物理層直接獲取速度信息，所以無延遲。

LyteVision，讓機(jī)器的“眼睛”與“大腦”直接對話

基于這個核心技術(shù)，Lyte團(tuán)隊(duì)打造了LyteGalaxy這個統(tǒng)一的空間智能平臺，它集傳感器、計算單元、軟件與算法于一體，為機(jī)器人構(gòu)筑起一個完整統(tǒng)一的感知技術(shù)棧。

而在感知方面，他們的核心硬件產(chǎn)品是LyteVision，這是一個端到端的感知系統(tǒng)，它在2026年CES上榮獲機(jī)器人技術(shù)“最佳創(chuàng)新獎”。這個新產(chǎn)品將先進(jìn)的4D傳感、RGB成像和運(yùn)動感知能力集成到單一平臺中，通過一個連接即可提供統(tǒng)一的空間與視覺數(shù)據(jù)。

它不僅統(tǒng)一了傳感器，還統(tǒng)一了從感知到智能的整條路徑：傳感器與芯片融合，芯片為軟件定制，軟件為AI計算而生。從光子觸及傳感器，到?jīng)Q策返回至機(jī)器的完整技術(shù)棧——單一架構(gòu)，無縫銜接。

具體來說，它經(jīng)過三大集成階段，將原始傳感器數(shù)據(jù)轉(zhuǎn)化為可執(zhí)行的智能信息。

第一步，感知。在即插即用、任務(wù)就緒的模塊中集成了4D相干視覺、RGB（可見光）和IMU（慣性測量單元）。這個模塊具備完整而緊湊的傳感功能，采用單電纜部署，是開箱即用的感知系統(tǒng)。

第二步，融合與處理。這套系統(tǒng)的定制芯片在硬件層面即時處理多傳感器融合，提供統(tǒng)一、時間同步的感知數(shù)據(jù)。讓開發(fā)者專注于構(gòu)建機(jī)器人行為，免除調(diào)試傳感器同步的麻煩。

第三步，理解。眼睛通過神經(jīng)系統(tǒng)連接大腦，而一個能看見世界的機(jī)器人，仍需理解它所見的一切。這意味著要將傳感器、芯片、軟件與人工智能計算連接起來，然后數(shù)據(jù)從邊緣流向云端再返回，模型處理機(jī)器感知到的信息，做出決策，發(fā)出指令。而且這整個閉環(huán)，在毫秒間完成。保證了即時性。

最終的成果是：LyteVision這個僅有單個連接器的獨(dú)立模塊，能將多個傳感器，統(tǒng)一輸出；而且能實(shí)時捕捉位置與速度，即刻部署。因?yàn)槟K的統(tǒng)一性，它讓每一臺使用它的機(jī)器都能共享對世界的一致“看法”。

感知物理世界是復(fù)雜的，但Lyte將這些復(fù)雜性內(nèi)部消化了，然后提供一個連接智能層的感知層。讓“眼睛”與“大腦”直接對話。

在適應(yīng)性上，LyteVision能夠賦能廣泛的實(shí)體AI平臺，包括自主移動機(jī)器人、機(jī)械臂、四足機(jī)器人、自動駕駛出租車和人形機(jī)器人。

“物理AI”還在早期，機(jī)會還有很多

隨著技術(shù)進(jìn)步，AI進(jìn)入越來越多的場景，而隨著物理AI的崛起，AI對感知的需求從靜止化、單一化向通用化、實(shí)時化發(fā)展。

以往，AI只需要識別出一個靜態(tài)的人臉，現(xiàn)在它要在開放而復(fù)雜的物理環(huán)境中自由行進(jìn)，隨時都可能有訓(xùn)練數(shù)據(jù)之外的“意外”發(fā)生。

Lyte團(tuán)隊(duì)從2005年開始就開始涉足機(jī)器的“感知”，他們沿著這個主要方向前進(jìn)，面對“物理AI”的新趨勢和新需求，創(chuàng)造出新的技術(shù)解決方案。

端到端是感知系統(tǒng)的下一個趨勢，特斯拉就是很好的例子。它沒有復(fù)雜的雷達(dá)和攝像頭結(jié)合的硬件系統(tǒng)，采用了純攝像頭方案，但是前端的攝像頭收集的巨量數(shù)據(jù)與后端的深度學(xué)習(xí)模型相結(jié)合，形成了數(shù)據(jù)飛輪，就能在不增加硬件復(fù)雜性的前提下，越來越強(qiáng)。

Lyte的產(chǎn)品，也是端到端的，它通過軟硬件結(jié)合的垂直整合技術(shù)，將感知系統(tǒng)的復(fù)雜性（硬件+軟件）內(nèi)化了，提供給客戶的是一個簡單的產(chǎn)品。而且這個產(chǎn)品足夠通用，能夠適應(yīng)客戶的各種硬件形態(tài)和應(yīng)用場景。

目前，“物理AI”還很早期，我們在此前的文章里總結(jié)過，它有賦能智能硬件的AI操作系統(tǒng)、掣肘世界模型發(fā)展的具身智能數(shù)據(jù)，以及“世界模型”不完善等缺項(xiàng)；但是用更細(xì)的眼光去看行業(yè)，缺項(xiàng)其實(shí)并不止這三大項(xiàng)，例如我們以為已經(jīng)成熟的感知，就有Lyte來進(jìn)行革新。

那么，無論是智能、感知，還是行動控制，無論是硬件層面，還是軟件層面，“物理AI”都還有很多突破的機(jī)會，值得創(chuàng)業(yè)者們?nèi)リJ。

本文系作者阿爾法公社授權(quán)鈦媒體發(fā)表，并經(jīng)鈦媒體編輯，轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號，文章內(nèi)容僅供參考、交流、學(xué)習(xí)，不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn)，點(diǎn)擊這里投稿。創(chuàng)業(yè)或融資尋求報道，點(diǎn)擊這里。

快報