當OpenClaw將AI帶入自主接管本地電腦時代,Agent接管所有終端的日子便已經開啟了降臨倒計時。而另一方面,OpenClaw的“具身化”——即對于物理AI世界的影響也迅速成為行業(yè)熱議的新課題。
2026年2月,ClawCon 2026(OpenClaw全球首場線下聚會)上,OpenClaw展示了直控人形機器人的能力,搭載OpenClaw的“龍蝦頭”人形機器人在人群中自主移動、與觀眾揮爪互動,并能檢測啤酒庫存和自動下單。這一突破驗證了OpenClaw的具身化潛力——無需專門軟件或算法,通過“日常對話”即可控制機器人。
而幾乎同時,國內的空間智能公司宸境科技(DeepMirror)也官宣將OpenClaw融入其核心物理AI產品,并接入宇樹科技(Unitree)的機器人軟件中間件,通過OpenClaw的推理能力與機器人底層控制系統(tǒng)的聯動,實現了“感知—理解—規(guī)劃—執(zhí)行”的完整閉環(huán)。據宸境科技介紹,該系統(tǒng)重點面向園區(qū)巡檢、安防管理、倉儲協(xié)作等場景,公司也計劃通過技能模塊(Skills)機制,持續(xù)拓展機器人在不同場景中的應用能力。
而站在這一事件背后的宸境科技,正是全球第一家提出空間智能(Spatial Intelligence)概念的公司。成立于2019年的宸境科技,至今已獲得共計5輪數億美元的融資,股東名單涵蓋火山石投資、OPPO、斯道資本、廣汽集團、IDG資本、臨港科創(chuàng)等一眾知名機構。創(chuàng)始人胡聞曾任李澤湘教授旗下工業(yè)機器人公司——李群自動化的CFO,后任小馬智行COO。而宸境科技的整個高管團隊更是充斥著谷歌Xlab、奧賽金牌、清華姚班、麻省理工等一眾豪華標簽。
以“空間智能”為核心技術脈絡的宸境科技,經過了AR/VR和元宇宙風口的起起伏伏,終于迎來了今天具身智能賽道的爆發(fā)。在率先實現OpenClaw的具身化嘗試之際,我們有幸與宸境科技創(chuàng)始人胡聞進行了一場深度對話,不僅還原了這一技術整合的幕后細節(jié),更拆解了宸境科技在具身智能時代的核心布局與戰(zhàn)略思考。
▎以下為與胡聞的對話全文,略有刪減:
當OpenClaw接管具身智能
創(chuàng)投家:OpenClaw對于具身智能到底意味著什么?
胡聞:它意味著具身智能從特殊用途設備向通用智能體的范式轉移的開始,是機器人領域的操作系統(tǒng)級變革。如果說之前的機器人像功能機,由硬件定義行為,OpenClaw的接入則讓它變成了智能機,由軟件定義行為。
具體體現在以下兩個方面:
第一,賦予機器人常識與推理。傳統(tǒng)機器人依賴預設的規(guī)則,而OpenClaw接入了大模型,讓機器人擁有對物理世界的常識性理解。例如機器狗不再只是執(zhí)行走到A點的指令,而是能理解現在是下午3點,人少,先去檢查消防通道這樣的復雜邏輯。
第二,構建感知-理解-規(guī)劃-執(zhí)行的完整閉環(huán)。它作為軟件基礎設施,打通了云端智能與物理執(zhí)行層,讓機器人成為真正自主的物理AI Agent。
創(chuàng)投家:OpenClaw是如何接管機器人的?
胡聞:接管的核心邏輯是一致的。OpenClaw充當了大腦(大模型)與身體(硬件)之間的操作系統(tǒng)。
可以把接管電腦理解為接入機器人的MVP。接管電腦其實是接管數字世界。OpenClaw通過在本地運行一個常駐的Gateway Daemon來接管電腦。這個進程擁有對操作系統(tǒng)的極高權限,它通過看屏幕截圖、點鼠標、敲鍵盤來操作一切應用,本質是在模擬人類操作。
而接入機器人是接管物理世界,邏輯是一致的。OpenClaw接入宇樹機器人的軟件中間件,將Gateway發(fā)出的指令,如向前走或者抓取,翻譯成機器人的底層運動控制信號,同時將傳感器數據——例如攝像頭、觸覺傳感器——回傳給大腦進行多模態(tài)理解和分析。
創(chuàng)投家:接管之后有什么具體的變化?
胡聞:目前達到了初步自主智能的水平,在特定場景下表現得挺不錯。
我們在杭州臨平區(qū)藝尚小鎮(zhèn)落地了一個物理AI的場景。在園區(qū)機器狗巡檢和導覽的場景中,我們不需要再去用Pad指揮機器狗去到具體的A點,只需要通過語音傳達模糊的指令,例如這位游客渴了,麻煩帶他去買瓶可樂,機器狗會自主理解并引領游客去自動販賣機。
同時,機器人不僅僅能夠通過實時感知做決策,還能根據時間、人流量動態(tài)調整路線和優(yōu)先級。它能在沒有人類明確指示的情況下,自主決定先完成高優(yōu)先級的任務。
創(chuàng)投家:OpenClaw接管物理AI引發(fā)的潛在風險是否會比接管個人電腦更嚴重?
胡聞:這點確實有爭議。因為數字世界的錯誤可以通過修改數據修正,而物理世界的錯誤更加麻煩。
接管電腦引發(fā)的爭議——如誤刪郵件等——主要集中在隱私和財產安全。當OpenClaw接入機器人后,爭議將觸及物理安全,包括對人和物損害、控制相對滯后、接管不及時以及責任界定的模糊性。這也是無人系統(tǒng)需要長期解決的問題。
創(chuàng)投家:現在就開始探索OpenClaw的接管,對于整個行業(yè)來說,是否還是過早了?
何佳:從技術成熟度看有點早,但從產業(yè)探索的規(guī)律看,現在必要開始做了。這是一個應用倒逼技術的典型階段。
如果等所有數據訓練完美再行動,就會錯失寶貴的真實世界反饋。OpenClaw的接入,本質上是讓機器人在真實環(huán)境中去獲取那些仿真環(huán)境里永遠無法生成的長尾數據和corner cases。這個接入方式讓大家開始重寫下一代操作系統(tǒng),也就是真正的AI系統(tǒng)的規(guī)則。
空間智能:世界模型的底層infra
創(chuàng)投家:宸境科技是如何定義空間智能的?
胡聞:宸境科技對空間智能的定義是通過將世界模型與高精度空間感知硬件相結合,鏈接空間、場景、數據和用戶,構建了一個從物理信號輸入到行為決策輸出的全鏈路閉環(huán)。其目標是讓機器人像人類一樣,憑直覺在復雜多變的真實世界中穩(wěn)定工作,最終成為物理任務的標準化感知規(guī)劃一體的空間數字基礎設施 。
創(chuàng)投家:宸境科技是如何完成從AR/VR、元宇宙等概念轉型到具身智能領域的?
胡聞:其實宸境科技一直堅持的是空間智能,我們也是全球第一個提出空間智能和Spatial Intelligence的公司。AR/VR、元宇宙和具身智能都只是本體和場景的遷移。
我們的核心邏輯是將原先為人在數字世界交互而構建的空間智能基礎設施,移植到機器人身上,成為物理AI的基礎設施。
宸境已經有多年的技術積累、場景經驗、大量的空間數據以及強大的研發(fā)和工程能力。從多傳感器前融合、世界模型,包括此次發(fā)布的Insight空間相機、TinyNav算法庫和RoboSpatial工具鏈,正是這套能力的體現。
創(chuàng)投家:空間智能是否可以理解為世界模型中的一種?
胡聞:準確地說,空間智能是世界模型的一個底層的infra,世界模型的內涵更廣。
首先,空間智能是世界模型的必要前提??臻g智能提供了對三維世界的感知、理解和推理能力,這是構建世界模型的基礎。沒有強大的空間智能,世界模型就會缺乏對物理布局、物體尺寸、空間關系的準確表征,就像一個大模型沒有視覺能力一樣。李飛飛教授現在也在補齊空間智能的物理層的能力。
其次,世界模型是空間智能的超級擴展。世界模型不僅包含空間(Where/What),還包含時間(When/Next)、物理規(guī)律(Why/How)乃至常識(Common Sense)。它需要預測如果我推動這個杯子,它會倒下并碎掉這樣的因果關系。
我們可以把空間智能理解為靜態(tài)或動態(tài)的空間結構理解,而世界模型是基于這種理解對未來狀態(tài)的推演。李飛飛教授指出世界模型必須具備生成性、多模態(tài)和交互性,這一點我們的認知是一致的。
創(chuàng)投家:目前主流具身企業(yè)會如何選擇合作的空間算法合作伙伴?
胡聞:主要會從以下幾個維度考慮:
第一,魯棒性與精度。算法必須在光照變化、動態(tài)干擾、傳感器噪聲下穩(wěn)定輸出位姿和定位,工程化要求非常高。例如Insight相機具備24g抗震和強光抑制能力,就是為了保證極端工況下的精度。
第二,計算效率與功耗。具身智能的算力在端側,算法必須輕量。像視覺token壓縮等,為了在保證性能的同時降低計算消耗。端側10TOPS的算力內閉環(huán)處理也是關鍵。
第三,泛化能力。算法不能僅在一個實驗室好用,換一個場景就失靈。這就需要算法本身具備對未知環(huán)境的適應性,而世界模型正是通過合成無限多樣的數據來提升這種泛化性。
第四,特定場景的數據積累,這一點是護城河。其中包括數據的場景特異性——通用的預訓練模型無法理解特定工廠的消防通道在哪、特定倉庫的貨架布局有何異常。只有長期在特定場景運行,積累該場景的空間先驗,才能實現精準決策。同時包括結構化知識庫——單純的3D點云不夠,需要將其轉化為帶語義的空間知識庫。RoboSpatial平臺的作用正是將環(huán)境信息結構化存儲并智能調用。
創(chuàng)投家:宸境科技在數據采集上有什么獨特的護城河?
胡聞:數采也是我們的亮點。
第一是協(xié)同式采集。我們有個強大的平臺,支持多設備——包括專有的采集設備、手機、平板、眼鏡以及Looper相機——的多位姿協(xié)同采集。這種方式能極大提高采集效率,并且通過多視角融合,構建出的數據集更完整、精度更高,這也是我們早期的核心能力。
第二是同步技術。為了解決多傳感器數據不同步、數據不同源的痛點,我們實現了多攝像頭(也可以加上激光雷達)的硬件級時間同步與方位對齊。這種傳感器前融合級別的采集,保證了生成的點云與RGB圖像是像素級對齊的,為后續(xù)的AI訓練提供了高質量數據。
第三是自動化AI構建。在采集到原始數據后,利用AI自動進行三維重建、feature獲取和語義分割,形成結構化的數據集。
關于2026
創(chuàng)投家:您對宸境科技的2026年有怎樣的期待?
胡聞:宸境科技希望今年沖刺港股,現在最關注的是技術領先性、產品商業(yè)化能力以及頭部企業(yè)合作。
具體的戰(zhàn)略規(guī)劃包括:
第一,全面進軍具身智能的數個產品發(fā)布。1月正式發(fā)布具身智能品牌LooperRobotics,推出Insight相機、TinyNav算法、RoboSpatial平臺三大產品,定位為機器人提供標準化眼睛和感知規(guī)劃的底座。第三季度還有一個大的產品發(fā)布會。
第二,深化產業(yè)合作。聯合宇樹科技開展行業(yè)解決方案,并與地瓜機器人等生態(tài)伙伴深度合作。
第三,推動技術落地。重點面向園區(qū)巡檢、安防管理、倉儲協(xié)作等場景,提升機器人在復雜場景中的感知和自主決策能力,強化快速集成和部署能力。
第四,構建開源生態(tài)。TinyNav定位為開源機器人導航系統(tǒng),通過降低開發(fā)者門檻來構建生態(tài)。
寫在最后:
從全球第一個提出空間智能概念,到第一個完成OpenClaw對宇樹機器人的接入,宸境科技身體力行地證明了一件事:風口的遷移和變化,掩蓋不了良好的技術傳承與不斷突破創(chuàng)新的堅持。在這個技術飛速迭代的時代,每一天都有可能誕生改變行業(yè)格局和公司命運的契機。在具身智能的舞臺上,不僅有耀眼的新生代整機廠,更有一批終于等到能將自身長年的技術積累施展落地的“前輩”。
對于宸境科技而言,收獲的季節(jié)或許才剛剛開始。







快報
根據《網絡安全法》實名制要求,請綁定手機號后發(fā)表評論