文 | 日晞野望,作者|咸閑
8月9日,在世界機(jī)器人大會(huì)的演講臺(tái)上,宇樹(shù)科技創(chuàng)始人王興興談?wù)摰侥壳皺C(jī)器人運(yùn)動(dòng)控制領(lǐng)域存在的RL Scaling Law問(wèn)題,他認(rèn)為現(xiàn)在的機(jī)器人在學(xué)習(xí)一項(xiàng)新的技能時(shí),往往都是需要從頭開(kāi)始研究以及教學(xué)。
而在未來(lái)更加希望的是能夠在原有的基礎(chǔ)上去不斷學(xué)習(xí),使得他們的學(xué)習(xí)速度更加快速以及效果更好。
整個(gè)具身智能行業(yè)在目前并沒(méi)有人將強(qiáng)化學(xué)習(xí)的Scaling Law做好,所研究的算力增長(zhǎng)、數(shù)據(jù)堆積,并不能直接讓機(jī)械手臂變得更加靈巧,或者讓雙足的機(jī)器人走得更穩(wěn)。
事實(shí)上,問(wèn)題并不在于我們所提供的硬件、數(shù)據(jù)不夠好,而是其“大腦進(jìn)化”以及環(huán)境不斷適應(yīng),那么,面對(duì)具身智能Scaling Law缺失,我們是否應(yīng)該如同嬰兒時(shí)的教學(xué),讓其不斷嘗試,具備真正不斷演化的能力,促使機(jī)器人界的"摩爾定律"誕生?
算力增長(zhǎng)≠智能進(jìn)化:具身智能的物理瓶頸困局
在目前的人工智能領(lǐng)域,我們逐漸認(rèn)為當(dāng)我們提供了更多的數(shù)據(jù)以及算力時(shí),就能夠支撐機(jī)器人擁有更聰明的能力。
例如,ChatGPT的發(fā)展似乎印證了這一點(diǎn)——給它更大的模型、更多的訓(xùn)練文本,它就能寫出更流暢的文章,解答更復(fù)雜的問(wèn)題。
我們可以知道在虛擬ai領(lǐng)域,數(shù)據(jù)是單一的,規(guī)則是明確的,所以增加算力和數(shù)據(jù)就能夠去提升虛擬ai的性能。
但當(dāng)這樣的方式放到機(jī)器人的身上,在它與現(xiàn)實(shí)世界交互的時(shí)候,我們發(fā)現(xiàn)其真實(shí)效果往往就會(huì)受到不同材質(zhì)的摩擦、空氣阻力、物體形變等產(chǎn)生隨機(jī)性影響,比如,運(yùn)行中會(huì)被一些障礙物絆倒等。
哈佛大學(xué)的"機(jī)器螞蟻"實(shí)驗(yàn)生動(dòng)地展示了這個(gè)困境。研究人員給這個(gè)小機(jī)器人增加了10倍的運(yùn)算能力,期待它能更好地適應(yīng)復(fù)雜地形。
但結(jié)果令人失望:它的環(huán)境適應(yīng)能力只提升了微不足道的2%。問(wèn)題不在于芯片不夠強(qiáng),而在于螞蟻的機(jī)械腿無(wú)法像真實(shí)昆蟲(chóng)那樣靈敏地感知和適應(yīng)地面變化。
所以,現(xiàn)實(shí)世界中無(wú)數(shù)的物理特性就讓機(jī)器人在運(yùn)行出現(xiàn)了無(wú)數(shù)個(gè)"意外狀況"。
并且,如今機(jī)器人在學(xué)習(xí)新的技能以及適應(yīng)新環(huán)境時(shí),其芯片總是會(huì)需要較大的能耗。
這并不是通過(guò)技術(shù)的不斷進(jìn)化,從而減少能耗的消耗量能夠解決的問(wèn)題,而是應(yīng)該去面對(duì)根本性的缺陷:機(jī)器人還在用"蠻力計(jì)算"來(lái)對(duì)抗物理法則。
這樣的困境揭示了一個(gè)深刻的事實(shí):在機(jī)器人領(lǐng)域,單純的算力增長(zhǎng)就像給汽車裝了強(qiáng)勁的引擎,卻忘了我們所要前行的道路是崎嶇、坑洼的道路,它是否能夠?qū)崟r(shí)應(yīng)對(duì)路況呢?
我們更加希望的是其能夠像人類的生物系統(tǒng)一樣,總是在原有的基礎(chǔ)之上不斷進(jìn)化,去面臨并解決受物理世界制約的困境。
達(dá)爾文式進(jìn)化:具身智能的身體適應(yīng)智慧
真正智能的關(guān)鍵并不是在于它的“大腦”學(xué)習(xí)的東西是不是足夠多,就比如在自然界中,章魚(yú)沒(méi)有脊椎動(dòng)物那樣集中的大腦,它的5億神經(jīng)元分布在觸手中,卻能讓八條腕足各自獨(dú)立抓取、探測(cè)甚至"思考"。
然而,這樣的生物所體現(xiàn)的行為是不同于機(jī)器人的集中依靠數(shù)據(jù)驅(qū)動(dòng)的“大腦”智能模式,而是將身體本身也作為計(jì)算的一部分。
過(guò)去,機(jī)器人和AI的進(jìn)步主要靠堆算力和數(shù)據(jù),就像不斷給計(jì)算機(jī)提供大量的知識(shí),希望它變得更加聰明。
但事實(shí)上的現(xiàn)實(shí)智能發(fā)展,無(wú)論是人類嬰兒學(xué)步,還是動(dòng)物的精準(zhǔn)捕獵,都依賴著我們的身體與環(huán)境的實(shí)時(shí)互動(dòng)。
所以我們更加需要它的身體有著的自己適應(yīng)能力——就像人類肌肉會(huì)在出現(xiàn)突發(fā)狀況時(shí),主動(dòng)產(chǎn)生一定的行為。
然而機(jī)器人需要適應(yīng)的是未在提前預(yù)設(shè)的情況下,根據(jù)指令以及環(huán)境變換,提供不同的狀態(tài)和行為。
正如,王興興所提及希望當(dāng)機(jī)器人處于一個(gè)新的環(huán)境時(shí),能夠主動(dòng)去探索一些事物,來(lái)滿足我們所提供的指令,而不是我們將一些具體的數(shù)據(jù)提供給它,只需要照做就行。
未來(lái)的突破點(diǎn)可能在于其“身體”和“大腦”的像自然生物一樣共同進(jìn)化,算法不再需要為每個(gè)細(xì)微的環(huán)境狀況進(jìn)行不斷地訓(xùn)練,而是像生物那樣在互動(dòng)中自然調(diào)整。
這條路雖然艱難,但自然界的進(jìn)化史當(dāng)中已經(jīng)證明其可行性。從單細(xì)胞生物到人類,生命進(jìn)化或許給我們提供了較優(yōu)方向。
未來(lái)的機(jī)器人或許需要向生物學(xué)習(xí),發(fā)展出與物理世界和諧共處的"身體智能"。
真正的突破,不是建造更精密的機(jī)械臂,而是創(chuàng)造出更加具有生命力的機(jī)器人。
重塑衡量標(biāo)準(zhǔn):具身智能需要擁抱"生存力"
對(duì)于具身智能來(lái)說(shuō),真正的考驗(yàn)從來(lái)不是重復(fù)完成某個(gè)固定任務(wù),而是在變化中保持穩(wěn)定。
目前的機(jī)器人缺乏真正的抗干擾智慧——不是避免犯錯(cuò),而是犯錯(cuò)后快速修正的本事。
我們總是笑著現(xiàn)在的機(jī)器人有著些許笨拙的行為,甚至對(duì)于它們的動(dòng)作稱之為“老太行為”,但對(duì)于這樣還需不斷進(jìn)化的具身智能來(lái)說(shuō),應(yīng)該把"容錯(cuò)率"變成衡量智能的新尺度。畢竟在真實(shí)世界里,穩(wěn)定比精準(zhǔn)更重要。
像在孩童時(shí)期,當(dāng)我們拿起保溫杯時(shí),不需要重新學(xué)習(xí)"抓握"這個(gè)動(dòng)作——我們知道它和馬克杯一樣都是圓柱形容器,只需微調(diào)力度,就能夠同樣的拿起這個(gè)東西。
但今天的機(jī)器人完美掌握馬克杯后,面對(duì)保溫杯時(shí)又要從零開(kāi)始訓(xùn)練。問(wèn)題不在于它不夠"聰明",而在于它缺乏對(duì)"杯子"這個(gè)概念的真正理解。
這種"泛化能力"的缺失,暴露了當(dāng)前機(jī)器人學(xué)習(xí)的核心缺陷:它們通過(guò)海量數(shù)據(jù)只能記住對(duì)于這個(gè)特定物體的抓取方式,卻無(wú)法抽象出通用規(guī)律。
真正的突破可能需要讓機(jī)器人像孩子一樣,先理解"抓握"的本質(zhì)(形狀、重量、摩擦力之間的關(guān)系),而不是死記硬背每個(gè)物體的數(shù)據(jù)。
當(dāng)測(cè)評(píng)標(biāo)準(zhǔn)轉(zhuǎn)向"生命力"而非"精準(zhǔn)度",具身智能才能突破現(xiàn)在的天花板,邁向真正的實(shí)用化。
參考資料:
1.杭州ai之都— —王興興“炸裂”發(fā)言:機(jī)器人的ChatGPT時(shí)刻 即將到來(lái)丨王興興在2025世界機(jī)器人大會(huì)演講實(shí)錄(文字+視頻)
2. 機(jī)器之心— — 機(jī)器人邁向ChatGPT時(shí)刻!清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws







快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論