8月24日下午,2024世界機(jī)器人大會(huì)上,舉行了一場期待已久的中國、美國“具身智能”與人形機(jī)器人領(lǐng)域?qū)W者的圓桌對(duì)談。

“機(jī)器狗之父”、美國波士頓動(dòng)力創(chuàng)始人Marc Raibert(馬克·雷伯特)首次來到北京。他說,“我簡直不敢相信,不僅是機(jī)器人的數(shù)量,難以置信,還有這么多熱情的人參加了展覽。中國對(duì)機(jī)器人的興奮和熱情很高。”

而此次與Marc對(duì)談的四位CEO所在的公司也不尋常:除了宇樹科技之外,星動(dòng)紀(jì)元、銀河通用、北京具身智能機(jī)器人創(chuàng)新中心都成立不足2年,一出道就是具身智能和人形機(jī)器人行業(yè)的“頂流”。

星動(dòng)紀(jì)元、銀河通用背后也站著中國最高學(xué)府:北大和清華,代表著中國前沿科技創(chuàng)新的重要來源。

其中,星動(dòng)紀(jì)元由姚期智帶領(lǐng)的清華大學(xué)交叉信息研究院孵化成立的,星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇現(xiàn)在還是清華大學(xué)交叉信息研究院助理教授,公司融資超億元,聯(lián)想創(chuàng)投已加入其中。

銀河通用機(jī)器人創(chuàng)始人的王鶴則是北京大學(xué)助理教授,也是北京智源人工智能研究院具身智能研究中心主任,過去半年,銀河通用完成天使輪融資共計(jì)7億元人民幣,刷新了國內(nèi)人形機(jī)器人領(lǐng)域單輪融資規(guī)模,美團(tuán)戰(zhàn)投、北汽產(chǎn)投、商湯國香基金、訊飛基金、啟明創(chuàng)投、藍(lán)馳創(chuàng)投、經(jīng)緯創(chuàng)投、源碼資本、IDG資本等頭部財(cái)務(wù)機(jī)構(gòu)都參與其中。

而北京具身智能機(jī)器人創(chuàng)新中心則是北京市發(fā)起成立的機(jī)器人“國家隊(duì)”機(jī)構(gòu)。北京具身智能機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍,目前還是“人形機(jī)器人第一股”優(yōu)必選科技CTO。

Unitree Robotics(宇樹科技)也是當(dāng)下人形機(jī)器人行業(yè)的明星企業(yè)。公司創(chuàng)始人、CEO、CTO王興興畢業(yè)于上海大學(xué),取得了機(jī)械工程碩士,具有近10多年足式機(jī)器人研發(fā)經(jīng)驗(yàn),擁有產(chǎn)品從0-1-100的研發(fā)與商業(yè)化落地能力,100+項(xiàng)機(jī)器人相關(guān)專利。

此次圓桌由德國慕尼黑工業(yè)大學(xué)教授 Alois.C.Knoll主持,美國波士頓動(dòng)力創(chuàng)始人Marc Raibert(馬克·雷伯特),與中國四大AI機(jī)器人企業(yè)領(lǐng)軍者——陳建宇、王興興、王鶴、熊友軍,五人圍繞機(jī)器人行業(yè)、AI 大模型驅(qū)動(dòng)機(jī)器人發(fā)展等議題展開討論。

一個(gè)多小時(shí)的圓桌當(dāng)中,Marc表示,未來5年,機(jī)器人硬件發(fā)展仍將非常重要,但同時(shí),能夠打破語義理解障礙的基礎(chǔ)模型或其他 AI 方法也將對(duì)機(jī)器人技術(shù)產(chǎn)生更大的影響。不過,要想取得機(jī)器人領(lǐng)域真正的進(jìn)步,就需要更高的可靠性和安全性,未來人們需要投入大量資源努力解決此類問題。

Marc非常不看好人形機(jī)器人行業(yè)。他認(rèn)為,工業(yè)機(jī)器人已經(jīng)非常成熟,而且能夠商業(yè)化,目前人形機(jī)器人“在某種程度上是一種炫耀,而不是一種生產(chǎn)力”。

陳建宇表示,過去10年AI發(fā)展很快,從簡單的圖像處理,到深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí),再到ChatGPT技術(shù),這對(duì)于未來“具身智能”產(chǎn)生很大的影響。未來幾年,AI、具身智能會(huì)與人形機(jī)器人不斷融合,去訓(xùn)練一個(gè)通用模型。他相信未來5年,我們將迎來“機(jī)器人的ChatGPT時(shí)刻”。

王鶴指出,當(dāng)前 AI 大模型在機(jī)器人上仍有巨大的局限,尤其是“泛化的開瓶蓋”技能還沒有訓(xùn)練出來,但同時(shí),這也是大模型帶來了重要機(jī)會(huì),一旦大模型涌現(xiàn)能力不斷加強(qiáng),他認(rèn)為未來5年,依然有一個(gè)至少做操作任務(wù)的通用機(jī)器人機(jī)會(huì)。

熊友軍表示,當(dāng)前關(guān)節(jié)性能提升、高的能量和電池密度的提升非???,使得機(jī)器人的運(yùn)動(dòng)控制能力、電機(jī)等方面提升非???。未來5年,機(jī)器人關(guān)節(jié)和能量密度會(huì)持續(xù)提升。畢竟和人類相比,現(xiàn)在機(jī)器人的能量執(zhí)行效率還是有非常大的差距。

以下是鈦媒體AGI編輯對(duì)此次圓桌全文整理:

問:您能否向觀眾簡單介紹一下您的工作:您為什么以及什么時(shí)候開始對(duì)人形機(jī)器人感興趣的?

Alois C. Knoll:歡迎各位,大家下午好!剛才我們聽到了幾位嘉賓有非常精彩的演講,我們現(xiàn)在已經(jīng)有點(diǎn)推遲了,但是我們會(huì)花一點(diǎn)時(shí)間在接下來的對(duì)話上面,因?yàn)檫@是大家都非常期待的。

我作為主持人,希望做一個(gè)簡短的介紹,在人形機(jī)器人方面已經(jīng)有了很長的發(fā)展歷史,為不太了解這段歷史的觀眾做一下介紹。大家可能不知道人類創(chuàng)造的第一臺(tái)機(jī)器人就是人形機(jī)器人,是1920年一位捷克的作家寫了一部科幻劇,它在1921年進(jìn)行了全球的首演,這是100多年前的事情了,這部科幻劇就是首次在英語和整個(gè)科幻小說界引入機(jī)器人Robot這個(gè)詞,即便那個(gè)時(shí)候我們已經(jīng)在思考機(jī)器人統(tǒng)治人類的一個(gè)想象,所以從最開始機(jī)器人就有著非常負(fù)面的意義,所以我們當(dāng)年創(chuàng)作的第一部科幻劇當(dāng)中,就說機(jī)器人會(huì)征服人類。

您可以在右邊看到這是當(dāng)時(shí)在舞臺(tái)上演出時(shí)候使用的機(jī)器人,它實(shí)際上是1939年為世界博覽會(huì)創(chuàng)造的機(jī)器人,叫做Electro,它能夠行走,能通過語音指令來執(zhí)行任務(wù),能抽煙,能做其它有趣的事情,它能說大概700個(gè)單詞,甚至它的眼睛通過光電的程序可以區(qū)分紅光和綠光。此外Electro有一個(gè)機(jī)器狗叫做Sparkle,這是差不多80年前的事情了,所以太陽底下無新事。

這是我個(gè)人認(rèn)為的一些重要的歷史時(shí)間點(diǎn),1973年實(shí)際上是微處理器發(fā)明之后不久,全尺寸人形機(jī)器人Robot1被創(chuàng)造出來了,它來自日本早稻田大學(xué)。后面我們又發(fā)布了Robot2,這款機(jī)器人可以閱讀樂譜,并且彈奏電子鍵盤,它的頭部有攝像頭,已經(jīng)具備5根手指的機(jī)械手了,這是在1980年,44年之前了。

然后我們進(jìn)入了第二個(gè)時(shí)代,就是會(huì)行走的人形機(jī)器人,這里有很多實(shí)驗(yàn)室,有一家日本的公司,他在1984年就創(chuàng)造了能夠行走的人形機(jī)器人,本田其實(shí)也做了一些機(jī)器人,他在2005年也做了第二個(gè)機(jī)器人的項(xiàng)目,很不幸的是本田把這個(gè)項(xiàng)目砍掉了,就像Marc剛才說的,你要是想掙大錢,特別是在那個(gè)時(shí)候,機(jī)器人這個(gè)賽道,尤其是人形機(jī)器人并不是你最佳的選擇,但是在未來我們期待它會(huì)有變化的。

第一波的研究是從1980年到2005年,主要關(guān)注于行走。第二波大概1985年到2010年,除了步行之外還有全身的運(yùn)動(dòng),在右邊可以看到它當(dāng)時(shí)在玩一個(gè)桌面游戲,另外這個(gè)機(jī)器人也是來自早稻田大學(xué),也是差不多20年前的事情了。

自我來推介一下,2000年的時(shí)候我就開始來參加人形機(jī)器人方面的一系列會(huì)議,2000年的時(shí)候我們出現(xiàn)了HRPR核森,國際電氣電子工程協(xié)會(huì)就創(chuàng)造了機(jī)器人和自動(dòng)化協(xié)會(huì),我當(dāng)時(shí)就開始做參會(huì)。這些年我們不斷發(fā)展,最近這期是2024年在法國會(huì)舉辦。如果大家感興趣可以去我們網(wǎng)站查看,它可以看到最新的信息,大家可以借此探索一下人形機(jī)器人的歷史。

剛才我們看到了各位嘉賓給大家看到的非常精彩的機(jī)器人視頻,大家自有判斷。但是像剛才王先生說的一樣,現(xiàn)在已經(jīng)進(jìn)入新的時(shí)代,我們發(fā)展可能是指數(shù)級(jí)爆炸性的增長。這就是我作為主持人簡單的介紹,現(xiàn)在進(jìn)入討論和問答環(huán)節(jié)。我想問一下討論嘉賓,請(qǐng)每位嘉賓簡短地向我和聽眾們介紹一下您和人形機(jī)器人的聯(lián)系。為什么對(duì)機(jī)器人感興趣,何時(shí)對(duì)機(jī)器人干興趣。

我先來介紹,我一般是作為討論嘉賓,但是今天擔(dān)任主持人也給大家說一下。我來自慕尼黑工業(yè)大學(xué),2001年開始就在計(jì)算機(jī)科學(xué)領(lǐng)域工作。我對(duì)于人形機(jī)器人一直都非常感興趣,我認(rèn)為它對(duì)智能具身來說非常重要。慕尼黑工業(yè)大學(xué)之前有一位先驅(qū)已經(jīng)退休了,他和我當(dāng)時(shí)就在研究具身智能。我們認(rèn)為人形機(jī)器人最好發(fā)展就是以人形來設(shè)計(jì)機(jī)器人,它會(huì)和世界和自然建立緊密聯(lián)系。機(jī)器人的身體應(yīng)該和人的身體有同樣的設(shè)計(jì)和科學(xué),否則機(jī)器人要發(fā)展很困難。所以大家可以看到這里有一系列機(jī)器人圖片,左下角是可以在手里滾球。

下面到Marc這邊,能不能再多分享一下。剛才已經(jīng)說到您和人形機(jī)器人聯(lián)系,從何時(shí)您開始對(duì)人形機(jī)器人感興趣?

Marc:我認(rèn)為您剛才展示的圖片,對(duì)我這個(gè)問題的回答非常有幫助。如果說人形就意味著直立行走,兩臂兩腿還有頭,那我直到最近才開始感興趣。因?yàn)槲乙恢闭J(rèn)為作為一個(gè)公司來說功能最重要。包括靈活性、感知、智能,形式和外觀是次要的。另一方面對(duì)于人的精氣神來說它的動(dòng)能像生命一樣像人一樣。

我一直是人形機(jī)器人的文思,雖然我們第一個(gè)做的只是向人形機(jī)器人漸進(jìn)的過程,但是我認(rèn)為核心就像做的蹦跳機(jī)器人一樣。我們剛開始做也是這樣的概念,它要像人一樣,有時(shí)候還要有一個(gè)腦袋直立行走。

它不是只關(guān)于工程和科學(xué),而是公眾們對(duì)此非常感興趣,特別熱情。我們當(dāng)時(shí)做的大狗沒有像后來做的人形機(jī)器人那樣獲得公眾如此熱烈的反應(yīng)。

熊友軍:我是從讀博士的時(shí)候,2000年開始做機(jī)器人的研發(fā),當(dāng)時(shí)讀博士的時(shí)候,那時(shí)候更多的是做工業(yè)領(lǐng)域、特種領(lǐng)域的一些機(jī)器人,用在一些危險(xiǎn)的環(huán)境里面,因?yàn)槟菚r(shí)候機(jī)器人技術(shù)還是非常不成熟,但在很多特種領(lǐng)域和危險(xiǎn)場景里面,是需要用機(jī)器人去完成工作了,然而那時(shí)候機(jī)器智能實(shí)際上是很差的。所以我們當(dāng)時(shí)想的辦法,是將機(jī)器人的智能跟人的智能結(jié)合起來,所以做了一些機(jī)器人要操作的一些事情。
北京具身智能機(jī)器人創(chuàng)新中心總經(jīng)理 熊友軍

北京具身智能機(jī)器人創(chuàng)新中心總經(jīng)理 熊友軍

但在遙控操作完成這些工作的過程中,我們發(fā)現(xiàn)有很多的場景,實(shí)際上用輪式的工業(yè)機(jī)械手臂是解決不了的,尤其是有時(shí)候在一些特種場景環(huán)境比較狹小,然后環(huán)境比較復(fù)雜的輪式,然后履帶式實(shí)際上根本就進(jìn)不去,但是人是可以進(jìn)去。還有一種,是要試用很多工具去完成那些工作。

所以當(dāng)時(shí)我們就覺得,如果說有微型機(jī)器人的話,實(shí)際上應(yīng)該是能夠提供很好的解決工具,或者一種解決方案,但是我們當(dāng)時(shí)那時(shí)候也看到了日本本田ASIMO,給我們提供了很多的一些啟發(fā),所以那時(shí)候我就對(duì)人形機(jī)器人非常感興趣。后面畢業(yè)之后,一直在做機(jī)器人相關(guān)的工作,

2012年,我跟優(yōu)必選科技CEO周劍先生創(chuàng)立了公司,做人形機(jī)器人研發(fā)工作,去年從深圳到北京開始籌建具身智能機(jī)器人創(chuàng)新中心,現(xiàn)在也是一直在聚焦人形機(jī)器人方面的研發(fā),主要的想法是希望說能夠解決人形機(jī)器人方面的一些共性、關(guān)鍵的技術(shù)問題,比如本體的一些基礎(chǔ)研發(fā)不足,其實(shí)我們現(xiàn)在微型機(jī)器人在本體在關(guān)鍵的核心器件,然后在一些傳感器方面其實(shí)上有非常多要攻克的地方。另外在運(yùn)動(dòng)控制,實(shí)際上我們也做了非常多的運(yùn)動(dòng)控制的技術(shù)研發(fā),采用深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)的這種運(yùn)動(dòng)控制的方式,包括現(xiàn)在也用一些融神經(jīng)網(wǎng)絡(luò)的一些方式用去做運(yùn)動(dòng)控制,同時(shí)其實(shí)我們現(xiàn)在還在做關(guān)于智能方面的一些研發(fā),比如說把用現(xiàn)在具身智能的方式,做一些基礎(chǔ)性工作,比如建它的數(shù)據(jù)集,研發(fā)機(jī)器人大模型框架等。所以這就是現(xiàn)在我在做的一些事情。

陳建宇:其實(shí)這個(gè)興趣是很小的時(shí)候,就一直對(duì)智能機(jī)器人非常感興趣,我印象很深刻,剛剛興興說她10歲的時(shí)候,我估計(jì)也是差不多類似的時(shí)間,不過當(dāng)時(shí)看的不是波士頓動(dòng)力,當(dāng)時(shí)關(guān)注的是ASIMO系列機(jī)器人,當(dāng)時(shí)我就非常的去著迷。然后我覺得,創(chuàng)業(yè)這件事其實(shí)是充滿了挑戰(zhàn)性的,marc創(chuàng)辦了波士頓動(dòng)力做了40多年,其實(shí)我是非常尊敬的,就是說你沒有一個(gè)發(fā)自內(nèi)心的、天生熱愛的話,其實(shí)很難去堅(jiān)持下來的。所以對(duì)我來說,對(duì)這類機(jī)器人的熱愛,我覺得某種程度上是從小就具備就擁有的。

那么真正開始做機(jī)器人其實(shí)是本科的時(shí)候。當(dāng)時(shí)在學(xué)校里面,我就接觸真正意義上的機(jī)器人的研究,當(dāng)時(shí)接觸了雙足機(jī)器人,主要是做的就是捕獲點(diǎn)步態(tài)規(guī)劃相關(guān)的研究。后來,博士階段繼續(xù)做機(jī)器人,雖然不是人形機(jī)器人,但是也是相關(guān)的一些機(jī)器人的領(lǐng)域,控制它的學(xué)習(xí),包括無人車和機(jī)械臂。而真正的去全力做人形機(jī)器人,是在我回國之后,然后在現(xiàn)在清華正式投入去做人形機(jī)器人,還孵化了星動(dòng)紀(jì)元公司,如今我們已經(jīng)做了最新一代、第六代機(jī)器人了,然后我們也在展會(huì)上面帶來了我們機(jī)器人的實(shí)物,歡迎大家去關(guān)注。

王興興:大家好,我是宇樹科技創(chuàng)始人王興興,剛才有提到我大概可能10歲的時(shí)候就看過marc先生在MIT實(shí)驗(yàn)室做的雙足,還有單條腿的機(jī)器人,然后印象非常深,在09年、10年的時(shí)候,大概大一寒假,我就做過一個(gè)小的人形機(jī)器人,然后當(dāng)時(shí)做的不是特別滿意,然后后來的話,就在研究生期間做了XDog這款機(jī)器人,差不多在13年到15 16年,這款機(jī)器人的話又采用了比較低成本的硬件,然后運(yùn)動(dòng)性能非常好,可以直接實(shí)現(xiàn)關(guān)節(jié)的力控以及整機(jī)的力控。

后來的話,一開始我對(duì)人體機(jī)器人的技術(shù)還是跟相對(duì)來說比較悲觀的,但是后來的話在2022年左右,整個(gè)的機(jī)器人、AI技術(shù)的進(jìn)步,然后再加上ChatGPT出來以后,大家都看到人形機(jī)器人和AI結(jié)合的可能性,所以說我們公司又重新開始做人形機(jī)器人。說實(shí)在的,其實(shí)我真正感興趣的并不是說人形機(jī)器人,而是新的一個(gè)智能體機(jī)器人的形態(tài)。而人形機(jī)器人可能只是說目前大家比較公認(rèn)的、一個(gè)最有可能性的通用機(jī)器人和通用AI的結(jié)合體,但是這可能并不是個(gè)唯一的,我真正希望能誕生甚至更比人更高級(jí)的一個(gè)智能體形態(tài),可以大大推動(dòng)整個(gè)人類工業(yè)的變革,推動(dòng)新的工業(yè)革命。

王鶴:我是北京大學(xué)計(jì)算機(jī)學(xué)院助理教授,也是北大銀河通用具身智能聯(lián)合實(shí)驗(yàn)室的主任王鶴,那么,我跟人形機(jī)器人、具身智能結(jié)緣,主要是從我在斯坦福大學(xué)開始讀博的時(shí)候。那么2016年的時(shí)候,當(dāng)時(shí)深度學(xué)習(xí)技術(shù)已經(jīng)出來了,也應(yīng)用在很多圖像識(shí)別分類這些任務(wù)當(dāng)中。那么當(dāng)時(shí)作為一個(gè)前沿研究,我們?cè)噲D去理解人類是如何把感知思考還有交互的能力融合在一起的。

所以我博士期間的第一個(gè)工作,就用一個(gè)視覺模型來看桌面上人的動(dòng)作和物體的一個(gè)運(yùn)動(dòng),然后推理人下一步想要什么,這是一個(gè)語言模型。

最后再用一個(gè)簡單的機(jī)器人,智能的馬克杯去響應(yīng)人的動(dòng)作,那么這個(gè)工作獲得了歐洲圖形學(xué)的最佳論文提名,但是我們認(rèn)為它非常的不足,就是我們的一個(gè)馬克杯只能在桌面上移動(dòng)響應(yīng)人的動(dòng)作,它沒有跟人交互的能力,我們的視覺只能看有限的幾一種物體,那么我們的語言模型只能根據(jù)這個(gè)人跟這些桌面東西的一些動(dòng)作來做簡單的推理。

那么通過過去8年我們的研究,在怎么樣把機(jī)器人的操作能力搞得更泛化,什么東西都能抓,都能夠放置,那么還有跟現(xiàn)在的多模態(tài)大模型技術(shù)結(jié)合,真的明白人類想讓你干什么,那么言出法隨的去執(zhí)行,所以去年我們就孵化了北京銀河通用這家人形機(jī)器人公司,我們現(xiàn)在也是把視覺、語言、動(dòng)作這三種不同的模態(tài)融合到大模型當(dāng)中,真正的賦能人形機(jī)器人,讓人形機(jī)器人能夠走進(jìn)千行百業(yè)、千家萬戶,這是我們的愿景。

問:你認(rèn)為,我們今天擁有的哪些重要技術(shù)是 10 年前沒有的,但對(duì)于實(shí)用的人形機(jī)器人來說卻至關(guān)重要?它們?cè)谖磥?5 年將如何發(fā)展?

Marc:我認(rèn)為硬件開發(fā)仍將非常重要。如果我們談?wù)撐磥?5 年,毫無疑問,能夠打破語義理解障礙的基礎(chǔ)模型或其他人工智能方法將產(chǎn)生最大的影響。
波士頓動(dòng)力創(chuàng)始人Marc Raibert

波士頓動(dòng)力創(chuàng)始人Marc Raibert

我認(rèn)為,人類可以做的就是,概括和理解他們所看到事物的含義,而目前還無法真正捕捉到這些含義。我相信,如果人工智能能夠在這方面取得進(jìn)展,我認(rèn)為它將產(chǎn)生巨大的影響。

實(shí)際上,過去十年來,每個(gè)人都在計(jì)算機(jī)、傳感器、感知、控制等方面取得了巨大進(jìn)步。電池,我認(rèn)為人們忘記了電池。雖然電池是工業(yè)時(shí)代的產(chǎn)物,但是它們確實(shí)非常重要。是的,所以在電機(jī)方面過去 5 年里,人們做得很好,我認(rèn)為電機(jī)已經(jīng)取得了長足的進(jìn)步,當(dāng)然,我們將看到更多。

陳建宇:我從AI的視角來講一講,覺得非常大的一個(gè)不同。如果按照10年前的話,其實(shí)是2014年左右,當(dāng)時(shí)是DeepLearning剛剛出來不久,它其實(shí)解決了很大一部分,比如圖像處理等等一些問題。

那么后面,其實(shí)有我認(rèn)為兩個(gè)最重要的里程碑:一個(gè)是以16年阿爾法狗為代表的深度學(xué)習(xí),緊接著把它用在了強(qiáng)化學(xué)習(xí)上面,做深度強(qiáng)化學(xué)習(xí),解決了一些問題;第二個(gè)是以ChatGPT為代表的大語言模型,所以這點(diǎn)我認(rèn)為是過去10年沒有的,但又對(duì)未來我們?nèi)诵螜C(jī)器人,或者是具身智能起到非常大的決定性作用的兩個(gè)因素。

那么可能在接下來的這幾年時(shí)間,這兩項(xiàng)技術(shù)會(huì)非常深度的跟人形機(jī)器人、具身智能融合起來,但他們也分別需要經(jīng)過一定程度的訓(xùn)練,從而能訓(xùn)練比較通用的一個(gè)模型,那么我們也能解決更加豐富的物理世界的數(shù)據(jù)程序。那么我相信,在接下來的5年,這幾項(xiàng)技術(shù)都能起到非常大的一個(gè)進(jìn)展,我們可能會(huì)在5年內(nèi)迎來“機(jī)器人的ChatGPT時(shí)刻”。
清華大學(xué)交叉信息研究院助理教授、星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇

清華大學(xué)交叉信息研究院助理教授、星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇

王興興:對(duì)過去10年最大的,還是AI技術(shù)帶來的各種事情有更多的信心。我覺得除了 AI技術(shù)本身最大的點(diǎn),對(duì)于人形機(jī)器人,對(duì)于整個(gè)社會(huì)共識(shí)的增加也是非常關(guān)鍵的,就是目前大家更加相信AI,更加相信人形機(jī)器人可以誕生更多價(jià)值,這在10年前是完全不能想象的,那時(shí)整個(gè)社會(huì)基本上對(duì)此都完全沒有信心。

另外一點(diǎn)的話,我覺得在未來5年,總體上是肯定整個(gè) AI 機(jī)器人、AI模型變化會(huì)非常快,因?yàn)槟壳暗腁I真的是日新月異,大家可以用AI集成技術(shù),去搭建各種自己的模型去做訓(xùn)練,這整個(gè)已經(jīng)變成一個(gè)非常的扁平化,以及容易操作的過程,其實(shí)很多人大家都可以參與進(jìn)來,去做機(jī)器人模型并且去做訓(xùn)練,所以我覺得。未來5年這塊的各種AI模型創(chuàng)新,包括更新的一些神經(jīng)網(wǎng)絡(luò)模型,包括脈沖神經(jīng)網(wǎng)絡(luò)等都有很大的一些機(jī)會(huì)。

王鶴:我覺得10年好快,10年前是2014年,其實(shí)我們已經(jīng)看到inbody的AI,甚至不是一個(gè)在西方的學(xué)術(shù)界比較popular的詞匯,那么過去的十年,我覺得一大技術(shù)的進(jìn)展,就是我們?cè)诰呱碇悄芾镱^已經(jīng)有一些技能實(shí)現(xiàn)了非常強(qiáng)的泛化性。

那么以我個(gè)人的研究舉例,在抓取問題上,我們?nèi)〉昧吮容^長足的進(jìn)步,那么我們從只能抓方塊圓的這些特定形狀的物體,到基于三維視覺傳感器,我們可以抓不透明、不反光,也就是在深度傳感器里頭能完美成像的這些物體,到我們最近的技術(shù)能夠預(yù)測(cè)透明、高反光、金屬、吸光這些非常有挑戰(zhàn)材質(zhì)的物體,基于它去做泛化抓取操作。

那么在今天的展廳,我們都接受觀眾給我們的各種形狀,各種材質(zhì)隨便堆疊亂七八糟的物體,我們的機(jī)器人都展示了非常泛化和高成功率的抓取能力,那么現(xiàn)在的問題是,像這樣的每一個(gè)技能,大家都在分分別的去做開發(fā),那么很多人會(huì)提問你能幫我抓水瓶,你能不能幫我把瓶蓋給擰開?我非常不好意思的說,現(xiàn)在泛化的開瓶蓋技能我們還沒有訓(xùn)練出來,這個(gè)就是大模型能夠帶給我們的機(jī)會(huì),那么大語言模型涌現(xiàn),也就是這種緊急行為緊急行為,他能夠在只見一次或者是第一次零次的演示的情況下,他都理解你要生成什么樣的文字,我們相信未來的5年給我們的機(jī)會(huì)就是發(fā)展機(jī)器人基礎(chǔ)大模型,它能夠?qū)崿F(xiàn)涌現(xiàn)能力,它吞吐足夠量的數(shù)據(jù)后,有靈巧手,它能夠抓能夠加、能夠擰,能夠掰各種基本的手的各種運(yùn)動(dòng)能力都有了以后,他能涌現(xiàn),我們給他看一個(gè)視頻,他就能理解這個(gè)活怎么干,到那個(gè)時(shí)候我們真正的就有一個(gè)通用的、至少做操作任務(wù)的的機(jī)器人了,這是我認(rèn)為未來5年的一個(gè)機(jī)會(huì)。

熊友軍:我覺得這一輪的機(jī)器人技術(shù)的進(jìn)步主要是由AI來驅(qū)動(dòng)的。毫無疑問, AI驅(qū)動(dòng)我覺得體現(xiàn)在幾個(gè)方面。

第一個(gè)就是它人機(jī)交互性能得到了極大的提升。我記得10年前我們做人工智能、做機(jī)器人的時(shí)候的那些交互,如果說我要加語音加視覺,第成本非常高,第二個(gè)我們要做大量的研發(fā)的工作,我們需要幾個(gè)博士、碩士帶著一個(gè)團(tuán)隊(duì),花很長的時(shí)間才能夠完成一些物體識(shí)別、語音合成,自然語言理解NLP,還有甚至是TTS、語音合成等方面的一些工作,甚至包括導(dǎo)航,但是我覺得,現(xiàn)在隨著技術(shù)的進(jìn)步,我們現(xiàn)在做人形機(jī)器人的大模型,我們直接一個(gè)端到端的直接語音給指定給他,然后很快他就可以有比較好的行為輸出,有很好的意圖理解,然后做任務(wù)規(guī)劃等。這是一方面,我覺得這一輪對(duì)人機(jī)交互、對(duì)動(dòng)物的規(guī)劃、對(duì)執(zhí)行等方面都有巨大提升,在10年前基本上都很難去想象。

然后第二個(gè)現(xiàn)在的這些硬件方面也有極大的提升,體現(xiàn)在兩個(gè)方向,第一個(gè)現(xiàn)在關(guān)節(jié)的性能的提升是非??斓?,大家可以看到很多公司機(jī)器人可以開始去做一些非常動(dòng)態(tài)的、劇烈的運(yùn)動(dòng),實(shí)際上離不開關(guān)節(jié)性能的提升、高能量密度比,然后高的轉(zhuǎn)速、高性能等這些技術(shù)的提升,實(shí)際上,在10年前我覺得是很難去做到的。當(dāng)然了這也有運(yùn)動(dòng)控制能力的提升、電機(jī)的提升,現(xiàn)在其實(shí)也有采用更多結(jié)構(gòu)設(shè)計(jì)的方式,更適合它的布局等方面都有非常大的進(jìn)步,包括把腿的轉(zhuǎn)成慣量、把電機(jī)往上提等等,有各種各樣的結(jié)構(gòu)設(shè)計(jì)的技術(shù)的變化。

另外,剛才還提到能量,其實(shí)早前我覺得10年前我們做機(jī)器人的時(shí)候,一個(gè)電池就像我們背后要背一個(gè)非常巨大的電池包能源包,而且能夠持續(xù)的時(shí)間很短。但是這幾年隨著新能源汽車對(duì)電池技術(shù)的推動(dòng)作用,其實(shí)我們看到它的電池能量密度大幅提升,我現(xiàn)在一個(gè)比較小的電池,可以支持比較長的時(shí)間,我覺得這是一個(gè)非常重要的技術(shù)突破。

未來,我覺得5年之后,這幾個(gè)可能還是一個(gè)重大、要突破的方向,像剛才說的人機(jī)交互方面,我們希望大模型能提供更長期的任務(wù)規(guī)劃,然后做意圖理解等等方面,我覺得我們能只要給他一個(gè)非常模糊的指令,他就可以給我們輸出我們很標(biāo)準(zhǔn)的很自然的這種交互的結(jié)果。第二方面,可能就是在規(guī)劃實(shí)施任務(wù)方面是一個(gè)非常重大、要攻克的方向,我們環(huán)境會(huì)經(jīng)常變,面對(duì)的是一個(gè)動(dòng)態(tài)環(huán)境,然后機(jī)器人能夠根據(jù)環(huán)境變化,能夠?qū)崟r(shí)去改變它的一些執(zhí)行策略等。當(dāng)然,像能量方面我覺得是一個(gè)持續(xù)要提升的,它畢竟現(xiàn)在能量執(zhí)行效率和我們?nèi)讼啾?,還是有非常大的一個(gè)差距。

問:大規(guī)模部署人形機(jī)器人需要完成哪些任務(wù)?

Marc:但是如果你現(xiàn)在從更宏觀的角度來看,我剛才說了如果你想致富你現(xiàn)在就不會(huì)著手開公司,但是如果你想生存下去。你至少也得收支平衡。

我想這是一個(gè)更長遠(yuǎn)的計(jì)劃,我認(rèn)為要想取得真正的進(jìn)步,你必須暫停,或者我不是說你必須暫停,我們?cè)谖业难芯克鶗和#寵C(jī)器人更可靠的本地目標(biāo)將是一件關(guān)鍵的事情,如果我能指出舊金山的自動(dòng)駕駛汽車,他們殺死了一個(gè)人,這實(shí)際上甚至不是自動(dòng)駕駛汽車的墜落。然后克魯茲完全退出了舊金山。我知道現(xiàn)在還有很多事情在進(jìn)行,但這在機(jī)器人領(lǐng)域很容易發(fā)生。因此,可靠性是一個(gè)關(guān)鍵因素,這是人們投入大量資源努力解決的問題之一。但這無助于解決,將我們帶入下一代的更大問題。當(dāng)我說我不認(rèn)為每個(gè)人都必須專注于你所說的真正有用的東西時(shí)。

陳建宇:要做到大規(guī)模應(yīng)用的話,有非常重要兩個(gè)事情:一個(gè)是能不能找到大規(guī)模的需求,另一個(gè)能不能有我們技術(shù),足夠去實(shí)現(xiàn)、滿足需求。

其實(shí)現(xiàn)在有很多零散的表演需求,如果需要真的達(dá)到max(大規(guī)模)的話,我覺得主要還是看勞動(dòng)力,非常密集的一些產(chǎn)業(yè),比如三個(gè)階段,一個(gè)是工業(yè)、商用和服務(wù)。

大體我認(rèn)為,技術(shù)也基本上是按照這樣一個(gè)方向去成熟發(fā)展,其中我覺得給我的感受,我認(rèn)為工業(yè)的話可能會(huì)比較快就能夠去用上了。其實(shí)剛才Marc的報(bào)告中里面也已經(jīng)展現(xiàn)出來了,不管是人形,還是一些輪式的機(jī)器人,在工廠搬運(yùn)的這一類的環(huán)境里面,已經(jīng)是達(dá)到了非常接近人類的一個(gè)節(jié)點(diǎn),那么在未來,它可能會(huì)更快更強(qiáng)大,然后以及成本更低,達(dá)到這個(gè)時(shí)候的話,其實(shí)它的第一個(gè)大規(guī)模應(yīng)用的點(diǎn)就到了。

王鶴:我覺得具身智能今天不能講完全成熟,但是我們今天GPT能力搭配人形機(jī)器人,其實(shí)已經(jīng)能夠在很多場合干事情了。

像我們今天在展臺(tái)展示了就是在一個(gè)零售的場景,那么用戶可以下單,我們的機(jī)器人可以根據(jù)你的具體下單的內(nèi)容,是拿一個(gè)冰紅茶,還是拿一個(gè)巧克力,那么我們從貨架把它取下來,同時(shí)我們也可以從地面的籃子里頭把這些貨不斷的上到貨架上,我們也可以從更大的一個(gè)倉儲(chǔ)的料架上,抱著一箱東西放到傳送帶上。

這些場景其實(shí)都展示了,目前具身智能對(duì)于比較糙的活,就是抓取放置和雙手抱持這樣的能力已經(jīng)走向成熟。

在這種情況下,我們還要問一個(gè)問題,為什么是這個(gè)人形對(duì)吧?有很多人現(xiàn)場問我,你們?yōu)槭裁匆龀扇诵??因?yàn)槟阆肴绻浖苌系囊粋€(gè)商品掉在地上了,我的機(jī)器人得有能力去夠地面這么低的東西,我的貨架可能兩米高,我要能夠抓到兩米那么高的東西,同時(shí)我還能還得來回走動(dòng),還要得有兩只手才能抱住一個(gè)箱子,又有兩只手又能高又能低又能夠來回走,那么它基本上就把形態(tài)往人基本上非常的靠攏了,那么我們目前用的是一個(gè)輪式底盤,沒有腿,那么也已經(jīng)達(dá)到這樣的一個(gè)能力了。那么我們認(rèn)為像這樣的抓取放置搬運(yùn)的能力,在很多行業(yè),比如說零售,比如說工廠,比如說一些服務(wù)的場景全都可以用起來。
北京大學(xué)助理教授、銀河通用機(jī)器人創(chuàng)始人王鶴

北京大學(xué)助理教授、銀河通用機(jī)器人創(chuàng)始人 王鶴

所以我判斷,人形機(jī)器人的大規(guī)模應(yīng)用,2025年、2026年我們將見到從百臺(tái)級(jí)到千臺(tái)級(jí)的一個(gè)快速的增長,

王興興:我個(gè)人的話,總體來說,對(duì)目前整個(gè)人形機(jī)器人應(yīng)用落地還是需要一些時(shí)間,但當(dāng)下,包括今年和明年對(duì)一些簡單場景,像特斯拉場景里面把一個(gè)電池從什么地方裝到什么地方里面,這種簡單的,用模仿學(xué)習(xí)能做的事情,目前的AI技術(shù)其實(shí)成功率還是做的比較高了,今年或明年可以做一些應(yīng)用,包括把整個(gè)的GPT速度也提升。

但是我覺得,真正要提升人形機(jī)器人大規(guī)模應(yīng)用,確實(shí)還需要更多的時(shí)間,把機(jī)器人的模型本身做得更好一點(diǎn),讓它更通用,基本上無論是更精細(xì)化的或者更泛用心的一些事情都可以做一起來,所以我還是希望社會(huì)大眾對(duì)AI和機(jī)器人能更多一些耐心。但實(shí)際上可能中國其實(shí)還是有很多人比較心急的,我覺得還是大家可以再多給一點(diǎn)耐心。謝謝。

熊友軍:我覺得人形經(jīng)濟(jì)和大規(guī)模的應(yīng)用,其實(shí)上這個(gè)就涉及到一個(gè)商業(yè)化場景選擇的問題,實(shí)際上,并不是說現(xiàn)在人形機(jī)器人不能夠應(yīng)用,而是說要再看什么場景。我覺得在有一些剛需的場景,或者對(duì)人不可達(dá)到的這種場景,還是有一些可以用的,尤其是這種剛性需求的,比如搶險(xiǎn)救災(zāi),特種的對(duì)核輻射,或者是說有毒有害氣體環(huán)境等等,這些我覺得現(xiàn)在實(shí)際上是可以用的。

大家其實(shí)想的更多是,技術(shù)怎么去提升,然后怎么它能夠讓人形機(jī)器人能夠快速適應(yīng)更多的場景,然后把成本快速的降下來,只有這樣通過一方面通過技術(shù)的提升,提高有更多工作效率,讓人有更好的體驗(yàn)感,然后更多人愿意用它。

第二方面,就是把成本繼續(xù)往下降,我覺得讓大家更買得起,這個(gè)我覺得要是要想的這個(gè)方式。

另外我覺得還有一種,就是商業(yè)模式上的探索,實(shí)際上人形機(jī)器人是我覺得是一個(gè)集大成者,它基本上涵蓋了機(jī)器人和人工智能的絕大部分的技術(shù)領(lǐng)域,然后在人體技術(shù)上的研究能夠大大的推進(jìn)這些技術(shù)的成熟,然后技術(shù)甚至技術(shù)的市場化,我們可以采用“沿途下蛋”方式獲得這個(gè)商業(yè)的利潤。通過這些其他的一些技術(shù),人形機(jī)器人產(chǎn)品上孵化的其他技術(shù)商業(yè)化、產(chǎn)業(yè)化來推動(dòng)人形機(jī)器人研究。一個(gè)典型的例子,就是我們現(xiàn)在有一些人形機(jī)器人公司已經(jīng)在其他產(chǎn)品上實(shí)現(xiàn)盈利,然后已經(jīng)實(shí)現(xiàn)了一個(gè)很好的商業(yè)化,這我覺得是一種非常好的模式。

問:作為技術(shù)人員,我們是否意識(shí)到有很多機(jī)器人都有道德倫理方面的顧慮——我們?nèi)绾尾拍芟@些顧慮?

Marc:我認(rèn)為,從最高層面來說,理解所有技術(shù)都涉及一些風(fēng)險(xiǎn)和機(jī)遇是很重要的。我參加了一個(gè)政府會(huì)議,但我聽到許多政府的人都在談?wù)摫O(jiān)管人工智能,而壓倒性的感覺是關(guān)注最糟糕的結(jié)果,對(duì)嗎?

比如在歐洲,來自英國一位人士在發(fā)言,讓我印象深刻的是,人們幾乎陷入恐慌,擔(dān)心最糟糕的事情會(huì)發(fā)生,并且不惜一切代價(jià)想要阻止這種事情發(fā)生。但我認(rèn)為,不利用機(jī)會(huì)的風(fēng)險(xiǎn)與讓壞事發(fā)生的風(fēng)險(xiǎn)一樣大。

所以我認(rèn)為,正如開發(fā)人員指出的那樣,我們需要找到一種平衡,當(dāng)我們撰寫論文時(shí),我們會(huì)在開頭列出這些內(nèi)容。這些都是我們工作可能產(chǎn)生的巨大影響,但我們從不談?wù)撐覀兊墓ぷ?,可能產(chǎn)生的壞事是什么。

我們需要誠實(shí)和開放,更加公平地對(duì)待這個(gè)問題,但隨后繼續(xù)強(qiáng)調(diào)這種平衡,并以某種方式防止我們錯(cuò)過機(jī)會(huì),我認(rèn)為由于公眾的恐懼,這種機(jī)會(huì)很容易發(fā)生。

陳建宇:我覺得人們對(duì)這個(gè)人形機(jī)器人、或者相應(yīng)的具身智能機(jī)器人技術(shù)的擔(dān)憂,其實(shí)核心來自于對(duì)自身安全性的一個(gè)擔(dān)憂。

安全其實(shí)有幾個(gè)不同的層次,最底層的層次是物理的安全,大家擔(dān)心機(jī)器人會(huì)不會(huì)在工作的時(shí)候去傷害到人,那么這是一個(gè)層次;當(dāng)然其實(shí)在它分情況,那么比如說我們剛才說的如果是工廠里面的話,其實(shí)如果我們把它跟人工作環(huán)境隔開,其實(shí)一定程度上能解決這個(gè)問題;同時(shí),我們也需要從我們的算法硬件等等上面做的更魯棒來去優(yōu)化這個(gè)問題。

那么第二個(gè)層次,其實(shí)也是生存上面的問題,但是不是說物理層面的,那么也是不是說全人類的一個(gè)擔(dān)憂,而是說有一部分人一個(gè)擔(dān)憂,他擔(dān)心這個(gè)會(huì)替代咱們的某一些工作,大家會(huì)有擔(dān)憂,我覺得這個(gè)事情可能需要政府或者商號(hào)進(jìn)行有一些引導(dǎo),我們盡量的開始去做一些確實(shí)勞動(dòng)力非常緊缺的這樣的一些產(chǎn)業(yè),比如說我們一些非常惡劣環(huán)境工業(yè)環(huán)境,或者是比如說養(yǎng)老等。

當(dāng)然第三個(gè)層面,如果未來我們的具身智能機(jī)器人真正擁有了意識(shí),那么這個(gè)會(huì)對(duì)人類的自我存在的價(jià)值可能產(chǎn)生一些擔(dān)憂,我覺得這個(gè)事是更遠(yuǎn)的和更大的topic。

王興興:我覺得機(jī)器人的倫理道德和安全性問題,是非常重要的一件事情,而且我覺得,要希望是在場所有的人都大家需要共同去維護(hù)的一件事情,就有點(diǎn)像現(xiàn)在新能源汽車以及無人駕駛,它其實(shí)還是有很多安全性問題,并且比如說有一輛早些年新能源汽車起火了,或者有一家新能源汽車無人駕駛出了交通事故,這個(gè)對(duì)整個(gè)行業(yè)影響是非常大的,會(huì)降低普通老百姓對(duì)技術(shù)行業(yè)的認(rèn)可度以及信心。

這個(gè)事情很容易發(fā)生在人形機(jī)器人和AI這個(gè)領(lǐng)域。所以我一直覺得。當(dāng)下以及未來大家都應(yīng)該在機(jī)器人安全性上,無論是出臺(tái)一些規(guī)章政策,或者做一些更好的引導(dǎo),或者需要全世界政府出臺(tái)一些相關(guān)的政策,都共同推動(dòng)整個(gè)行業(yè)的健康發(fā)展。
Unitree Robotics(宇樹科技)創(chuàng)始人、CEO、CTO王興興

Unitree Robotics(宇樹科技)創(chuàng)始人、CEO、CTO王興興

王鶴:所以我就從技術(shù)的角度,人形機(jī)器人它的一個(gè)面向終局的技術(shù)必然是大模型,那么其實(shí)只有大模型才可能實(shí)現(xiàn)非常高的通用性,把很多能力全部匯集在一起,把很多模態(tài),從視覺感知,到語言理解,到動(dòng)作執(zhí)行,那么融會(huì)貫通,那么今天我們?cè)诩夹g(shù)上其實(shí)是有方法對(duì)大模型的行為進(jìn)行限制,就是“對(duì)齊”,我們?cè)诖竽P蛢?nèi)部已經(jīng)進(jìn)行了深入研究,那么未來,我們會(huì)對(duì)語言模型、多模態(tài)模型進(jìn)行更深入的對(duì)齊,讓它不會(huì)傷害到我們的人類,并且他的技能會(huì)被局限在服務(wù)的范疇內(nèi),那么這一些是我們技術(shù)上能做的,在技術(shù)上之外,必然還需要政府社會(huì)和國際的合作。

熊友軍:我覺得前面幾位都說的都挺好的,我就補(bǔ)充一點(diǎn),就是說我覺得應(yīng)該是有一些行業(yè)組織或者是政府出來,更多在法律法規(guī)這方面更多的立法,包括更多的是做全社會(huì)的機(jī)器人使用、倫理道德方面的一些教育。因?yàn)槲矣X得,任何一個(gè)機(jī)器人也是一種工具,放在不同人的手上,它的可能有不同的使用方法,然后只有加強(qiáng)教育,提升大家對(duì)人工智能對(duì)人形機(jī)器人的使用,讓大家相對(duì)安全角度去考慮,我覺得才是一個(gè)正確的方式。

問:您認(rèn)為 5 年后人形機(jī)器人行業(yè)會(huì)發(fā)展到什么程度?哪些經(jīng)濟(jì)領(lǐng)域?qū)⒙氏仁褂盟鼈儯?/strong>

Marc:不,我認(rèn)為人形機(jī)器人的出現(xiàn)讓事情變得復(fù)雜。我認(rèn)為機(jī)器人在工業(yè)領(lǐng)域的應(yīng)用將取得很大進(jìn)展。我認(rèn)為機(jī)器人的應(yīng)用非常廣泛。人們對(duì)此非常關(guān)注。正如大家所說,使機(jī)器人變得越來越好的技術(shù)確實(shí)正在日趨成熟。我認(rèn)為工業(yè)將繼續(xù)取得進(jìn)步。

我認(rèn)為人形機(jī)器人本身總體上仍然非常不成熟。所以我看不到它們。我知道你可以看看一些人形機(jī)器人公司與汽車公司合作的演示。我認(rèn)為這在某種程度上是一種炫耀,而不是一種生產(chǎn)力。我不知道這是不是題外話。如果你看看倉庫機(jī)器人,你會(huì)發(fā)現(xiàn)最大的挑戰(zhàn)之一是系統(tǒng)集成,特別是如果它不是圍繞機(jī)器人設(shè)計(jì)的全新倉庫。

我認(rèn)為許多倉庫機(jī)器人供應(yīng)商都在苦苦掙扎,因?yàn)樗麄冃枰粋€(gè)系統(tǒng)集成商,而這個(gè)系統(tǒng)集成商會(huì)消耗掉太多的預(yù)算,因此很難賺錢,這是因?yàn)檫\(yùn)營倉庫的 IT 人員并不想開放他們的系統(tǒng)。在那里工作的人并不想改變他們現(xiàn)在做的一切。如果機(jī)器人可以處理每一項(xiàng)任務(wù),那就意味著他們?nèi)匀恍枰粋€(gè)人來完成任務(wù)。使用任何類型的機(jī)器人對(duì)行業(yè)來說都具有很大的復(fù)雜性。我認(rèn)為這些都是重要因素。

說實(shí)話,我原本以為 Spot 會(huì)取得更大的成功,但 Spot 的推出只是一次實(shí)驗(yàn)。我們之所以設(shè)計(jì) Spot,是因?yàn)樗軌蜃屇氵B接自己的傳感器,因?yàn)槲覀儾恢廊藗兿胍裁礃拥膫鞲衅?。我們之所以設(shè)計(jì) Spot,是因?yàn)樗軌蜃屇銓?duì)它進(jìn)行編程,因?yàn)槲覀儾恢垃F(xiàn)在的用戶們都有哪些應(yīng)用程序,而我們對(duì)它們的使用方式有了更多了解,開發(fā)人員正專注于巨大機(jī)遇,因此 Spot 對(duì)人們的接受度確實(shí)產(chǎn)生了影響。

也許如果我們沒有足夠的商人,能夠提前進(jìn)入并評(píng)估它是什么,我們實(shí)際上是在做一個(gè)實(shí)驗(yàn)。也許人形機(jī)器人會(huì)有更好的記錄。

王鶴:我覺得我對(duì)人形機(jī)器人的發(fā)展總體是比較樂觀的,那么在未來5年,我們要完成真正的大規(guī)模應(yīng)用,這件事情對(duì)于整個(gè)人形機(jī)器人仍然是一個(gè)先慢后快,其中慢的階段,那么一個(gè)里程碑應(yīng)該是——在5年的時(shí)候我們能達(dá)到萬臺(tái)人形機(jī)器人級(jí)別的應(yīng)用。

這樣的一個(gè)市場大約是對(duì)標(biāo)現(xiàn)在商業(yè)清潔機(jī)器人。我們舉個(gè)例子,在超市在萬達(dá)廣場在寫字樓一層,我們看來回去洗地擦地的機(jī)器人,那么領(lǐng)先的這個(gè)市場,中國最領(lǐng)先的公司大約是每年出貨1萬臺(tái),那么他做的事情不局限做這么簡單的事情,它能達(dá)到在各種場景,不管是商超還是寫字樓,還是很多不同的場景進(jìn)行清潔,但是當(dāng)然是平面清潔。

那么,對(duì)于我們?nèi)诵螜C(jī)器人來說,我們希望能做到一個(gè)立體操作,但是它的能力可能是局限的,我搬運(yùn)我就是上貨,我就是取貨,對(duì)吧?

我沒有更多的能力,但是我也要實(shí)現(xiàn)跨場景的應(yīng)用,可以在超市里、可以在工廠里、可以在服務(wù)場景等等。那么能達(dá)到5年1萬臺(tái)的市場規(guī)模的話,我相信后面有真實(shí)世界數(shù)據(jù)的回流,那時(shí),我們會(huì)看到人形機(jī)器人應(yīng)用規(guī)模會(huì)加快,從慢時(shí)代進(jìn)入快時(shí)代。

熊友軍:人形機(jī)器人我對(duì)它的應(yīng)用可能會(huì)更加樂觀一點(diǎn),其實(shí)大家看到這兩年人形機(jī)器人的進(jìn)步非常快,尤其在AI驅(qū)動(dòng)下面,實(shí)際上在市場應(yīng)用方面,你們已經(jīng)可以看到國的有一些企業(yè),包括全球企業(yè)已經(jīng)開始在一些場景里面做試點(diǎn)應(yīng)用了。

比如說在汽車廠,比如在一些商用服務(wù)場景,已經(jīng)開始做試點(diǎn),隨著這個(gè)試點(diǎn)數(shù)據(jù)會(huì)形成一個(gè)飛輪的效應(yīng),所以試點(diǎn)進(jìn)展,然后它會(huì)有更多的迭代,然后有更多數(shù)據(jù)驅(qū)動(dòng),機(jī)器人會(huì)在在一些特定的環(huán)境里面提高效率,它的速度,它的隨著量的增長,它的價(jià)格會(huì)大幅的降低,這樣我覺得會(huì)更快的去促進(jìn)產(chǎn)業(yè)的應(yīng)用。

我覺得今年年底,大家應(yīng)該可以看到,有一部分的公司已經(jīng)能夠在一些比如說新能源汽車廠,比如說在一些特種領(lǐng)域已經(jīng)開始應(yīng)用,明年我覺得應(yīng)該可以看到一些可能千臺(tái)左右量級(jí)的出貨。

問:你能在我們的年輕觀眾中“點(diǎn)燃一把火”,讓他們也想成為“機(jī)器人專家”嗎?他們應(yīng)該怎么做?

Marc:我認(rèn)為伊隆·馬斯克本人憑借他的雄心和資源,可能在幾年內(nèi)推出10000個(gè)機(jī)器人,不一定是因?yàn)樗鼈儠?huì)直接讓機(jī)器人賺錢,但看看他對(duì)電動(dòng)汽車所做的一切。他們從無人相信到現(xiàn)在,我比這里的任何人都更加懷疑,包括我在內(nèi),到每家汽車公司都有淘汰內(nèi)燃機(jī)的計(jì)劃。

我認(rèn)為這是一件了不起的事情。他似乎對(duì)此很認(rèn)真。所以這在整個(gè)人形機(jī)器人領(lǐng)域都是一個(gè)真正不確定性的因素。我不確定如果他沒有抓住機(jī)會(huì),是否會(huì)有這么多人形機(jī)器人。

我認(rèn)為機(jī)器人玩得越有趣,人們就越能與它們互動(dòng)。我到處走走,我沒有帶機(jī)器人來這里,但這里有很多機(jī)器人,但我到處發(fā)表演講,發(fā)現(xiàn)機(jī)器人在計(jì)劃中相當(dāng)無聊。你總是能吸引一群人,只要你愿意讓他們與機(jī)器人互動(dòng),他們就會(huì)留下來。我認(rèn)為我們做得越多,公眾就會(huì)越熱情。我非常欣慰,參加這次活動(dòng)最令人興奮的事情可能是有很多人說你做的工作是我十幾歲時(shí)見過的,現(xiàn)在我正在做。我們?cè)侥苷故疚覀兊墓ぷ鞑⒓?lì)下一代,這就會(huì)實(shí)現(xiàn)。

陳建宇:我的一個(gè)建議是,因?yàn)闄C(jī)會(huì)其實(shí)永遠(yuǎn)是留給有準(zhǔn)備的人,那么像Maec做這個(gè)事情做了做了好幾十年,然后包括我們其實(shí)臺(tái)上我們幾位也都是多年深耕在機(jī)器人或者相關(guān)領(lǐng)域,所以說,因?yàn)槿诵螜C(jī)器人它其實(shí)也是一個(gè)非常長周期的事情,同時(shí)它也包羅萬象,從技術(shù)上的軟件、硬件、AI再到商業(yè)、產(chǎn)品等等,其實(shí)各方面都有,所以說大家應(yīng)該去問一問自己的內(nèi)心在這一步范圍內(nèi)到底自己最有激情,最喜歡的最熱愛的是什么?然后從此刻開始就去積累它。最后,要么等待未來,要么總有時(shí)刻你有施展自己的機(jī)會(huì)。

王興興:對(duì)于我覺得對(duì)于所有年輕人,包括我們其實(shí)這個(gè)時(shí)代都是非常精彩的,而且想象一下,大家也知道AI、機(jī)器人都是階梯性發(fā)展,就像GPT沒有出來之前,大家覺得語言模型沒什么用,基本上是非常差,但突然就是發(fā)生了巨大進(jìn)步,非常好,其實(shí)機(jī)器人、AI也會(huì)遵循這種規(guī)律,所以大家現(xiàn)在可能看到機(jī)器人的 AI 能力都比較弱,但實(shí)際上這是好事,為什么?因?yàn)榇蠹叶加袡C(jī)會(huì)去做的更好,可以真正的把這種人類目前可以預(yù)估的最偉大技術(shù),就在當(dāng)下,就在未來幾年,所以這個(gè)事情都是非常值得做的,

而且,在機(jī)器人和 AI 另外一個(gè)比較適合年輕的點(diǎn),它沒有那么多歷史包袱,不像數(shù)學(xué)領(lǐng)域,有幾百上千年的非常天才的數(shù)學(xué)家,你一定要比他們做得好,你才可以做技術(shù),但是當(dāng)下,AI 和機(jī)器人它都非常年輕,尤其 AI 技術(shù)就最近幾年的東西,所以非常適合年輕人。我一直感覺在如果在未來5年到10年或者幾十年回看我們現(xiàn)在這個(gè)時(shí)代,所以想想這種感覺,真的非常激動(dòng)人心。

王鶴:我覺得其實(shí)未來的15年,在我心目中會(huì)是人形機(jī)器人,從當(dāng)下在產(chǎn)業(yè)中沒有規(guī)?;瘧?yīng)用,到可能成長到跟今天汽車的產(chǎn)量一個(gè)萬億市場的過程。那么在這個(gè)過程中,其實(shí)對(duì)年輕人來說,那么我覺得大家就是做好自己就可以了,因?yàn)?5年之后很多工作都是跟人形機(jī)器人相關(guān)的,今天可能你負(fù)責(zé)賣車,那么15年后,你可能崗位就調(diào)到賣人形機(jī)器人對(duì)吧?今天你是班級(jí)里頭的佼佼者,那么你學(xué) AI ,那么你可能發(fā)現(xiàn)你的職業(yè)生涯就是圍繞著進(jìn)一步提升人形機(jī)器人的能力展開的,所以大家做好自己,我們一起共享光明、人形機(jī)器人的未來。

熊友軍:其實(shí)我是經(jīng)歷過個(gè)人電腦時(shí)代,我經(jīng)歷智能手機(jī)時(shí)代,我經(jīng)歷過移動(dòng)互聯(lián)網(wǎng)的時(shí)代,現(xiàn)在其實(shí)我們正在經(jīng)歷智能汽車的時(shí)代,電動(dòng)汽車的時(shí)代,我覺得下一個(gè)時(shí)代實(shí)際上就是聚生智能的時(shí)代,而聚生智能時(shí)代的典型代表其實(shí)就是人性機(jī)器人,所以我給現(xiàn)在的年輕人建議就是說保持野心,懷揣大夢(mèng)想。

問:讓我們?cè)谛〗M成員之間花幾分鐘時(shí)間討論一下:你們想要互相問什么問題?

陳建宇:所以我想問Marc,你認(rèn)為對(duì)于機(jī)器人和人工智能來說最重要的研究問題是什么,例如,如果你只能選擇一個(gè)研究項(xiàng)目,那么你選擇哪一個(gè)?

Marc:讓我從側(cè)面回答一下,這也是一種回避你的問題的方式。最后我沒有展示我的最后一張幻燈片。我的最后一張幻燈片是一個(gè)展示機(jī)器人故障的視頻。它展示了,我不知道它大概有 2 分鐘長,可能有 25 種不同的故障。我認(rèn)為故障是工作中最有趣、最有意思、最有用的部分,關(guān)注它們,然后在你的工作不工作的時(shí)候繼續(xù)前進(jìn),這真的很重要。這不是研究的主題,但它是一種工作精神。所以如果我要問你們所有人這個(gè)問題的話,那就是我還沒看到任何人在演講中提到過事情無法正常運(yùn)轉(zhuǎn),而且我敢肯定,單一機(jī)器人不會(huì)在不發(fā)生碰撞的情況下完成那些后空翻以及它們所做的所有很酷的事情。你喜歡碰撞嗎?

王興興:Marc先生,很榮幸今天見到您,我其實(shí)想有好奇想問一下,您覺得對(duì)于人形機(jī)器人的手,您覺得未來幾年比較合適的有幾個(gè)手指,或者幾個(gè)電機(jī),這會(huì)是比較好的一個(gè)方向?

Marc:再次,我要回答一個(gè)略有不同的問題。我們研究所最近舉辦了一場研討會(huì),名為“對(duì)操縱的反向觀點(diǎn)”。我認(rèn)為靈巧性確實(shí)很重要,但基本上它并沒有取得很大進(jìn)展,盡管人們至少已經(jīng)為此努力了 50 年。我認(rèn)為我們必須以不同的方式思考,再次嘗試不同的東西,就像我今天在演講中開始的那樣,也許我們需要更多的動(dòng)態(tài)操縱,而不是所有的靜態(tài)抓握。我認(rèn)為很多學(xué)習(xí)界的人在提出他們正在學(xué)習(xí)的靈巧性的要求時(shí)對(duì)自己要求不夠。他們做的事情很簡單,很容易。

我認(rèn)為那里是有機(jī)會(huì)的,有多少只手我不知道有多少根手指。我認(rèn)為五個(gè)已經(jīng)很多了。但也許有一天我會(huì)覺得更有趣的問題是手掌怎么樣?我們的手掌功能非常強(qiáng)大,它們不僅僅是靜態(tài)的塊。而且你看到的幾乎每個(gè)機(jī)器人手都有許多手指在做這件事,但僅此而已。

王鶴:之前我提到過,大概 15 年后,世界上會(huì)有數(shù)百萬、一千萬個(gè)人形機(jī)器人。如果人形機(jī)器人具有通用目的,那么人形機(jī)器人是終極體現(xiàn),那么這種通用目的的終極技術(shù)是什么?對(duì)于人類噪音,您是否認(rèn)為視覺、語言、動(dòng)作模型,這些端到端模型是人類噪音的終極技術(shù)或方法?

Marc:我很難相信,端到端是取得進(jìn)步的方法。也許最終在漸近線上端到端是正確的方法,但我認(rèn)為我們知道的太多了。

說實(shí)話,我認(rèn)為人們過分看重(機(jī)器)學(xué)習(xí)。我知道應(yīng)該對(duì)學(xué)習(xí)持樂觀態(tài)度,但如果你看看當(dāng)今存在的解決方案,你會(huì)發(fā)現(xiàn)最好的解決方案中學(xué)習(xí)所起的作用微不足道或微不足道。當(dāng)然,在波士頓動(dòng)力公司,今天學(xué)習(xí)很少,盡管人們正在努力。我認(rèn)為控制系統(tǒng)、控制理論、觀察器,這些在過去 20 或 30 年建立起來的東西仍然發(fā)揮著巨大的作用。

我不想就這樣把它拋棄。我希望我們能真正擁抱學(xué)習(xí),但要把它與我們已經(jīng)知道的東西結(jié)合起來,找到一種方法把它們結(jié)合起來,至少在接下來的5年或10年里,也許在漸近線上,情況會(huì)有所不同。

熊友軍:我的一個(gè)問題是,Marc作為波士頓動(dòng)力的創(chuàng)始人,您之前開發(fā)了像Atlas這樣的非常令人驚奇的這種產(chǎn)品,但是我們前不久我們看到波士頓動(dòng)力終止了這個(gè)機(jī)器的研發(fā),然后由原來的液壓驅(qū)動(dòng),轉(zhuǎn)向純電驅(qū)動(dòng)的這種方式。對(duì)這方面是出于什么樣的考慮?是因?yàn)槌杀镜目紤],還是因?yàn)槌鲇谏虡I(yè)化的考慮?同時(shí)我還想知道,波士頓動(dòng)力未來5年的一些這種計(jì)劃,對(duì)商業(yè)化的一些計(jì)劃。

Marc:我認(rèn)為,如果你問為什么要進(jìn)行轉(zhuǎn)變,我認(rèn)為有兩個(gè)關(guān)鍵因素:一個(gè)是液壓機(jī)器人,我喜歡液壓技術(shù),我會(huì)用液壓技術(shù)制造很多機(jī)器人。我認(rèn)為,建造人形機(jī)器人或類似人形機(jī)器人仍有空間,它們將繼續(xù)使用液壓技術(shù),因?yàn)橹亓亢蛷?qiáng)度等因素。

但我認(rèn)為有兩點(diǎn)。一是它們很麻煩,至少對(duì)于像 Atlas 這樣的高性能機(jī)器人來說,盡管我們付出了無盡的努力,也永遠(yuǎn)無法讓它們完全不漏油。當(dāng)你把石油機(jī)器人放到工廠和家里時(shí),它們就不能滴油;同時(shí),很難找到精通液壓技術(shù)的人,因?yàn)槿藗冋J(rèn)為這是非常古老的東西,盡管 Atlas 在液壓工作原理方面有很多創(chuàng)新,從服務(wù)器閥門到 HPU 液壓動(dòng)力裝置,一直都是如此,確實(shí)有創(chuàng)新的東西在進(jìn)行;最后,我認(rèn)為電動(dòng)汽車在規(guī)模上已經(jīng)足夠強(qiáng)大,它們可以參與競爭。我不想代表波士頓動(dòng)力發(fā)言,盡管我是創(chuàng)始人之一,并且仍然是董事會(huì)成員,但我認(rèn)為他們必須有自己的計(jì)劃,說明未來的計(jì)劃以及技術(shù)的所有細(xì)節(jié)。我想隨著事情的發(fā)展,你會(huì)發(fā)現(xiàn)更多這方面的內(nèi)容。

主持人:非常感謝。我想觀眾肯定會(huì)有更多問題,也許吧,但我們的時(shí)間真的不多了。所以非常感謝各位小組成員。非常感謝觀眾的到來和聆聽。我認(rèn)為這是一場非常精彩的會(huì)議,尤其是小組討論。我對(duì)組織者的建議是,我們明年再舉辦一次類似的會(huì)議,然后我們可以回顧進(jìn)展和未來的步驟。

(本文首發(fā)于鈦媒體App,作者|林志佳)

 

本文系作者 林志佳、AI科技組 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

11:23

2025年中國科幻產(chǎn)業(yè)總營收達(dá)1261億元,連續(xù)三年突破千億大關(guān)

11:21

電網(wǎng)設(shè)備概念盤中震蕩回升,長高電新漲停

11:21

零跑A10全球上市,售價(jià)6.58萬元起

11:20

智己LS8開啟預(yù)售,價(jià)格25.98萬-30.98萬元

11:07

港股鋰電股走強(qiáng),贛鋒鋰業(yè)漲超7%

11:03

九號(hào)公司:與泡泡瑪特達(dá)成合作,聯(lián)名電動(dòng)車將于4月推出

11:02

滬深京三市成交額超1萬億元,較上日此時(shí)縮量952億元

10:48

證監(jiān)會(huì)首席律師程合紅:開展新一輪公司治理專項(xiàng)行動(dòng),加強(qiáng)對(duì)減持、程序化交易等市場交易活動(dòng)的監(jiān)督管理

10:47

證監(jiān)會(huì)首席律師程合紅:配合司法機(jī)關(guān)研究制定內(nèi)幕交易、操縱市場民事?lián)p害賠償司法解釋,加大先行賠付制度適用力度

10:44

港股恒生科技指數(shù)漲幅擴(kuò)大至1%

10:43

鋰礦板塊震蕩走高,融捷股份漲停

10:43

全國社保基金理事會(huì):個(gè)別組合持有單只股票時(shí)間最長達(dá)到20年

10:34

證監(jiān)會(huì):資本市場理性投資、價(jià)值投資、長期投資的法治基礎(chǔ)進(jìn)一步夯實(shí)

10:33

證監(jiān)會(huì):2025年中長期資金新增入市規(guī)模超一萬億

10:31

社?;饡?huì):始終保持戰(zhàn)略定力,堅(jiān)持長期投資、價(jià)值投資、責(zé)任投資

10:30

鋰礦概念反復(fù)活躍,江特電機(jī)直線漲停

10:24

騰訊湯道生:Harness工程能力是AI落地關(guān)鍵變量

10:18

商業(yè)航天概念震蕩拉升,神劍股份2連板

10:15

創(chuàng)新藥概念持續(xù)走高,科拓生物20cm漲停

10:11

滬指翻紅,上漲個(gè)股近3800只

掃描下載App