美國工程院外籍院士、北京智源人工智能研究院學(xué)術(shù)顧問委員會(huì)主任 張宏江

12月1日,距離ChatGPT正式上線正好整整一周年,鈦媒體2023 T-EDGE全球創(chuàng)新大會(huì)再次邀請(qǐng)美國工程院外籍院士、北京智源人工智能研究院學(xué)術(shù)顧問委員會(huì)主任張宏江發(fā)表了關(guān)于AIGC的主題演講。

而就在一年前的鈦媒體2022T-EDGE上,張宏江第一時(shí)間向業(yè)內(nèi)做出了《ChatGPT和AIGC:人工智能(Al)大模型發(fā)展和機(jī)遇》的主題演講(詳見鈦媒體此前報(bào)道《關(guān)于ChatGPT爆火,張宏江這篇分享講透了,大模型正成為AI浪潮的重要拐點(diǎn)》),引發(fā)了全行業(yè)的巨大關(guān)注。

在張宏江的帶領(lǐng)下,智源研究院也屢次成為國際AI屆最受關(guān)注的中國AI大模型研究機(jī)構(gòu),推出了“中國首個(gè)+世界最大”悟道大模型,也是在中國最早引領(lǐng)開展大模型研究的機(jī)構(gòu),成為這一領(lǐng)域的“黃埔軍校”。

一年過去后,ChatGPT已經(jīng)從最初的行業(yè)爆火,演變成了全社會(huì)爆火,而張宏江一年前的前瞻性判斷,也早已在這一年得到了驗(yàn)證。今年12月1日,張宏江在鈦媒體2023T-EDGE的加州分會(huì)場(chǎng),發(fā)表了《AI 大模型驅(qū)動(dòng)產(chǎn)業(yè)新范式》的演講,進(jìn)一步向我們講述了AIGC接下來可能對(duì)各大產(chǎn)業(yè)的影響。

張宏江表示,ChatGPT是人類第三波 AI 浪潮的“分水嶺”,迎來了“人工智能的 iPhone 時(shí)刻”。隨著GPT-3.5、GPT-4等技術(shù)迭代,人類首次迎來一個(gè)能夠精確理解語言邏輯的AI系統(tǒng)。

“如今的OpenAI,不只是一家純粹的 AI 技術(shù)公司,而且還是一家 AI 平臺(tái)公司。”張宏江在鈦媒體2023T-EDGE上表示。

張宏江還在演講中提到,“奇點(diǎn)”已經(jīng)到來。AI 大模型作為基礎(chǔ)平臺(tái),將會(huì)系統(tǒng)性推動(dòng)所有產(chǎn)業(yè)進(jìn)入新范式,成為下一個(gè)時(shí)代的“超級(jí)入口”,重寫所有軟件應(yīng)用和產(chǎn)業(yè),提升每個(gè)領(lǐng)域的生產(chǎn)力。同時(shí),沒有Al大模型的平臺(tái)公司不再會(huì)是平臺(tái)公司,新的產(chǎn)品、商業(yè)模式、盈利模式和創(chuàng)業(yè)機(jī)會(huì)也將到來。此外,利用GPT Copilot等技術(shù)作為未來的組織形式,公司效率極大提升,組織形式也將發(fā)生根本變化。

“大模型將重塑所有的產(chǎn)業(yè),提升所有領(lǐng)域的生產(chǎn)力,并在不斷改進(jìn)和自主化現(xiàn)有的模型下,有望改變整個(gè)產(chǎn)業(yè)形態(tài)。”張宏江強(qiáng)調(diào),未來1.5年-2年,人類或?qū)⒖梢钥吹酱笠?guī)模商業(yè)落地曙光。

當(dāng)然,張宏江也坦言,大模型“幻覺”是目前比較重要的問題之一。盡管最新GPT-4在“幻覺”方面有了很大改善,相較ChatGPT提升40%,但“幻覺”率依然能達(dá)到10%-14%左右。所以,未來企業(yè)和開發(fā)者需要持續(xù)改善大模型技術(shù)能力,從而推動(dòng)其在產(chǎn)業(yè)場(chǎng)景中真正落地。

“我想強(qiáng)調(diào)的是,我們不要覺得今年我們有了一個(gè)大模型,在某些應(yīng)用場(chǎng)景里已經(jīng)做得很不錯(cuò)了,從而忽略我們需要在通用大模型能力上的持續(xù)投入、持續(xù)改善和持續(xù)開發(fā)。否則,也許再過6個(gè)月、12個(gè)月,很多依賴大模型的應(yīng)用將會(huì)因?yàn)闊o法達(dá)到用戶的期望值從而被用戶放棄。”張宏江表示,所有的軟件公司都必須擁抱大模型,包括軟件工具、應(yīng)用服務(wù)等類型企業(yè),都需要啟用大模型重寫軟件。

展望未來,張宏江引述OpenAI的一項(xiàng)研究表示,80%美國人的工作都將受到 AI 技術(shù)影響,尤其是音頻生成、圖像生成等創(chuàng)造力的工作也將會(huì)被 AI 取代,這意味著高工資的“白領(lǐng)”群體受影響會(huì)更大。同時(shí),AI 超過了85%或90%的人類考生水平,從而將讓法學(xué)、醫(yī)學(xué)等專業(yè)領(lǐng)域發(fā)展受到 AI 影響。

“大模型一定會(huì)對(duì)工作、人類未來產(chǎn)生影響。”張宏江提到,過去60年,人們經(jīng)歷了“信息”、“智能”系統(tǒng)兩個(gè)時(shí)代,而未來人們還將同時(shí)擁有感知、理解、推理和自主驅(qū)動(dòng)能力。AI 大模型不僅會(huì)替代“白領(lǐng)”工作,而且會(huì)驅(qū)動(dòng)機(jī)器人、自動(dòng)駕駛等領(lǐng)域的技術(shù)能力和體驗(yàn)?zāi)芰Φ奶嵘?/p>

“未來,人們將迎來‘自主智能’的世界。”張宏江在結(jié)尾表示。

12月1日-3日,2023T-EDGE大會(huì)以「新視野 新鏈接」為主題,邀請(qǐng)了近百位來自不同國家,不同領(lǐng)域的國際創(chuàng)新領(lǐng)袖分享嘉賓,設(shè)置了四十余場(chǎng)現(xiàn)場(chǎng)討論,從新一輪全球AI革命浪潮、產(chǎn)業(yè)鏈重塑、新一輪企業(yè)再全球化浪潮、全球化下的產(chǎn)業(yè)創(chuàng)新升級(jí)和投資新趨勢(shì)等維度,共同回顧過去一年的洞察與發(fā)展,展望未來的創(chuàng)新趨勢(shì)與經(jīng)濟(jì)新格局。

以下為張宏江演講實(shí)錄,略經(jīng)鈦媒體App編輯:

各位鈦媒體朋友們,大家早上好。非常高興參加2023年鈦媒體T-EDGE全球創(chuàng)新大會(huì)。

我今天想跟大家分享一下,大模型如何驅(qū)動(dòng)產(chǎn)業(yè)的新的范式,如何改變整個(gè)人工智能(AI)產(chǎn)業(yè)鏈。

我今天的講座分成三個(gè)部分:

第一,我很快地回顧一下GPT所帶來的大模型熱潮,跟大家分享一下我在這背后的觀察與思考;

第二,我會(huì)花更多的時(shí)間,在大模型如何驅(qū)動(dòng)產(chǎn)業(yè)新范式,如何改變今天的 AI 產(chǎn)業(yè),如何為所有應(yīng)用帶來新的開發(fā)模式;

最后,和大家分享一下我對(duì)于大模型技術(shù)的展望,尤其是大模型將怎么改變技術(shù)發(fā)展趨勢(shì)和人們的生活。

ChatGPT是第三波 AI 浪潮的“分水嶺”

首先我們回顧一下,近70年前發(fā)展到現(xiàn)在,AI 技術(shù)共經(jīng)歷了三波浪潮。

在十五年前,我們進(jìn)入了以深度學(xué)習(xí)為代表的第三波 AI 浪潮,發(fā)展至三年前,無論是企業(yè)應(yīng)用還是算法,其實(shí)都已經(jīng)到了一個(gè)瓶頸,尤其在產(chǎn)業(yè)方面,三年前就看到了投資 AI 技術(shù)的比例到達(dá)低點(diǎn)。

這頁P(yáng)PT其實(shí)是我三年前做的。當(dāng)時(shí)我們看到Transformer所帶來的一系列新的 AI 算法、AI 架構(gòu),尤其是GPT3.0大模型所引發(fā)的新技術(shù)進(jìn)步。因此,當(dāng)時(shí),我們認(rèn)為,大模型會(huì)成為 AI 第三次浪潮的一個(gè)新拐點(diǎn)。

如今,我們看到ChatGPT于2022年底發(fā)布后,風(fēng)靡全球,真正成為這一波 AI 浪潮的分水嶺,迎來了“人工智能的 iPhone 時(shí)刻”。

如果我們回憶一下移動(dòng)互聯(lián)網(wǎng)幾十年的發(fā)展。雖然從2002年之前(20世紀(jì)90年代)就開始研發(fā)智能手機(jī),但真正進(jìn)入廣泛應(yīng)用,進(jìn)入真正意義上的移動(dòng)互聯(lián)網(wǎng)時(shí)代,實(shí)際上是以喬布斯在2007年發(fā)布第一代iPhone為標(biāo)志事件。再往前看類似的就是PC互聯(lián)網(wǎng)時(shí)代,網(wǎng)景瀏覽器的誕生,我想在座的很多朋友可能那個(gè)時(shí)候還沒出生。

iPhone的出現(xiàn),標(biāo)志著移動(dòng)互聯(lián)網(wǎng)的普及和快速發(fā)展。而今天ChatGPT的出現(xiàn),正是新一輪 AI 快速發(fā)展的新拐點(diǎn)。

從數(shù)據(jù)來看,ChatGPT發(fā)布五天之后,用戶達(dá)到100萬,兩個(gè)月內(nèi)月活躍用戶達(dá)到1億人。今天,ChatGPT平臺(tái)也有幾億人活躍用戶,成為歷史上發(fā)展最快的消費(fèi)級(jí)應(yīng)用。

無論是iPhone、抖音,這些明星產(chǎn)品,用戶量破億都需要一段長(zhǎng)期過程,而ChatGPT只用了兩個(gè)月。一方面,說明了技術(shù)發(fā)展的加速,另一方面也標(biāo)志著人類技術(shù)發(fā)展進(jìn)入了一個(gè)非常重要的拐點(diǎn)。

那么,為什么GPT所代表的新一輪大模型進(jìn)步如此之重要?GPT-4或ChatGPT是否標(biāo)志著AGI(通用人工智能)時(shí)代來臨了?

在這里,我想借助一份微軟研究院發(fā)表的題為“AGI(通用人工智能)的火花:GPT-4的早期實(shí)驗(yàn)”系統(tǒng)性研究論文,來看幾個(gè)例子,說明大模型的魔力,來說明今天以大模型為標(biāo)志打的AGI 技術(shù)已經(jīng)在許多方面接近人的智能,或者說是跟人一樣的智能能力。那么,如何定義人工智能?

該研究提到,人的 IQ 智力測(cè)試主要包括六個(gè)方面:推理、規(guī)劃、解決問題、抽象的思考、理解復(fù)雜的想法以及多模態(tài)與跨學(xué)科計(jì)算機(jī)中組合學(xué)習(xí)能力,這是人類智能的六大特點(diǎn)。而該團(tuán)隊(duì)設(shè)計(jì)了一系列問題來考GPT-4,包括視覺、編碼、數(shù)學(xué)等問題,最終結(jié)論是:GPT-4是具有通用智能能力的。

有兩個(gè)點(diǎn),讓我們對(duì)這一通用智能能力更加堅(jiān)定。

首先,利用GPT-4,已經(jīng)可以調(diào)用非常復(fù)雜的工具。人最獨(dú)特的就是具有調(diào)用工具的能力,而GPT-4恰恰做到了這一點(diǎn),

譬如,這周我打算和朋友Luke一起到Contoso餐廳約一次晚餐,GPT接到這個(gè)指令之后調(diào)用日歷、Email應(yīng)用給Luke,分別發(fā)送信息問她哪天有空并自動(dòng)反饋給日歷,最終確定了周三晚上6點(diǎn)在Contoso餐廳見面,一切都通過GPT模型自動(dòng)化完成。

第二個(gè)例子是,OpenAI的總裁在TED大會(huì)進(jìn)行了一個(gè)現(xiàn)場(chǎng)演示,打算大會(huì)結(jié)束后吃一頓美味大餐,并讓GPT給他一些菜品推薦等建議。GPT-4 不僅給了他推薦出一些意大利風(fēng)格的西餐,而且調(diào)用了DALL·E工具,把這些菜畫出來。

另外,我們知道,在 AI 領(lǐng)域,自然語言處理和理解是一個(gè)“圣杯”。人類智能的一個(gè)核心區(qū)別在于,人有語言,可以寫文字,能夠通過語言描述自己的體驗(yàn)、經(jīng)歷和虛擬一些故事。

判斷AI智能水平的經(jīng)典圖靈測(cè)試,本質(zhì)上是人機(jī)對(duì)話測(cè)試——即當(dāng)人們和機(jī)器多次對(duì)話時(shí),如果無法區(qū)別是人還是機(jī)器在進(jìn)行回答,就意味著通過圖靈測(cè)試,具有人類智能。而ChatGPT,GPT-4恰恰通過了圖靈測(cè)試,意味著AGI具備了人的智能能力。

這種突破意味著,從古至今,世界首次擁有一個(gè)能夠精確理解人類語言邏輯的AI系統(tǒng)。這個(gè)系統(tǒng)不僅僅是簡(jiǎn)單的應(yīng)用學(xué)習(xí),而是建立在語義理解的基礎(chǔ)上,具備推理和創(chuàng)造能力的 AI 系統(tǒng)。更可怕的是,隨著GPT-4模型的性能升級(jí),自然語言邏輯能力亦隨之增強(qiáng),意味著 AI 系統(tǒng)更具備通用 AI 能力。

那么,這是否也意味著“奇點(diǎn)”已經(jīng)來臨?

2016年,DeepMind阿爾法狗(AlphaGo)讓所有人都很吃驚,利用 AI 技術(shù)AlphaGo打敗了韓國圍棋冠軍李世石。從某種意義上,AI 系統(tǒng)具備了一些所謂的“上帝視角”。AlphaGo的下一代系統(tǒng)AlphaZero不再從人類棋譜里面訓(xùn)練,而是利用棋子布局和規(guī)則等數(shù)據(jù)與強(qiáng)化學(xué)習(xí)結(jié)合,從而贏得目標(biāo),其能力超越了人類,也就具備了“上帝視角”。

當(dāng)人類看到 GPT 學(xué)習(xí)能力如此之強(qiáng)、演化速度如此之快,學(xué)習(xí)能力超越了人類的時(shí)刻,確實(shí)振奮于奇點(diǎn)已來。

大模型如何改變未來科技產(chǎn)業(yè)?

談完對(duì)GPT-4或大模型技術(shù)觀察和思考之后,下面來看一下大模型如何改變智能產(chǎn)業(yè),或者是幾乎所有的產(chǎn)業(yè)。

首先我說一下大模型。

如果只是把大模型或未來多模態(tài)模型作為一種技術(shù)(工具),其實(shí)是低估了這次技術(shù)突破。而實(shí)際上,大模型作為 AI 基礎(chǔ)平臺(tái),將會(huì)系統(tǒng)性推動(dòng)整個(gè)產(chǎn)業(yè)進(jìn)入新的范式。

第一、它(大模型)決定了下一個(gè)超級(jí)入口。GPT不僅是 AI 模型,而且是超級(jí)計(jì)算機(jī),或是一個(gè)超級(jí)系統(tǒng),重構(gòu)了用戶和用戶之間的交互、軟件的執(zhí)行以及計(jì)算本身。模型就是產(chǎn)品,人機(jī)交互已經(jīng)變得如此之容易。如果加上多模態(tài)的數(shù)據(jù),如圖像或視頻,就能提升人與機(jī)器之間的多媒介交互能力。

第二、AI 模型將重寫所有軟件應(yīng)用。今天大模型已經(jīng)具備了這樣一個(gè)能力,未來在軟件中,大模型將會(huì)無處不在。但凡是需要智力的地方,大模型都能夠發(fā)揮它的作用,從而將重塑所有的產(chǎn)業(yè),提升所有領(lǐng)域的生產(chǎn)力,并在不斷改進(jìn)和自主化現(xiàn)有的模型下,有望改變整個(gè)產(chǎn)業(yè)的形態(tài)。

第三、沒有AI大模型的平臺(tái)公司不再會(huì)是平臺(tái)公司。這意味著,未來將會(huì)有新的平臺(tái)、新的產(chǎn)品、新的贏家/輸家,也意味著有新的商業(yè)模型和創(chuàng)業(yè)機(jī)會(huì),而且初創(chuàng)企業(yè)、企業(yè)生態(tài)系統(tǒng)也會(huì)因此重寫,新的生態(tài)會(huì)形成。

第四,談到效率的改善,一旦有了 AI 大模型,公司效率極大提升,組織形式將發(fā)生根本變化。未來,公司不僅有專業(yè)人員,還有Copilot(副駕駛),當(dāng)大模型可以調(diào)用工具的時(shí)候,Copilot和Copilot之間彼此互相交互,人做事的效率會(huì)有很大提高,最終Copilot慢慢形成一種Auto-pilot,使得公司的組織形式不再是簡(jiǎn)單把計(jì)算機(jī)當(dāng)做工具,而是變成由Copilot主導(dǎo)的未來公司的組織形式,從而對(duì)于產(chǎn)業(yè)帶來更多變化。

其次,下面再往里面看。

首先,大模型將是 AI 應(yīng)用的新的平臺(tái),會(huì)帶來新生態(tài)。

大模型產(chǎn)業(yè)鏈中,最基礎(chǔ)、最底層的還是 AI 芯片,無論英偉達(dá)的GPU(圖形處理器)芯片,還是其他的GPU,在此之上又一個(gè)云計(jì)算平臺(tái)大模型。而在這個(gè)平臺(tái)上,無論是閉源還是開源大模型,最后都會(huì)落地到場(chǎng)景,形成更垂直的運(yùn)用。

這里我列了幾家美國公司例子。比如,OpenAI等公司目前都具備了大模型能力,也把大模型能力往外輸出。今年看,模型即服務(wù)(MaaS,Model as a Service),而未來,模型或?qū)⒊蔀橐环N新的發(fā)展趨勢(shì),從而將成為這些公司的市場(chǎng)競(jìng)爭(zhēng)力。

最近舉行的OpenAI首屆開發(fā)者日上,奧特曼(Sam Altman)公布了一系列新的模型、功能和模式。很明顯看到,GPT-4不僅是一個(gè)模型,而且還是一個(gè)新的平臺(tái),和GPT-4對(duì)話就可以生成新的工具,從大模型驅(qū)動(dòng)變成了大模型產(chǎn)生各種軟件開發(fā)模式,從而可能將改變整個(gè) AI 生態(tài)。

因此,如今的OpenAI,不只是一家純粹的 AI 技術(shù)公司,而且還是一家 AI 平臺(tái)公司。

我認(rèn)為,所有的軟件公司都必須擁抱大模型,必須得啟用大模型來重寫軟件。不止是大公司,甚至小到做軟件工具、應(yīng)用服務(wù)等類型的小企業(yè),都需要擁抱大模型。如今,大家都在焦慮看著,下一步OpenAI還會(huì)推出什么樣的應(yīng)用,從而影響人類發(fā)展方向。這正是大模型作為一個(gè)新的平臺(tái)的力量所在。

第二個(gè)我想分享的是,大模型作為基礎(chǔ)平臺(tái),會(huì)系統(tǒng)性推動(dòng)AI產(chǎn)業(yè)進(jìn)入新范式。

實(shí)際上,過去15年深度學(xué)習(xí)技術(shù)發(fā)展過程中,所有應(yīng)用場(chǎng)景開發(fā)的模型都是小模型,比如做安防應(yīng)用開發(fā)人臉識(shí)別專屬模型,做股票分析 AI 系統(tǒng)會(huì)做小垂直模型。那么如今,有了大模型之后,我們進(jìn)入到從此前的專用模型,到通用模型新的 AI 時(shí)代,你不再需要為一個(gè)新的 App 開發(fā)一個(gè)模型,而是要用通用大模型經(jīng)過微調(diào)、對(duì)齊,就能滿足你的需要,從而大大提高軟件開發(fā)能力。同時(shí),未來,模型編程也會(huì)逐步變成自動(dòng)化,開發(fā)成本大大降低。

我想給大家舉一個(gè)例子。最近我和以前一個(gè)微軟的同事聊起來,過去幾個(gè)月他看到 ChatGPT 模型的出現(xiàn)非常激動(dòng),并且基于 GPT模型,只用了三個(gè)人做了一系列 App產(chǎn)品。。

我當(dāng)時(shí)問他,你們?nèi)齻€(gè)人完成的這么一系列App,如果沒有GPT的幫助,需要多少軟件工程師才能完成這么大的開放量?他們的回答是120個(gè)人。

我認(rèn)為這個(gè)估算可信性很高。他是一位已經(jīng)在軟件工程領(lǐng)域耕耘了二十多年的專業(yè)人士,從軟件工程師做到軟件架構(gòu)師,再成為軟件開發(fā)管理者。從管幾個(gè)人到幾十個(gè)人,到幾百個(gè)人到幾千人,對(duì)軟件開發(fā)非常熟悉

從前需要120人次的軟件研發(fā)工作,現(xiàn)在只需三個(gè)人加上GPT就能夠完成。有效利用 GPT,可以設(shè)計(jì)出非常優(yōu)秀的架構(gòu)、用戶界面和寫作產(chǎn)品。

因此,大模型不止帶來了新的智能應(yīng)用開發(fā)模式,同時(shí)也會(huì)大大提升開發(fā)效率。

第三點(diǎn)我想講的是,AIGC(生成式人工智能)技術(shù)演化推動(dòng)孿生、編輯、創(chuàng)作三大前沿能力發(fā)展。

我們認(rèn)為,大模型已經(jīng)解決了數(shù)字人、虛擬創(chuàng)作等技術(shù)難題,下面的問題就是不斷優(yōu)化,使得它效率更好,整個(gè)內(nèi)容更加讓我們滿意,和人的價(jià)值觀對(duì)齊更好。我們認(rèn)為,這些都已經(jīng)算是相當(dāng)成熟的技術(shù)被應(yīng)用于市場(chǎng)上,比如文生圖、文字內(nèi)容創(chuàng)造、寫代碼、音頻生成等。

今年我們可以看到,很多音頻生成都開始用大模型來做,比如趙本山說英文、讓外國人說中文等。這些音頻生成、語言翻譯、圖像生成技術(shù)都很成熟,因?yàn)檫^去大模型技術(shù)本身不斷改進(jìn),使得這些應(yīng)用已經(jīng)進(jìn)入“成熟期”。

但是,大模型技術(shù)還有一個(gè)很重要的——“幻覺”率的問題。無論是GPT-3.5還是GPT-4,幻覺率大概能有15%-20%,當(dāng)然GPT-4有了很大改善(大概5%的改善),相較ChatGPT提升40%,但幻覺率依然有10%-14%左右,這還要加上其他性能等。

所以,我們需要持續(xù)改善大模型技術(shù)能力,從而在大模型加持下,才能將預(yù)期的應(yīng)用真正的產(chǎn)業(yè)落地,真正的達(dá)到或超越用戶的期望值。如果我們不能夠?qū)⒋竽P图夹g(shù)持續(xù)改善,就可能出現(xiàn)以前技術(shù)瓶頸時(shí)期所經(jīng)歷的同樣問題。換句話說,就是技術(shù)雖然有了很大的突破,但真正落地的時(shí)候,仍需要不斷解決客戶實(shí)際而具體的問題,當(dāng) AI 技術(shù)從高點(diǎn)落地而不能的時(shí)候,會(huì)使產(chǎn)業(yè)進(jìn)入一個(gè)“蕭條期”。只有當(dāng)我們的模型不斷改善,才能夠達(dá)到或超越用戶的期望值。

我想強(qiáng)調(diào)的是,我們不要覺得今年我們有了一個(gè)大模型,在某些應(yīng)用場(chǎng)景里已經(jīng)做得很不錯(cuò)了,從而忽略我們需要在通用大模型能力上的持續(xù)投入、持續(xù)改善和持續(xù)開發(fā)。否則,也許再過6個(gè)月、12個(gè)月,很多依賴大模型的應(yīng)用將會(huì)因?yàn)闊o法達(dá)到用戶的期望值從而被用戶放棄。

第四、下面來看一下利用大模型,哪些行業(yè)應(yīng)用已經(jīng)非常成熟了。大模型將催生哪些新物種?

實(shí)際上,比如內(nèi)容文案、內(nèi)容創(chuàng)作、會(huì)議記錄、客服、代碼生成等,過去5年、10年間聊天機(jī)器人產(chǎn)品一直無法過關(guān),而今天有了大模型、自然語言技術(shù)提升,這些行業(yè)已經(jīng)在快速成熟。在過去移動(dòng)互聯(lián)網(wǎng)市場(chǎng)突飛猛進(jìn)過程中,創(chuàng)造了比PC互聯(lián)網(wǎng)大很多的機(jī)會(huì)空間,催生了一系列原生應(yīng)用,例如短視頻、滴滴打車、抖音,這些 App 是在PC互聯(lián)網(wǎng)無法實(shí)現(xiàn)的產(chǎn)品。

所以,未來我們能不能夠找到大模型原生應(yīng)用,這是推廣大模型應(yīng)用的時(shí)候需要解決的一個(gè)核心問題,比如可以考慮人性化交互、圖像效果升級(jí)改變等,從而催生 AI 原生應(yīng)用。

第五點(diǎn),AI 大模型將帶來新科學(xué)的新范式。

作為一直從事 AI 研究的從業(yè)者,我希望未來 AI 大模型能夠帶來科學(xué)研究的新范式。今年我們知道,AI for science(科學(xué)智能)領(lǐng)域已經(jīng)是大家的公示,當(dāng)一系列新技術(shù)的出現(xiàn),比如DeepMind的 AlphaFold 2預(yù)測(cè)了所有蛋白質(zhì)結(jié)構(gòu)。因此,未來我們不僅可看到結(jié)構(gòu)的預(yù)測(cè)、藥品的設(shè)計(jì)、材料的設(shè)計(jì),而且還會(huì)看到 AI 將會(huì)成為人類非常好的研究助理,甚至最終成為很好的研究者,讓 AI 幫助我們研究、設(shè)計(jì)新的 AI 系統(tǒng)。

這就是我們看到大模型帶來的新科學(xué)的新范式。除了AlphaFold2之外,更深層次說,大模型可以推動(dòng)生命科學(xué)的發(fā)展,比如后續(xù)一系列可以期待的新的工具、新的應(yīng)用,預(yù)測(cè)大分子結(jié)構(gòu),以及未來一系列新的生物分子結(jié)構(gòu)的預(yù)測(cè)。所以,這就是未來我們可以預(yù)見到的大模型在科學(xué)方面的新應(yīng)用。

所以,這就是未來我們可以預(yù)見到的大模型在科學(xué)方面的新應(yīng)用。

展望未來:AI 大模型將使得人類進(jìn)入“自主智能”世界

剛才,我講到大模型對(duì)于產(chǎn)業(yè)的應(yīng)用,以及大模型的威力所在。那么最后,我們展望一下未來。

AI 到底能影響多少人的工作?今年3月,OpenAI和美國賓夕法尼亞大學(xué)的相關(guān)研究人員聯(lián)合發(fā)表了一篇論文,分析了 GPT 對(duì)美國勞動(dòng)力的影響。

結(jié)論是,大約80%的美國勞動(dòng)力,至少他們的工作中間有10%會(huì)受到影響;此外有約19%的人,其工作任務(wù)受影響的比例超過50%。與此同時(shí),這種影響跨越了所有的工資范圍,不止是低工資人群,而且一年賺兩、三萬美金的高工資人群受 AI 影響會(huì)更大,那意味著“白領(lǐng)”群體的影響會(huì)更大。

具體有哪些領(lǐng)域會(huì)受到影響?我用這張GPT-4和GPT3.5在美國標(biāo)準(zhǔn)考試的結(jié)果圖片來解釋。你可以看到,大學(xué)、研究生、法學(xué)院、醫(yī)學(xué)院入學(xué)考試中,GPT-3.5都可以通過這種標(biāo)準(zhǔn)測(cè)試,但分?jǐn)?shù)不是那么高;而如今用GPT-4考這類測(cè)試,大部分情況下能超過85%的參考人,某些領(lǐng)域正確率甚至達(dá)到90%,也就是說,AI 超過了85%或90%的人類考生,即超過了人類的平均數(shù)。

那么可想而知,在這些標(biāo)準(zhǔn)考試所代表的這些工作領(lǐng)域中,絕大多數(shù)工作一定會(huì)被大模型所取代,至少80%吧,這將會(huì)讓人們對(duì)未來更加焦慮。所以,大模型一定會(huì)對(duì)工作、人類未來產(chǎn)生影響。

我想分享一下奧特曼(Sam Altman)團(tuán)隊(duì)的觀點(diǎn),第一,未來大模型不僅是語言模型,更是多模態(tài)模型,會(huì)打開新的局面;第二,未來 AI 對(duì)產(chǎn)業(yè)、對(duì)于工作的影響深遠(yuǎn),AI 會(huì)代替未來許多工作。相對(duì)于此前認(rèn)知的低技能工作開始替代,如今我們卻能看到,內(nèi)容生成這種創(chuàng)造性工作也會(huì) AI 所取代,原來希望 AI 技術(shù)可以掃地、做做飯、洗衣服、疊衣服、搶垃圾,結(jié)果卻最早替代繪畫、寫作、作曲等創(chuàng)造性工作。

那么這是否意味著,未來 AI 技術(shù)不能替代“體力活”?答案是否定的。下面,我們先看兩個(gè)例子:波士頓動(dòng)力的機(jī)器人,以及谷歌用大模型驅(qū)動(dòng)的未來機(jī)器人手臂。

首先是沒有大模型加持下的機(jī)器人形態(tài)。

左邊這個(gè)波士頓動(dòng)力(Boston Dynamics)機(jī)器人視頻中,沒有大模型技術(shù),機(jī)器人的所有動(dòng)作都是實(shí)現(xiàn)編程好的,并不具備識(shí)別或自我規(guī)劃的能力;而右邊的機(jī)器人摔倒之后只是有一個(gè)智能的起立,隨后需要人主動(dòng)分開才能很好坐上肩膀中。

我想跟大家說,這兩個(gè)機(jī)器人很棒,但他們沒有自我規(guī)劃的能力,不能識(shí)別這個(gè)場(chǎng)景所做事情。這就是今天沒有大模型驅(qū)動(dòng)的機(jī)器人的狀態(tài)。

其次,談到未來的機(jī)器人技術(shù)能力,最近谷歌公布的機(jī)器人模型RT-2視頻,結(jié)合了基于GPT模型的新的工作能力和規(guī)劃能力,這屬于新的技術(shù)創(chuàng)新。

此前,機(jī)器人只是能夠聽從人們的單一指令,如輸入把可樂瓶扔掉。而今天,基于大模型能力,新的機(jī)器人可以把文字命令轉(zhuǎn)化成一系列的動(dòng)作,其不僅能聽懂復(fù)雜指令,而且還能把指令進(jìn)行思考,并做自我規(guī)劃能力。比如人指令機(jī)器人抓住桌面上“已經(jīng)滅絕的動(dòng)物”,隨后機(jī)器人就思考哪些動(dòng)物屬于已經(jīng)滅絕的動(dòng)物,最后根據(jù)規(guī)劃把恐龍抓了出來。

這就是多模態(tài)大模型與機(jī)器人之間的結(jié)合。未來的機(jī)器人不僅識(shí)別周圍環(huán)境,還能自我識(shí)別目標(biāo),并利用大模型推理,最終識(shí)別目標(biāo)。換句話說,今天人類擁有的機(jī)器人已經(jīng)有“理解”的能力,而這個(gè)能力來源于大模型。

再次,我們下面看智源研究院團(tuán)隊(duì)作的一項(xiàng)研究工作。

我們培訓(xùn)了一個(gè)機(jī)械手臂類型的機(jī)器人,使其能夠開門。實(shí)驗(yàn)過程中,在沒有大模型的情況下,機(jī)械手只能執(zhí)行被教給它的特定動(dòng)作,如開抽屜門或拿起鍋蓋,所以當(dāng)機(jī)械手面臨微波爐門時(shí),它遇到了新的場(chǎng)景和問題:它無法用門把手打開微波爐的門;但由于擁有多模態(tài)大模型,機(jī)械手能夠根據(jù)微波爐手冊(cè)的描述,重新規(guī)劃行為,按下底部按鈕來打開微波爐。

需要指出的是,這個(gè)過程中,機(jī)械手并沒有被人告知要按按鈕,而是通過大模型進(jìn)行推理和思考得出解決方案。這表明,未來的機(jī)器人將通過大模型進(jìn)行少量訓(xùn)練后,能夠做出以前未經(jīng)過訓(xùn)練的動(dòng)作,而這些知識(shí)都來自于大模型。

所以,從另一個(gè)角度來看,大模型是機(jī)器人行業(yè)的一個(gè)“分水嶺”,當(dāng)機(jī)器人擁有大模型,尤其是多模態(tài)大模型的能力,從而可以思考、推理、規(guī)劃更多的工作任務(wù),對(duì)此有了事物的更多可能性。

最后我們談?wù)劊绻麢C(jī)器人利用大模型能做到更多的工作能力,未來自動(dòng)駕駛是否也能具備更多自我規(guī)劃和推理能力?

我們認(rèn)為,隨著大模型的加持,自動(dòng)駕駛行業(yè)也將會(huì)被“重寫”。

實(shí)際上,人在開車的時(shí)候,并非所有的場(chǎng)景都已經(jīng)在考駕照的老師指導(dǎo)下學(xué)習(xí)過,但人們可以在各地正常按交規(guī)駕駛。那么看今天的自動(dòng)駕駛,只是能夠在一個(gè)地點(diǎn)需要數(shù)據(jù)訓(xùn)練之后才能開車,比如北京的亦莊、上海浦東等地。我認(rèn)為,未來基于GPT大模型技術(shù),這件(每個(gè)新城市都需要三個(gè)月的重新訓(xùn)練)事情將不需要再做了,未來的自動(dòng)駕駛應(yīng)該會(huì)被大模型“重寫”,基于大模型的自動(dòng)駕駛技術(shù)具備自我推理、自我規(guī)劃等能力,從而今天所說的新的極端情況(corner case)、新的路況不再成為自動(dòng)駕駛系統(tǒng)在一個(gè)地方落地的障礙。

那么可以想象,在虛擬世界中模擬自動(dòng)駕駛的過程,可以解決很多數(shù)據(jù)量不夠等問題,這事一個(gè)非常有意義的研究,這也是智源研究院推動(dòng)的一個(gè)新的研究。

總結(jié)來說,在大模型技術(shù)加持下,未來的機(jī)器人將從通用走向多智能體agent下的“行動(dòng)智能”(自主智能)時(shí)代。

此次演講的最后,我們回顧一下整個(gè)IT技術(shù)發(fā)展的60年,主要分以下三個(gè)階段。

第一代是“信息”系統(tǒng)時(shí)代。無論是互聯(lián)網(wǎng),還是IT系統(tǒng),都是在獲取信息、收集信息,傳輸和處理信息;

第二代是“智能”系統(tǒng)時(shí)代。我們不再只是收集信息,而是將把信息變成智能,從而幫助我們形成智能系統(tǒng);

未來我們將會(huì)進(jìn)入第三個(gè)時(shí)代:行動(dòng)智能時(shí)代。當(dāng)你能夠感知世界、理解世界,推理世界之后,未來世界還將擁有自主的驅(qū)動(dòng)行動(dòng)能力。當(dāng)然,這也是機(jī)器人的未來、自動(dòng)駕駛的未來。

有了這些之后,AI 不止會(huì)替代很多人類的所謂“白領(lǐng)”工作,未來整個(gè)人類所從事的行為,都會(huì)被 AI 軟件或未來機(jī)器人所取代,這就是未來的“自主智能”世界。謝謝大家。(本文獨(dú)家首發(fā)鈦媒體App)

本文系作者 林志佳 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 想要ppt

    回復(fù) 2023.12.04 · via iphone
  • 區(qū)塊鏈過去了?

    回復(fù) 2023.12.03 · via netease
  • 人之常情,自家的娃都是寶!

    回復(fù) 2023.12.03 · via netease
  • BYD王總沒認(rèn)可自動(dòng)駕駛哈

    回復(fù) 2023.12.03 · via netease
  • 看這么一大篇文章不如馬斯克的一句話

    回復(fù) 2023.12.03 · via netease
  • 完全自動(dòng)駕駛實(shí)現(xiàn)起來很難,路況千差萬別,不可能一一例舉,機(jī)器人只有在以往經(jīng)驗(yàn)的前提下才能去判斷,況且能夠記憶經(jīng)驗(yàn)累積分析的機(jī)器人就已經(jīng)是奢望了,更別說創(chuàng)新分析了。

    回復(fù) 2023.12.03 · via netease
  • 怎么變化人都要吃飯

    回復(fù) 2023.12.03 · via netease
  • 張宏江講的是理論與概念,余承東講的是真槍實(shí)彈,比如人工智能車自動(dòng)泊位,自動(dòng)駕駛,老張的所謂自動(dòng)駕駛,華為不是已經(jīng)實(shí)現(xiàn)了嗎?

    回復(fù) 2023.12.03 · via netease
  • 這位大佬快80了吧。[斜眼笑][斜眼笑]

    回復(fù) 2023.12.03 · via netease
  • 當(dāng)年的vR,比特幣,分布鏈割的韭菜還不夠嗎?

    回復(fù) 2023.12.03 · via netease
更多評(píng)論

快報(bào)

更多

18:31

俄羅斯央行將基準(zhǔn)利率下調(diào)至15.00%,預(yù)估為15.00%

18:25

弘信電子:控股子公司燧弘華創(chuàng)擬引入2億元戰(zhàn)略投資

18:24

沈陽:3月15日起夫妻雙方繳存住房公積金的,最高貸款額度由85萬元調(diào)整為150萬元

18:15

美國國債跌勢(shì)擴(kuò)大,2年期收益率上漲10個(gè)基點(diǎn)至3.89%

18:14

美股期指跌幅擴(kuò)大,道瓊斯指數(shù)期貨跌0.61%

18:10

海上絲路指數(shù):本周航線運(yùn)價(jià)走勢(shì)分化,綜合指數(shù)保持穩(wěn)定

18:09

上交所:本周對(duì)中韓半導(dǎo)體ETF等溢價(jià)較高的基金,以及*ST熊貓、*ST正平等異常波動(dòng)退市風(fēng)險(xiǎn)警示股票進(jìn)行重點(diǎn)監(jiān)控

18:08

交易員已完全預(yù)期歐洲央行今年將加息三次

18:07

美國10年期國債收益率突破4.3%,日內(nèi)上行逾4bp,現(xiàn)報(bào)4.301%

18:03

飛捷科思再獲近億元融資,加速物理AI基建落地

17:59

途虎養(yǎng)車2025年?duì)I收同比增11.5%

17:56

北京:鼓勵(lì)本市CCUS企業(yè)在津冀區(qū)域火電、鋼鐵、化工、石化、水泥等重點(diǎn)行業(yè)建設(shè)大規(guī)模、全流程示范應(yīng)用工程

17:55

北京:加大CCUS關(guān)鍵核心技術(shù)研發(fā)攻關(guān)

17:49

南向資金今日凈賣出約210億港元,創(chuàng)近兩周單日賣出新高

17:45

上期所調(diào)整石油瀝青、丁二烯橡膠品種套保持倉額度自動(dòng)轉(zhuǎn)化標(biāo)準(zhǔn)

17:43

央行:境內(nèi)企業(yè)境外放款宏觀審慎調(diào)節(jié)系數(shù)由0.5上調(diào)至0.6,整體提高境外放款余額上限

17:39

美元/日元上漲0.6%至158.68,周跌幅收窄至0.7%

17:39

宇樹科技2025年度實(shí)現(xiàn)營業(yè)收入17.08億元,同比增長(zhǎng)335.36%

17:37

兩部門:境內(nèi)企業(yè)境外放款余額上限與其所有者權(quán)益掛鉤

17:35

中國人民銀行:放款人境外放款余額不得超過其境外放款余額上限

14

掃描下載App