圖片來源@視覺中國
文 | 硅基研究室,作者 | 山核桃
2013年,在美國內(nèi)華達(dá)州的一個(gè)酒店舞廳里舉辦了一場私人聚會(huì)。幾十名工程師、計(jì)算機(jī)科學(xué)家們圍坐在一起,他們正在慶祝一個(gè)人工智能組織的成立。
“這是一場天堂里的婚禮”。說這話的人叫做楊立昆,除了「卷積神經(jīng)網(wǎng)絡(luò)之父」的稱號(hào),在這一年,他做了一個(gè)重要的決定,從實(shí)驗(yàn)室走進(jìn)Facebook,成為這家科技公司人工智能研究院FAIR的第一代領(lǐng)導(dǎo)者,由此開啟了深度學(xué)習(xí)的浪潮。
但請注意這是2013年,當(dāng)時(shí)科技行業(yè)的大多數(shù)人甚至都沒有聽說過深度學(xué)習(xí),彼時(shí)的Meta(在當(dāng)時(shí)還是Facebook)還是一家社交網(wǎng)絡(luò)公司,人們天然地認(rèn)為,它的使命不該是探究最前沿的技術(shù),而是快速擴(kuò)充規(guī)模。但扎克伯格沒有這么做,他下定決心要押注最前沿的技術(shù),比谷歌、微軟等巨頭們更快。
細(xì)數(shù)扎克伯格和他的Meta,曾一度是AI界僅次于谷歌、微軟的存在。不僅在深度學(xué)習(xí)浪潮早期就占盡人和,將楊立昆等明星科學(xué)家納入麾下,同時(shí)也擁有最前瞻性的目光,扎克伯格甚至參與過DeepMind的競購,從微軟里搶走不少的人才。
十余年過去,在微軟、OpenAI、谷歌等一眾科技巨頭的「AI軍備競賽」中,Meta淪為了第二梯隊(duì),但扎克伯格并不愿意承認(rèn)這一點(diǎn)。在近期接受The Verge 的訪談中,很久沒有現(xiàn)身的扎克伯格對(duì)外宣布了Meta打造通用智能的野心,不僅公布了最新的大模型動(dòng)態(tài),還大秀算力儲(chǔ)備,借AI之風(fēng),Meta股價(jià)創(chuàng)歷史新高,市值超過1萬億美元。
只是這一次,扎克伯格的AGI野心真的能實(shí)現(xiàn)嗎?
在AI浪潮中,曾經(jīng)的Meta是可以和谷歌、微軟掰手腕的存在。
這得益于扎克伯格自身的「野心」,也是「天時(shí)」。扎克伯格很早就決定加入谷歌、微軟、蘋果等巨頭的戰(zhàn)爭,即便規(guī)模尚小,他渴望通過下一項(xiàng)變革性技術(shù),成為領(lǐng)導(dǎo)者,因此當(dāng)谷歌率先通過收購「深度學(xué)習(xí)之父」辛頓的初創(chuàng)公司進(jìn)入深度學(xué)習(xí)領(lǐng)域時(shí),扎克伯格就意識(shí)到他也必須抵達(dá)那里。
2013年,當(dāng)楊立昆決定加入Facebook,成為人工智能研究院的第一任主任前,這位學(xué)者向扎克伯格提了兩個(gè)條件:一個(gè)是不會(huì)離開紐約大學(xué),另一個(gè)則是堅(jiān)持企業(yè)研究的「開放哲學(xué)」。
扎克伯格同意了這兩個(gè)條件,某種程度上也為Meta在AI時(shí)代的領(lǐng)先位置奠定了基礎(chǔ)。
「不會(huì)離開紐約大學(xué)」讓FAIR始終致力于追趕最前沿的技術(shù),充滿著理想主義。據(jù)當(dāng)時(shí)從谷歌跳槽到FAIR的根據(jù)實(shí)驗(yàn)室華人成員田淵棟介紹,F(xiàn)AIR實(shí)驗(yàn)室不像谷歌那樣條條框框很多,有各種各樣的限制,相對(duì)非常自由,沒有產(chǎn)品壓力。“我到了Facebook之后就好像回到了讀博時(shí)的狀態(tài),特別有興奮感,在工作上特別有動(dòng)力,整個(gè)人就好像活過來了。”田淵棟說。
可以說,彼時(shí)規(guī)模尚小的Facebook并未有谷歌「大象難轉(zhuǎn)身」的難題,F(xiàn)AIR這種自由包容的研究氛圍可以被視為是第一重「地利」,同時(shí)扎克伯格憑借Facebook牢牢掌握著流量入口,社交網(wǎng)絡(luò)上的圖片、視頻、語音等種種多模態(tài)的數(shù)據(jù),這是深度學(xué)習(xí)成長的沃土,這是第二重「地利」。
楊立昆所提出的另一個(gè)條件——企業(yè)研究的「開放哲學(xué)」則為Meta帶來了「人和」。
楊立昆堅(jiān)信「開放研究」,并以此為條件,讓這種愿景變成了Meta的規(guī)范。“因?yàn)槿绻愕难芯棵孛苓M(jìn)行,你的研究質(zhì)量會(huì)很差,你無法吸引最好的人才,你不會(huì)招募到有能力推動(dòng)最先進(jìn)技術(shù)發(fā)展的人。”楊立昆曾這樣說。
在這樣的企業(yè)研究哲學(xué)下,Meta不走封閉的AI路線,而是盡可能地對(duì)外開源研究代碼、數(shù)據(jù)集和工具。一方面,取得了看得見的研究成果,直接推動(dòng)了AI的進(jìn)程,其中最典型的案例有兩個(gè)。
一個(gè)是自監(jiān)督和生成模型(Self-supervised learning and generative models)。SSL一直都是Meta布局AI的重要方向。楊立昆曾將SSL視為「人工智能的暗物質(zhì)」。他認(rèn)為,區(qū)別于監(jiān)督學(xué)習(xí)這種范式,SSL可以利用大量未標(biāo)記數(shù)據(jù)來擴(kuò)大人工智能規(guī)模,這對(duì)于識(shí)別和理解世界更微妙、更不常見的表示模式很重要。2014年,當(dāng)Ian Goodfellow提出了GANs模型(生成對(duì)抗網(wǎng)絡(luò))時(shí),科技巨頭們先后跳上了研究GANs的彩車,連一向在AI上鮮少發(fā)聲的蘋果也在當(dāng)時(shí)發(fā)布了一篇「如何更好地利用 GANs」的研究論文。
Meta無疑走在前列,從2015年開始,Meta就關(guān)注GANs的不同變體,讓其從研究人員著迷的「玩具」變成可輔助人類生產(chǎn)的「工具」。
![]()
Meta的科學(xué)家和工程師們認(rèn)為,GANs真正有趣的部分是它們對(duì)未來的意義,上圖展示了可參與時(shí)尚單品的創(chuàng)作圖源:Meta
2017年,F(xiàn)acebook聯(lián)合羅格斯大學(xué)和查爾斯頓學(xué)院藝術(shù)史系,針對(duì)GANs提出了名為CAN(創(chuàng)造性對(duì)抗網(wǎng)絡(luò)),讓AI繪畫真正走入大眾視野。據(jù)當(dāng)時(shí)研究人員的測試,請觀眾去判斷由CAN模型生成的AI藝術(shù)作品是人類藝術(shù)家的作品,還是人工智能的創(chuàng)作。結(jié)果,有53%的觀眾認(rèn)為藝術(shù)作品出自人類,這也是歷史上類似的圖靈測試?yán)锸状瓮黄瓢霐?shù)。
另一個(gè)案例則是AI框架PyTorch。作為時(shí)下流行的開源深度學(xué)習(xí)框架,PyTorch被廣泛應(yīng)用于人工智能和機(jī)器學(xué)習(xí)領(lǐng)域,其地位一度逼近谷歌的TensorFlow。楊立昆曾說:“當(dāng)初谷歌的TensorFlow確實(shí)比Torch更火。然而Meta的PyTorch出現(xiàn)之后,現(xiàn)在其受歡迎程度已經(jīng)超過TensorFlow了。”
而根據(jù)中信建投對(duì)Github上的項(xiàng)目數(shù)量、關(guān)注人數(shù)的對(duì)比,在AI工程領(lǐng)域,Meta工程領(lǐng)域相關(guān)能力僅次于微軟和谷歌。
![]()
這種「開放開源」更深遠(yuǎn)的影響就是吸引了眾多頂尖人才的加入。深度學(xué)習(xí)發(fā)展的歷史,就是一部科技巨頭的搶人史。彼時(shí)的FAIR可以被視為深度學(xué)習(xí)「研究與工程」的人才庫。有ResNet網(wǎng)絡(luò)的發(fā)明人何愷明、VC維和SVM的締造者Vladimir Vapnik、提出隨機(jī)梯度下降法理論的Léon Bottou等。
天時(shí)、地利、人和,Meta似乎具備成為AI時(shí)代的霸主的因素,那么究竟為什么,Meta和扎克伯格會(huì)錯(cuò)過這次浪潮呢?
2014年,扎克伯格開啟了自己的「亞洲行」,到訪中國時(shí),在清華大學(xué)經(jīng)管學(xué)院舜德樓內(nèi),用中文演講的扎克伯格闡述了當(dāng)時(shí)十歲的Facebook在「下一個(gè)十年」的三個(gè)方向:連接整個(gè)世界、發(fā)展人工智能、虛擬現(xiàn)實(shí)。
“第一,我們想要連接整個(gè)世界,所以我們要幫助所有人用互聯(lián)網(wǎng),第二,我們想要發(fā)展人工智能,第三是所有人用手機(jī)以后,我相信下個(gè)平臺(tái)是虛擬現(xiàn)實(shí)(virtual reality),Oculus是第一產(chǎn)品,我們希望還有別的很多產(chǎn)品。”
三大方向?qū)?yīng)當(dāng)時(shí)Facebook最重要三個(gè)業(yè)務(wù)板塊:連接,即對(duì)應(yīng)來自社交媒體平臺(tái)所創(chuàng)造的收入。VR,也就是扎克伯格所堅(jiān)信的「下一代互聯(lián)網(wǎng)」,也是后來他口中的「元宇宙」。而人工智能,既是彼時(shí)扎克伯格對(duì)外展示的野心,也同樣可視為支撐其他業(yè)務(wù)的重要技術(shù)組件。
扎克伯格曾在說服楊立昆加入時(shí),向這位學(xué)者描述過自己的愿景——未來,社交網(wǎng)絡(luò)上的互動(dòng)變成獨(dú)立完成任務(wù)的技術(shù)驅(qū)動(dòng),在短期內(nèi),這些技術(shù)將識(shí)別照片中的人臉,識(shí)別語音指令,并在不同的語言之間進(jìn)行翻譯。從長遠(yuǎn)來看,智能體或機(jī)器人將巡視Facebook的數(shù)字世界,接受指令,并根據(jù)需要執(zhí)行指令。
當(dāng)楊立昆問Facebook是否有任何不感興趣的人工智能研究領(lǐng)域時(shí),扎克伯格說:“可能是機(jī)器人學(xué)。”但其他一切——數(shù)字領(lǐng)域的一切——都在扎克伯格興趣范圍之內(nèi)。
按照這樣的戰(zhàn)略邏輯,依靠領(lǐng)先的技術(shù)、社交網(wǎng)絡(luò)規(guī)?;氖杖胍约癡R作為硬件載體,F(xiàn)acebook理應(yīng)走出一條更順暢的發(fā)展道路。但事實(shí)上,誰也難以預(yù)料技術(shù)的發(fā)展與周期變化,扎克伯格與他的Facebook也毫不例外。
理解Meta為何沒有成為當(dāng)下最熱門的AI企業(yè),F(xiàn)AIR的兩次重組是一個(gè)很好的觀察窗口。
在2018年之前,F(xiàn)AIR實(shí)驗(yàn)室主要負(fù)責(zé)學(xué)術(shù)研究,另一個(gè)被稱為應(yīng)用機(jī)器學(xué)習(xí)部門(下文簡稱:AML)則是負(fù)責(zé)產(chǎn)品團(tuán)隊(duì)成果的轉(zhuǎn)化,雙方互不干涉,相對(duì)比較獨(dú)立。一個(gè)強(qiáng)調(diào)最前沿的技術(shù),另一個(gè)則是注重轉(zhuǎn)化,因此如何強(qiáng)調(diào)團(tuán)隊(duì)之間的協(xié)作,成為了關(guān)鍵。但好在,盡管工作方式不同,但兩個(gè)團(tuán)隊(duì)的共識(shí)都是一致的,比如強(qiáng)調(diào)開放,因此上述問題還并沒有顯露。
轉(zhuǎn)折的點(diǎn)發(fā)生在2018年,F(xiàn)AIR的第一次重組。
2018年,楊立昆宣布卸任FAIR的職位,轉(zhuǎn)任首席AI科學(xué)家一職,接任楊立昆的是當(dāng)時(shí)AML的領(lǐng)導(dǎo)者 Jér me Pesenti。這次調(diào)動(dòng)不同的點(diǎn)在于,削弱了FAIR的獨(dú)立性,Pesenti同時(shí)擁有FAIR和AML兩個(gè)部門的話語權(quán)。楊立昆在一次采訪中這樣評(píng)價(jià)這次變動(dòng):「AML和FAIR向CTO匯報(bào),隨著AI重要性、圍繞深度學(xué)習(xí)建立更多系統(tǒng)重要性的提升,CTO再也不用擔(dān)心了?!?/p>
![]()
楊立昆的「言外之意」其實(shí)有二:一是FAIR正在去集中化,這意味著未來將更多為產(chǎn)品和業(yè)務(wù)服務(wù)。二是在當(dāng)時(shí)Facebook陷入到了嚴(yán)重的監(jiān)管,CTO必須要用技術(shù)解決公眾的信任危機(jī),因此FAIR加大了在識(shí)別型AI的投入,以促進(jìn)人工智能的公平、透明和可解釋性。
第二次重組則發(fā)生在2022年6月,Meta再次宣布FAIR重組調(diào)整,明確提出AI部門不再「集中化研究」,而是分布式的下放到每個(gè)組織部門中去。這項(xiàng)改動(dòng)加速AI技術(shù)在Meta實(shí)際業(yè)務(wù)中的應(yīng)用,而被引入到不同產(chǎn)品組的業(yè)務(wù)部被稱為「AI創(chuàng)新中心」。其中,F(xiàn)AIR也將成為Reality Labs Research旗下部門,就在一年前,F(xiàn)acebook正式改名為Meta。
科技公司的組織變動(dòng)非常常見,畢竟技術(shù)的變化太快了。但不同于微軟、蘋果等科技公司,F(xiàn)AIR之于Meta,兩次重組的不同點(diǎn)有二:
一是AI都是「救急」,而非創(chuàng)新。無論是用以服務(wù)社交媒體,識(shí)別與解決假新聞等問題,還是應(yīng)對(duì)不成熟的VR業(yè)務(wù),F(xiàn)AIR本身聚焦前沿技術(shù)的創(chuàng)新被大大稀釋了。
二是缺乏戰(zhàn)略的穩(wěn)定性。「擁抱變化」盡管是科技公司經(jīng)常掛在嘴邊的一句話,但參考微軟、蘋果的經(jīng)驗(yàn),總有一個(gè)穩(wěn)定長期的「主線」。例如,蘋果盡管市場被吐槽「擠牙膏創(chuàng)新」,但在圍繞C端的軟硬件迭代上始終放大自己的生態(tài)、供應(yīng)鏈等核心優(yōu)勢。
至此,如果回頭看看十年前扎克伯格給自己留的三個(gè)方向:連接整個(gè)世界、發(fā)展人工智能、虛擬現(xiàn)實(shí),似乎三個(gè)都沒有助力其成為TOP1。
“我們可以發(fā)現(xiàn)的一點(diǎn)是說,Meta又變酷了。”曾在Meta擔(dān)任AI架構(gòu)總監(jiān),如今創(chuàng)業(yè)的賈揚(yáng)清如此評(píng)價(jià)Meta的新變化。
在由chatGPT所開啟的生成式AI浪潮中,之所以說Meta「重新變酷」的關(guān)鍵有二:一是區(qū)別于OpenAI等巨頭的閉源路線,Meta加入戰(zhàn)場的姿態(tài)是「開源」。
從LLaMA系列開始,Meta相繼開源了一系列的模型,包括視覺領(lǐng)域的SAM和DINOv2、音頻領(lǐng)域的AudioCraft系列模型、多模態(tài)大模型ImageBind等。而據(jù)扎克伯格的最新透露,Meta正在訓(xùn)練Llama 3,且該模型具備更強(qiáng)的代碼生成能力。
而由LLaMA所引發(fā)的「開源和閉源」之間的討論已足以證明了Meta的變化。楊立昆曾這樣形容開源社區(qū)與閉源模型在生成式AI上的發(fā)展。“開源人工智能模型正走在超越專有模型的路上”。
第二個(gè)「重新變酷」的原因則是扎克伯格態(tài)度的轉(zhuǎn)變。區(qū)別于過去對(duì)增長的迷戀以及混亂的AI策略,無論是與微軟合作,還是宣布對(duì)開源大模型的押注,Meta的AI策略逐步從分散走向整合。具體來說,一是延續(xù)開源路線,加大AI生態(tài)的繁榮,這既符合對(duì)FAIR當(dāng)初的承諾,也有利于在開發(fā)者和公眾間,改善Meta的形象。二是借助AI更快抵達(dá)元宇宙,一方面利用AI降低開發(fā)門檻,另一方面,發(fā)揮應(yīng)用優(yōu)勢,更好地優(yōu)化體驗(yàn)。
據(jù)「硅基研究室」梳理,區(qū)別于谷歌、亞馬遜等巨頭,Meta的AI能力主要集中在C端和視覺,包括圖像識(shí)別和目標(biāo)檢測、圖像生成、增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)、人臉識(shí)別和人臉相關(guān)技術(shù)以及社交網(wǎng)絡(luò)數(shù)據(jù)處理和隱私保護(hù)。這些技術(shù)儲(chǔ)備在生成式AI時(shí)代具備先發(fā)優(yōu)勢。
可以肯定的是,扎克伯格和他的Meta都不愿重走過去的老路,曾經(jīng)的AI王者是否能夠再度翻身,這是時(shí)代交給扎克伯格的新命題了,畢竟Meta所面臨的挑戰(zhàn)還有很多。
首先,是老生常談的Reality Labs的盈利問題。從Meta去年第三季度財(cái)報(bào)狀況來看,廣告業(yè)務(wù)強(qiáng)勢復(fù)蘇,但VR/AR業(yè)務(wù)持續(xù)虧損。去年9月,Meta發(fā)布了首款消費(fèi)級(jí)MR頭顯Quest 3,據(jù)天風(fēng)國際證券分析師郭明錤的分析,Quest 3頭顯銷量將明顯少于最初的預(yù)期。據(jù)機(jī)構(gòu)IDC的估計(jì),2023年AR/VR頭顯的出貨量為810萬臺(tái),同比下降8.3%,盡管有蘋Vision pro的熱度加持,但市場回暖依舊需要一定的時(shí)間。
其次,即便不走過去的老路,AI戰(zhàn)略已逐漸連貫,但比起微軟、OpenAI等巨頭,Meta想做的還是太多了。如「互聯(lián)網(wǎng)怪盜團(tuán)」的評(píng)價(jià),當(dāng)所有科技巨頭都在集中投入AI這一個(gè)「研發(fā)焦點(diǎn)」時(shí),Meta卻必須將資源分散在兩個(gè)「研發(fā)焦點(diǎn)」,這不可避免地要面臨資源和精力的分配問題。
時(shí)間撥回2012年,彼時(shí)Facebook尚未改名,面對(duì)當(dāng)時(shí)股價(jià)的低迷、移動(dòng)化戰(zhàn)略的失誤,扎克伯格回應(yīng)道:“我能承受人們的低估,因?yàn)槲覍幵副坏凸溃@樣才能真正讓他們刮目相看。”如今在這場關(guān)于AI的新戰(zhàn)事中,扎克伯格回到了原點(diǎn),他和Meta都急需一場勝仗。
參考資料:
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號(hào)后發(fā)表評(píng)論
RPG 游戲發(fā)展到一定程度,自然而然就實(shí)現(xiàn)了元宇宙
現(xiàn)在AI和上一輪AI的本質(zhì)不同,就在于這一輪AI的含金量和成色高得多
元宇宙不能說涼而是沒起步,現(xiàn)在的科技起步不了,這事還得水到渠成
互聯(lián)網(wǎng)領(lǐng)域,別看PPT,看現(xiàn)實(shí)
要不直接把公司名改成LLAMA吧?