本期播客,我們邀請到了《哈薩比斯:谷歌AI之腦》譯者周健工,他也是中國最早當(dāng)面采訪哈薩比斯的媒體人。我們從哈薩比斯的少年往事聊起,復(fù)盤DeepMind被谷歌收購的博弈,以及錯(cuò)失大模型的戰(zhàn)略失誤,也追問了那個(gè)繞不開的問題:當(dāng)一個(gè)科學(xué)家手握可能改變?nèi)祟惷\(yùn)的技術(shù),他的理想、執(zhí)念與野心,會把我們帶向何方?
以下是這次對話內(nèi)容的精選:
泓君:周老師,我知道您也是國內(nèi)第一批當(dāng)面去采訪哈薩比斯的中國媒體人。您要不要講一下,您對他的第一印象?
周健工:AlphaGo戰(zhàn)勝李世石是2016年,我是在2017年,對哈薩比斯進(jìn)行了一場大概一個(gè)小時(shí)的電視專訪。
他這個(gè)人非常的瘦小,當(dāng)時(shí)大概40歲,有些禿頂。我覺得他非常像一個(gè)普普通通的中國研究所里搞科研的人。他母親是新加坡的華人,所以有一點(diǎn)文化上的親切感。
當(dāng)時(shí)還在世的物理學(xué)家霍金說,哈薩比斯是世界上最聰明的人之一。我覺得那次交流得非常愉快,他沒有擺出那種神童、世界上最聰明的人的架子,他跟人交流是非常平和的。
但是他的語速是比較快的,表達(dá)的思想極其流暢、清晰,甚至非常犀利。你問他任何問題,他都能給你一個(gè)非常清晰的邏輯,在不同的知識之間的切換可以說是運(yùn)用自如。你就感覺到任何智力上的挑戰(zhàn),對這個(gè)人是沒有任何障礙的。這是我最深的一個(gè)印象。
他講話不是那種一套一套的、很多人被訓(xùn)練出公關(guān)的那種講話。我覺得黃仁勛有一點(diǎn)點(diǎn)這個(gè)味道。他講話非常具體地針對你問的這個(gè)問題,他能貢獻(xiàn)出最新鮮的一個(gè)想法。你覺得這東西不是說就像放了無數(shù)遍的一個(gè)PPT一樣,不停地給你播放。我覺得這是一種智慧。
泓君:您剛剛也提到了,他跟黃仁勛是非常不一樣的人。這兩本傳記也都是您翻譯的。哈薩比斯和黃仁勛,作為兩個(gè)創(chuàng)始人,對AI的發(fā)展都有著非常重大的影響,他們身上最核心的特質(zhì)會有什么不一樣的地方?
周健工:在哈薩比斯身上能感覺到更多真誠的東西。在《哈薩比斯》這本書里面,作者馬拉比用了大量的對話,這是跟馬拉比其他書不同的地方。你可以從他跟哈薩比斯私下里大概有30多個(gè)小時(shí)的對話,感覺到哈薩比斯發(fā)自內(nèi)心的很多想法。
所以我在翻譯的過程中,對他的對話也非常認(rèn)真仔細(xì)地去處理,怎么可以從對話中看到這個(gè)人內(nèi)心深處的真實(shí)的、微妙的一些想法。
![]()
《哈薩比斯:谷歌AI之腦》(The Infinity Machine:Demis Hassabis, DeepMind, and the Quest for Superintelligence) 作者:[美]塞巴斯蒂安·馬拉比(Sebastian Mallaby)譯者:周健工
泓君:對,我覺得這點(diǎn)也是我自己對哈薩比斯這個(gè)選題非常感興趣的一個(gè)原因。我們現(xiàn)在這期節(jié)目的錄制時(shí)間是在春節(jié)前夕。最近的這兩周,從OpenClaw出來了以后,我整個(gè)人處在一種非常震驚的狀態(tài)中,我覺得它可能已經(jīng)開始沖擊到很多人類的工作了。
哈薩比斯,包括我們說像Anthropic的Dario Amodei,他們都是這些AI的建造者。在整個(gè)《哈薩比斯》的書中,作者用奧本海默的例子去做對比。我記得那本書它的結(jié)尾,也包含一個(gè)疑問:哈薩比斯一直想做正確的事情,但是他能不能做到?這是一個(gè)問號。
所以我還挺感興趣,就是我們今天在探討這樣一個(gè)——我更愿意把他定位成AI科學(xué)家,他在建成一個(gè)非常強(qiáng)大的AI的過程中,他到底自己是怎么去看待技術(shù),包括是怎么看這些“AI威脅論”,以及到底我們會把這個(gè)技術(shù)帶向何方……這一系列都是我很感興趣的討論點(diǎn)。
周健工:馬拉比是一個(gè)寫作的高手,他寫這本書的立意我覺得也是非常高的。從頭到尾讀完之后,我有一個(gè)突出的感受:馬拉比驅(qū)動這本書的敘事最底層的那個(gè)力量是什么?AGI是威力無比強(qiáng)大的一個(gè)技術(shù),也可能是人類的一個(gè)終極技術(shù),就像他的這本書的原名《The Infinity Machine》,它是一個(gè)上帝的機(jī)器。對人類未來的福祉,甚至對人類的文明影響這么大,它作惡的可能性也是有的。
那么發(fā)明這些技術(shù)的這一小撮人究竟是什么樣的人?他們帶著什么樣的動機(jī)來發(fā)明這些技術(shù)?他們的動機(jī)可能會直接影響到這個(gè)技術(shù)對人類的未來究竟意味著什么。他認(rèn)為哈薩比斯可能是里面的一個(gè)最關(guān)鍵的人物。因?yàn)樵贑hatGPT出現(xiàn)10年之前,AGI這個(gè)運(yùn)動就已經(jīng)開始了,就源自于哈薩比斯他們這個(gè)團(tuán)隊(duì)。所以他找到哈薩比斯,是非常非常準(zhǔn)確的一個(gè)選擇。
泓君:我們說到這里,要不要給我們的聽眾簡單介紹一下哈薩比斯這個(gè)人,以及他在創(chuàng)建DeepMind以前到底是一個(gè)什么樣的經(jīng)歷?
周健工:他的第一個(gè)標(biāo)簽是神童。4歲時(shí)看大人下國際象棋,5歲就開始自己下,13歲的時(shí)候是國際象棋大師,而且他的積分在全球同年齡段是排名第二。所以在童年時(shí)期他經(jīng)常,跟成人一起下棋,經(jīng)常是屁股底下墊兩個(gè)厚厚的書,他才能看著棋盤,一下就是8個(gè)小時(shí)以上,下著下著就睡著了,因?yàn)樗×恕?/p>
![]()
幼年的哈薩比斯 圖片來源:The Thinking Game
他是非常典型的移民家庭,母親是一個(gè)華人,父親是希臘塞浦路斯人。兩個(gè)人都是在倫敦勤勤懇懇撫養(yǎng)孩子。他的父母認(rèn)為他將來走上國際象棋這條路肯定會成功的,但是最關(guān)鍵的兩個(gè)頓悟點(diǎn),我覺得完全是哈薩比斯自己在身上促成的。
第一個(gè),他在11歲的時(shí)候,我記得書里面寫到,他在列支敦士登跟丹麥的一個(gè)國際象棋冠軍在對弈的時(shí)候,一口氣下了10個(gè)小時(shí)。按照他的水平,這局棋很可能是和棋,但是可能還要糾結(jié)下去。這個(gè)時(shí)候?qū)Ψ皆谒伎?,他看著對方,然后又看著大廳里到處都是下棋的人。他突然想到一個(gè)問題:難道我就在下棋中度過這一輩子嗎?
然后他又想一個(gè)問題:這個(gè)屋子里所有的人,都是世界上可能最聰明的人,他們難道把自己的智力全部用在下棋這一件小事上嗎?他突然感覺下棋對他的意義沒有那么重大了,而且勝負(fù)對他來說也不重要了。從那以后,他還在下棋,但是對下象棋這件事情就不再那么執(zhí)念了。
第二件事,是他父親帶他去倫敦的一個(gè)號稱世界上最大的書店。他看到了一本薄薄的小冊子,是英國國際象棋大師大衛(wèi)·利維(David Levy)寫的一本書,關(guān)于怎么編程國際象棋程序。里邊就講了用計(jì)算機(jī)怎么去下國際象棋,怎么去戰(zhàn)勝對手,它的原理是什么。哈薩比斯就一口氣把這本書讀完了。這本書立刻把他從國際象棋這個(gè)世界連接到了計(jì)算機(jī)的這個(gè)世界。
而且這本書里提到了一個(gè)非常關(guān)鍵的人叫香農(nóng)(Claude Shannon)。香農(nóng)是信息論的發(fā)明者,香農(nóng)在現(xiàn)代意義上比較成熟計(jì)算機(jī)出現(xiàn)之前,在1950年就寫過一篇關(guān)于如何編程象棋的文章,并提出了一個(gè)當(dāng)時(shí)非常有預(yù)見性的觀點(diǎn):如果我們能編程下象棋,那么我們這個(gè)編程也可能完成其他的非常多的智力和認(rèn)知方面的任務(wù)。它可能具有通用性,可能是一個(gè)通用計(jì)算機(jī)。這些理論探索,對當(dāng)時(shí)幼小的哈薩比斯產(chǎn)生了極大的一次啟蒙,可以說是給他打開了另外一個(gè)更加廣闊的世界。
泓君:他16歲被劍橋錄取,因?yàn)楫?dāng)時(shí)他的年齡太小了,劍橋就要求他推遲一年入學(xué)。在這一年的等待時(shí)間里面,他是去游戲公司工作了一段時(shí)間,表現(xiàn)也非常的突出。我記得他在創(chuàng)建DeepMind以前,自己也做了一個(gè)游戲公司,是有兩段游戲公司經(jīng)歷的。
周健工:這兩段游戲公司經(jīng)歷對哈薩比斯的影響很大。第一次是在牛蛙公司(Bullfrog),是當(dāng)時(shí)歐洲和全球非常知名的一家游戲公司。哈薩比斯在游戲中增加了許多后來所謂智能體的一些初步的概念,比如設(shè)計(jì)一個(gè)角色,你先給他吃很咸的食物,他之后就會產(chǎn)生口渴的感覺。所以這個(gè)時(shí)候他產(chǎn)生了朦朧的智能體的感覺。
![]()
哈薩比斯在牛蛙公司《主題公園》游戲中融入了早期的智能體概念 圖片來源:The Thinking Game
后來他在劍橋畢業(yè)之后自己就創(chuàng)業(yè),當(dāng)時(shí)找了大衛(wèi)·西爾弗(David Silver),就是“強(qiáng)化學(xué)習(xí)”那面旗幟。他們倆一起搞了萬靈藥工作室(Elixir Studios)。這應(yīng)該說是一個(gè)失敗的創(chuàng)業(yè)項(xiàng)目。因?yàn)樗o自己立的標(biāo)準(zhǔn)太高了,一定要做一個(gè)世界上最牛的游戲。然后他把自己所有能想到的游戲中間那種復(fù)雜的故事情節(jié)、人物之間的互動,還有玩家的這種參與,想全部都設(shè)計(jì)進(jìn)去。但是因?yàn)樗麄兊乃懔τ邢?、資源有限,最后沒有能夠兌現(xiàn)他們的承諾。
這個(gè)叫《共和國》這款游戲,也可以說是一個(gè)史詩級的游戲。當(dāng)時(shí)冷戰(zhàn)剛剛結(jié)束,它是以蘇聯(lián)的崩潰作為背景來設(shè)計(jì)的一個(gè)游戲。所以對于當(dāng)時(shí)這么年輕的人來說,設(shè)計(jì)這么復(fù)雜的一款游戲,我覺得真的是非常有野心的。但是最后這款游戲,到美國的一個(gè)游戲的博覽會上,在演示的時(shí)候就掉鏈子了,讓西爾弗當(dāng)時(shí)就放鴿子跑了。哈薩比斯憑自己的三寸不爛之舌,勉強(qiáng)應(yīng)付,把大家糊弄過去了。但后來這個(gè)游戲遲遲不能推出,推出之后大家已經(jīng)對它不感興趣了。
這次失敗對于哈薩比斯也是非常有意義的。我覺得這本書里面寫的有一個(gè)點(diǎn)很好:一方面,對于AGI,對于科學(xué)發(fā)現(xiàn),對于智能,哈薩比斯有自己的很深的一些哲思和理論;但另外一方面,他又非常崇尚費(fèi)曼的一句話:“如果你不能把一個(gè)東西造出來,你就不能真正理解它。”所以他是一個(gè)知行合一的人。他如果想到一個(gè)通用的機(jī)器、一個(gè)智能體,他一定要把它造出來。我覺得打工和創(chuàng)業(yè)的這段經(jīng)歷,就奠定了他實(shí)際上不是一個(gè)空談的科學(xué)家,他是一個(gè)實(shí)踐的科學(xué)家。
泓君:您剛剛講的這段在萬靈藥工作室的創(chuàng)業(yè)經(jīng)歷過程中,我覺得有兩點(diǎn)跟現(xiàn)在我們對AI的判斷還是非常的息息相關(guān)的。
第一個(gè)他設(shè)計(jì)了極其超前的《共和國》這款游戲,他想在一個(gè)城市里同時(shí)模擬上千個(gè)獨(dú)立思維的角色。但是那個(gè)是在2003年,那個(gè)時(shí)候的電腦不光是顯卡、CPU,還有內(nèi)存,可能都跟不上這個(gè)野心。這件事情給了哈薩比斯一個(gè)非常深刻的教訓(xùn):你擁有再好的算法和想法,如果沒有足夠的算力支撐,它還是只能是停在紙面上的。
另外一個(gè)點(diǎn)就是,您剛剛提到了他從環(huán)境的反饋中去學(xué)習(xí)。這個(gè)最近也非?;?,有一個(gè)詞叫做“強(qiáng)化學(xué)習(xí)”。這跟DeepMind的最開始為什么落后于OpenAI,后面又反超的關(guān)系是很大的。比如說大家都知道,其實(shí)Transformer是谷歌的另外一個(gè)部門Google Brain發(fā)明的。DeepMind它雖然當(dāng)時(shí)也是被谷歌收購了,但是其實(shí)DeepMind最強(qiáng)的是強(qiáng)化學(xué)習(xí),這也是它刻在DNA里的東西。因?yàn)楣_比斯是一直堅(jiān)信,光靠大語言模型是到達(dá)不了AGI的,而且還需要有類似于AlphaGo的那種規(guī)劃和推理的能力。
所以我們說雖然DeepMind很早就被谷歌收購了,而且谷歌手里一邊是Transformer,一邊是強(qiáng)化學(xué)習(xí),這個(gè)手里有兩張“王牌”,但他們其實(shí)就是各干各的,早期也沒有融合。這是我們看到為什么OpenAI早期去搶了風(fēng)頭。但我覺得現(xiàn)在一個(gè)有意思的事情是,過去OpenAI的o1,包括DeepSeek的R1,都是在往前強(qiáng)化學(xué)習(xí)的方向去回?cái)[,反過來也在借鑒AlphaGo的思路。現(xiàn)在其實(shí)強(qiáng)化學(xué)習(xí),它的整個(gè)優(yōu)勢也開始顯現(xiàn)出來了。
周健工:其實(shí)AGI這個(gè)詞,是哈薩比斯在劍橋讀書的時(shí)候,他們計(jì)算機(jī)系那個(gè)學(xué)霸叫大衛(wèi)·西爾弗,從AI這個(gè)圈外引入到圈內(nèi)的一個(gè)詞。大概是1998年時(shí)候,美國的DARPA開的一次會上,有一個(gè)美國科學(xué)家在寫納米科技的時(shí)候,用了AGI這個(gè)詞,最早是從那發(fā)源的。西爾弗建議他當(dāng)時(shí)的一個(gè)老板寫一本書,就建議他用“通用人工智能”這個(gè)詞。
他們成立DeepMind這家公司的時(shí)候,AGI這個(gè)詞的理念和哈薩比斯的這個(gè)理念是高度吻合。所以他們這家公司的使命就是:要發(fā)明AGI這個(gè)機(jī)器,先解決AI,再用AI解決一切。就是他們最早的一個(gè)口號。
哈薩比斯和大衛(wèi)·西爾弗有一個(gè)執(zhí)念,他們一開始就認(rèn)為,通向AGI之路一定是強(qiáng)化學(xué)習(xí),未來的AGI一定是一個(gè)單一的模型。所以他們這種執(zhí)念,導(dǎo)致了他們的成功,最起碼在游戲的領(lǐng)域。成功的原因我覺得很簡單,因?yàn)橛螒蚴且粋€(gè)規(guī)則相對明晰、邊界相對清晰,獎勵機(jī)制非常清晰,你可以用這種強(qiáng)化學(xué)習(xí)、試錯(cuò)、反饋機(jī)制,快速地優(yōu)化。強(qiáng)化學(xué)習(xí)威力最大的這方面,可以發(fā)揮得淋漓盡致。
在這個(gè)過程中,其實(shí)在強(qiáng)化學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的這個(gè)深度學(xué)習(xí)之間,又發(fā)生了兩個(gè)學(xué)派之爭,其實(shí)就是杰弗里·辛頓(Geoffrey Hinton)和理查德·薩頓(Richard Sutton),非常有意思。這兩個(gè)人都在加拿大,辛頓在多倫多大學(xué),薩頓在阿爾伯塔大學(xué)。薩頓是強(qiáng)化學(xué)習(xí)之父。大衛(wèi)·西爾弗知道了這個(gè)薩頓是強(qiáng)化學(xué)習(xí)的理論之后,跟他的想法非常近似,他就立刻跑到阿爾伯塔,那個(gè)冰天雪地去讀他的研究生去了。
這里面書中寫了幾個(gè)情節(jié),非常有意思。比如有些人在薩頓那里讀了碩士,就想去多倫多大學(xué)讀辛頓的博士,杰弗里·辛頓下面的人就說,你是從薩頓那邊來的,那你那個(gè)強(qiáng)化學(xué)習(xí)那套要放棄的,跟我們這邊是行不通的。兩個(gè)派別之間實(shí)際上也是有對峙的。
泓君:我覺得這段背景太精彩了,它其實(shí)也是現(xiàn)在在AI發(fā)展中,沒有被大家注意到的兩個(gè)派別。之前我記得還有一本書叫做《深度學(xué)習(xí)革命》,其實(shí)是以深度學(xué)習(xí)為核心來去講這樣的一群人的。在這本書里面,你剛剛提到像理查德·薩頓,然后還有強(qiáng)化學(xué)習(xí)的這條路線,它也是非常明顯的一條發(fā)展線。如果我們要講到這個(gè)發(fā)展線的話,是不是我們可以從整個(gè)DeepMind崛起來看,它有一些高光時(shí)刻,包括AlphaGo、AlphaZero,還有AlphaFold,它都是跟這條線一脈相承的。
我們再把故事線稍微往回拉一拉。剛剛其實(shí)聊到了他的游戲公司,萬靈藥工作室,接下來就是整個(gè)DeepMind崛起了。周老師,你要不要先跟大家介紹一下DeepMind三個(gè)創(chuàng)始人以及他們的背景?
周健工:其實(shí)我覺得最應(yīng)該成為他聯(lián)合創(chuàng)始人的應(yīng)該是大衛(wèi)·西爾弗。但是兩個(gè)人因?yàn)樵谌f靈藥工作室創(chuàng)業(yè)時(shí)候因?yàn)槭?,?dāng)時(shí)西爾弗就離開了。
他在成立DeepMind時(shí)找的聯(lián)合創(chuàng)始人,第一個(gè)叫肖恩·萊格(Shane Legg)。這個(gè)人是哈薩比斯在倫敦大學(xué)學(xué)院的神經(jīng)計(jì)算研究所認(rèn)識的。他發(fā)揮了一個(gè)非常重要的作用,就是把哈薩比斯跟硅谷連接起來了。另外一個(gè)就是蘇萊曼了。
泓君:我在這里稍微給大家劃個(gè)重點(diǎn),大家可以關(guān)注一下蘇萊曼,他現(xiàn)在也是整個(gè)微軟AI的負(fù)責(zé)人。
周健工:蘇萊曼來自一個(gè)穆斯林背景的移民家庭。他父母很早就離異了,從小生活艱辛,但是人很聰明,他考上了牛津,學(xué)的是神學(xué),上了兩年就輟學(xué)了。之后就做一些小生意,開冰激凌鋪,和我們談的硅谷的創(chuàng)業(yè)完全不是一回事。他經(jīng)常去哈薩比斯家玩,有時(shí)候哈薩比斯不在家,他就住在哈薩比斯那房間里,他就看哈薩比斯讀的書。
哈薩比斯以前在游戲公司打工創(chuàng)業(yè),手頭大概有幾百萬英鎊。蘇萊曼喜歡做點(diǎn)小生意,就拉哈薩比斯談兩件事,一個(gè)是社會正義,第二個(gè)就是說我們怎么去做生意,就這樣跟哈薩比斯建立了信任。
后來哈薩比成立公司,考慮到要融資,要經(jīng)營,他覺得蘇萊曼在這方面能幫他。所以最早的三個(gè)聯(lián)合創(chuàng)始人,就是他們?nèi)齻€(gè)。哈薩比斯占了絕對多數(shù)的股份,是肖恩·萊格的9倍,蘇萊曼的14倍。
第一筆天使融資,我覺得是最有意思的一個(gè)過程。你看什么樣的人愿意投資DeepMind這家公司。如果是說倫敦有這么幾個(gè)年輕人說我要造一個(gè)AGI,我相信在硅谷可能有一些人聽得懂,在倫敦幾乎是沒有人能聽得懂的。
但是他們還是在英國找到了一個(gè)愿意投資他們的人。那個(gè)人投資的動機(jī)非常有意思,他聽了哈薩比斯講的AGI這個(gè)事情之后,立刻認(rèn)定,這是一架上帝需要的機(jī)器。所以那個(gè)人出于一種宗教信仰,投了幾十萬英鎊。
另外一個(gè)愿意投資他的,是哈薩比斯在MIT做博士后研究時(shí)的指導(dǎo)教授,他非常欣賞哈薩比斯。他認(rèn)為哈薩比斯將來是一定能獲得諾貝爾獎的,而且他獲得諾貝爾獎不是普通的人能獲得的那種,一定是費(fèi)曼和克里克那個(gè)級別的。當(dāng)哈薩比斯跟他開口的時(shí)候,他說,我可以投你10萬美元,我就這么多了。
周健工:當(dāng)然第三個(gè)最重要的投資人就是彼得·蒂爾(Peter Thiel)了。彼得·蒂爾他認(rèn)為哈薩比斯是那種可以在科學(xué)上做出頂級發(fā)現(xiàn)的,但是在商業(yè)模式上完全不成立的那種人。彼得·蒂爾是一種“反共識”式的投資,所以叫逆向投資。他覺得這種人是需要投的。如果說世界上可能在一個(gè)遙遠(yuǎn)的未來,存在著一個(gè)AGI的話,那么能夠做成這件事的這個(gè)人肯定就是哈薩比斯。不管怎么說,先投吧。
特別重要的是他手下一個(gè)叫盧克· 諾塞克( Luke Nosek)的合伙人。諾塞克一見哈薩比斯就認(rèn)為,這個(gè)人就是跟馬斯克一樣的一個(gè)創(chuàng)業(yè)者。彼得·蒂爾就破例,給了他一個(gè)不上投決會表決的特殊的通道,才投了這家公司。所以你看,能投DeepMind的人都是非凡的人,他們的想法跟一般人非常非常不一樣的。
泓君:Founders Fund投了DeepMind至少有三輪,最開始的230萬美元的支票,這張支票占了接近于一半的股權(quán)。第二張是900多萬的一張支票。三輪下來,F(xiàn)ounders Fund在DeepMind這家公司的股份已經(jīng)是超過三個(gè)聯(lián)合創(chuàng)始人的所有的股份之和了。但是他在每個(gè)關(guān)鍵節(jié)點(diǎn),還是會有很多猶豫。包括到后面他不愿意領(lǐng)投,其實(shí)是周凱旋的領(lǐng)投救了DeepMind最后一輪融資的。
主要原因還是Founders Fund一直在質(zhì)疑他們?nèi)绾紊虡I(yè)化。我覺得跟這個(gè)機(jī)構(gòu)的投資風(fēng)格也是挺有關(guān)系的。就像您說的,他不需要上投委會,他可以自己做比較激進(jìn)的投資方式,投一個(gè)不被大眾看好的公司,只要這個(gè)方向是共識了,那他們就開始賣了。
周健工:我記得彼得·蒂爾決定賣的時(shí)候就是2013年了,那個(gè)時(shí)候AlexNet已經(jīng)出來了。杰弗里·辛頓、伊利亞,還有Alex做的AlexNet,它在圖像識別時(shí)候已經(jīng)超過人類了,深度學(xué)習(xí)取得了突破。那個(gè)時(shí)候,深度學(xué)習(xí)或者整個(gè)AI就開始熱起來了。彼得·蒂爾突然發(fā)現(xiàn),硅谷的這些人才的身價(jià)開始迅速地上漲。他認(rèn)為這是一個(gè)共識,共識就意味著泡沫,泡沫就意味著你要投入更多的錢去做一個(gè)更不確定的事情,這個(gè)又不符合他的投資理念了,他就決定不再追加了。
泓君:這個(gè)投資里面,其實(shí)還有一個(gè)很有意思的名字,就是周凱旋。他應(yīng)該是幫李嘉誠管理他的家族基金的。他其實(shí)也是在當(dāng)時(shí),應(yīng)該是哈薩比斯拿不到錢的時(shí)候,是非常關(guān)鍵的一個(gè)人。
周健工:對,最關(guān)鍵的B輪,DeepMind籌了2500萬美元,周凱旋起到了非常重要的作用。
泓君:谷歌當(dāng)時(shí)收購DeepMind是在一個(gè)什么樣的背景下?
周健工:那是他的C輪,他融不到足夠大的錢。哈薩比斯認(rèn)為彼得·蒂爾背叛了他,這個(gè)時(shí)候馬斯克就出場了。這里面有個(gè)邏輯特別有意思。因?yàn)樾ざ?middot;萊格,他參加了奇點(diǎn)大會,因?yàn)榈搅似纥c(diǎn)大會,他認(rèn)識了彼得·蒂爾,也知道埃隆·馬斯克。埃隆·馬斯克也在B輪承諾要投資500萬美元。
因?yàn)楣雀柰读薙paceX,埃隆·馬斯克就整天跟拉里·佩奇他們就混在一起。有一次馬斯克跟拉里·佩奇他們?nèi)タ碨paceX發(fā)射,然后就坐同一架私人飛機(jī)上回加州,他們就談起神經(jīng)網(wǎng)絡(luò)這個(gè)事情。拉里·佩奇的父親也研究過神經(jīng)網(wǎng)絡(luò)。所以他對這個(gè)事情還是有一定敏感度的。
所以當(dāng)時(shí)埃隆·馬斯克一聽,非常炫耀式地就說,你看,我們談這個(gè)事情,我已經(jīng)開始投資一家公司了,這家公司就叫DeepMind。拉里·佩奇聽完之后,默默地掏出了安卓手機(jī),在安卓手機(jī)上記下了這家公司的名字。沒多久,哈薩比斯就收到了一個(gè)電子郵件,第一句話自我介紹說,我是谷歌負(fù)責(zé)對外投資的,一條線就串起來了。
在谷歌決定收購DeepMind的時(shí)候,中間又插出了Facebook的扎克伯格。當(dāng)時(shí)AI火了起來,扎克伯格也很著急,也急于想找到一個(gè)團(tuán)隊(duì)來做這個(gè)事情。哈薩比斯和蘇萊曼,用馬斯克、用扎克伯格作為手中的牌來對付谷歌,希望能談出更高的價(jià)錢,這是他們的博弈策略。
哈薩比斯非常聰明,我記得里面寫了一段,扎克伯格邀請哈薩比斯去他家,兩個(gè)人神侃。哈薩比斯就問,你覺得哪些技術(shù)的賽道非常好?扎克伯格就說了一大堆,AI、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、3D打印……我都非常看好。哈薩比斯聽完就非常失望,一方面,AGI在扎克伯格眼中地位遠(yuǎn)遠(yuǎn)沒有那么重要;第二個(gè),他認(rèn)為扎克伯格對未來技術(shù)是沒有自己的判斷的,所以他就告辭了,馬上給拉里·佩奇打了個(gè)電話:我們繼續(xù)談吧。
泓君:這個(gè)細(xì)節(jié)我覺得非常的精彩。但是他最終沒有接受Facebook的收購要約,還是因?yàn)樗麄兲岬降囊粋€(gè)AI安全憲章的這件事情,對不對?
周健工:我覺得他一開始最認(rèn)真考慮的還是谷歌。谷歌這家公司的文化和氣質(zhì)非常吸引他。他認(rèn)為兩個(gè)創(chuàng)始人是有科學(xué)家的情懷的,能談得來的。另外,谷歌所謂那種“不作惡”的文化,其實(shí)跟他們提到AI的這個(gè)“安全”,實(shí)際上在當(dāng)時(shí)是有契合點(diǎn)的。但是Facebook就沒有這些東西。
我覺得他對Facebook那邊一直是當(dāng)一張牌來打的。書里面講了一個(gè)細(xì)節(jié)就是,拉里·佩奇有一次約他出去散步,他說:“那你為什么不來谷歌呢?你的目標(biāo)不是追求AGI嗎?我已經(jīng)在這里為你準(zhǔn)備了一切。”這一句話真正打動了哈薩比斯。
接下來就是價(jià)錢了。在這之前,谷歌收購了杰弗里·辛頓師生三個(gè)人那個(gè)小公司(注:2013年3月谷歌收購了剛剛成立1個(gè)月、僅有3名員工的公司DNNresearch和AlexNet源代碼)。DeepMind也參與競購了,出了1000萬去報(bào)價(jià)。當(dāng)哈薩比斯出局之后,他立刻給杰弗里·辛頓打了一個(gè)電話,說,你的要價(jià)無論如何不能低于4000萬。最后杰弗里·辛頓的團(tuán)隊(duì)4400萬美元成交了,算下來平均一個(gè)人差不多1500萬。
所以在談賣DeepMind這家公司,和谷歌談的時(shí)候,哈薩比斯就把前面這個(gè)交易價(jià)格作為參考就提出來。當(dāng)時(shí)谷歌的報(bào)價(jià),大概是這么算的,你們有30到40個(gè)世界頂級的AI研究人員,在當(dāng)時(shí)情況下,我給你每個(gè)人1000萬美元,也就是三四個(gè)億。哈薩比斯就不干了,他說你看我們不能低于1500萬美元,應(yīng)該是五六個(gè)億(注:這筆交易沒有被官方確切披露過金額,大概是5億到6.5億美元之間)。后來真的是,這些核心技術(shù)人員的平均價(jià)格,確實(shí)是在1500萬,而且谷歌對哈薩比斯這個(gè)人的定價(jià)大概是1.4個(gè)億左右。
泓君:所以這是當(dāng)時(shí)AI的人才價(jià)格,現(xiàn)在已經(jīng)漲到1個(gè)億了,對吧?
周健工:現(xiàn)在一個(gè)人1個(gè)億。Facebook如果是搶了三四十個(gè)人,可能得花三四十個(gè)億美元。
泓君:接下來的一個(gè)大的節(jié)點(diǎn),就是AlphaGo在首爾擊敗李世石,時(shí)間是到2016年。我們剛剛講到谷歌收購DeepMind,差不多是在2014年左右。時(shí)間我們再拉回到兩年以后,為什么他們會選圍棋這樣一個(gè)領(lǐng)域攻破呢?
周健工:谷歌在收購DeepMind之后,有一天哈薩比斯突然跟佩奇在講,說我們將戰(zhàn)勝圍棋的世界冠軍。然后對方就很吃驚地說,多長時(shí)間?他隨口就說了兩年。
被谷歌收購之后,他們整個(gè)的算力、人才各方面,都是當(dāng)時(shí)全世界首屈一指的。他們一定找到一個(gè)世界上最難的游戲項(xiàng)目來攻克它,來證明自己是世界首屈一指的AI實(shí)驗(yàn)室。
另外,哈薩比斯他自己也在劍橋的時(shí)候?qū)W過一段時(shí)間圍棋。我在采訪哈薩比斯時(shí)候我專門問他了,他當(dāng)時(shí)告訴我大概就是圍棋一段的水平。他也知道圍棋的難度遠(yuǎn)遠(yuǎn)比國際象棋要難,所以他選擇這樣一個(gè)目標(biāo)。
泓君:所以選圍棋核心是因?yàn)樗y。我記得谷歌創(chuàng)始人像拉里·佩奇也很喜歡下圍棋。當(dāng)時(shí)他們說要在圍棋上戰(zhàn)勝人的時(shí)候,是沒人相信的。因?yàn)槟愕谝徊?、第二步、第三步,你每一步要增加多少種可能性。當(dāng)時(shí)大家覺得以計(jì)算機(jī)現(xiàn)在的計(jì)算水平,感覺它是很難去窮盡所有的情況做到這樣的一個(gè)技術(shù)的,在當(dāng)時(shí)看來還是有一點(diǎn)點(diǎn)天方夜譚。
然后接下來還有一個(gè)AlphaFold,它是破解了困擾生物學(xué)界半個(gè)世紀(jì)的蛋白質(zhì)折疊的難題。破解的時(shí)間是在2020年。2024年,哈薩比斯他其實(shí)是因?yàn)檫@個(gè)事獲得了諾貝爾的化學(xué)獎。從圍棋到蛋白質(zhì),這個(gè)跨越他是怎么發(fā)生的?
周健工:哈薩比斯他一直非常關(guān)注生命科學(xué)。他在倫敦大學(xué)學(xué)院計(jì)算神經(jīng)科學(xué)讀博士的時(shí)候,他注意到,有一位生物學(xué)家叫安芬森,他就提出蛋白質(zhì)的結(jié)構(gòu)是由氨基酸鏈構(gòu)成的。而且自然界中大約只有20種常見的氨基酸鏈,如果能破解其中的密碼,是有可能把蛋白質(zhì)的結(jié)構(gòu)全部破解出來的。這個(gè)事情觸動了他,這個(gè)事情在他后來的十幾年的過程中間,一直縈繞在他的腦海里。
書里面有一段講了他在2016年,在漢城跟李世石下棋的時(shí)候,講了他中間跟大衛(wèi)·西爾弗談起了這個(gè)事情,說我們現(xiàn)在把圍棋給攻克了,下一個(gè)目標(biāo)是不是蛋白質(zhì)?而且特別有意思,兩個(gè)人在談的時(shí)候,旁邊還圍了一堆記者,他們私下里談這些話居然被錄下來了,這個(gè)事情也就傳出來了。
他們?yōu)槭裁锤矣谧鲞@個(gè)事?這時(shí)候有個(gè)叫戴維·貝克(David Baker)的生物學(xué)家,他知道蛋白質(zhì)的折疊是有一定的規(guī)則的,他就做了一個(gè)叫Foldit(折疊它)的游戲,大家就可以去玩。全世界大概有幾千個(gè)對這個(gè)領(lǐng)域比較熟悉的人,就非常喜歡玩這個(gè)游戲。后來他們又知道,世界上有一個(gè)蛋白質(zhì)折疊的競賽CASP。
馬拉比筆下的哈薩比斯,最本質(zhì)一個(gè)特點(diǎn)就是,玩什么游戲都一定要贏,而且哈薩比斯有這樣一個(gè)自信,他說沒有我玩不贏的游戲。他們覺得蛋白質(zhì)的結(jié)構(gòu)是由氨基酸的序列無窮無盡的組合構(gòu)成的,它一定是一個(gè)序列的問題。所以他們就用了循環(huán)神經(jīng)網(wǎng)絡(luò)來解決。后來突然發(fā)現(xiàn),它不是一個(gè)序列問題那么簡單。因?yàn)榘被嶂g它們不僅僅是一個(gè)排序的問題,它們還有折疊、接觸,比較復(fù)雜地糾合在一起。他們又覺得,這是一個(gè)圖像識別的問題,所以他們又用了一個(gè)卷積神經(jīng)網(wǎng)絡(luò),就用來解讀它的圖像,效果就好了一點(diǎn)。突然他們發(fā)現(xiàn)這個(gè)也不對。
這個(gè)時(shí)候他們引入了一個(gè)人,約翰·江珀(John M.Jumper)。詹珀發(fā)揮了一個(gè)特別決定性的作用,他決定轉(zhuǎn)向機(jī)器學(xué)習(xí),你有可能通過深度學(xué)習(xí),將氨基酸的這個(gè)鏈映射到它們最終的折疊的架構(gòu)上去,得到了哈薩比斯的支持。結(jié)果他們后來就一路開掛。2018年第一次參賽擊敗了97個(gè)團(tuán)隊(duì),到2020年是AlphaFold 2的時(shí)候,得分92.4分,顛覆了整個(gè)的領(lǐng)域。決定AlphaFold 2的成功,其實(shí)就是他們最終采用的Transformer這個(gè)架構(gòu)。
泓君:這段非常精彩。而且我們的播客過去兩度就AlphaFold跟AlphaFold 2,我們都出過節(jié)目,講它對整個(gè)生物學(xué)的意義,以及是如何解決這個(gè)困擾生物學(xué)界半個(gè)世紀(jì)的這些難題的。有興趣的聽眾也可以往回聽一聽。
![]()
圖片來源:www.nobelprize.org
泓君:后來在2022年底,OpenAI推出ChatGPT的時(shí)候,DeepMind它當(dāng)時(shí)是一個(gè)什么樣的狀況?他們內(nèi)部是什么反應(yīng)?
周健工:這又回到剛才談到的哈薩比斯和大衛(wèi)·西爾弗對強(qiáng)化學(xué)習(xí)的執(zhí)念。DeepMind研究的項(xiàng)目組合,哈薩比斯親自講過的。他給外人感覺是非常包容、非常跨學(xué)科的,但是他還是有先后順序的。他第一,我們認(rèn)為強(qiáng)化學(xué)習(xí)就是通向AGI的,這是我們的重中之重;第二,就是神經(jīng)科學(xué),向人的大腦學(xué)習(xí);第三才是從數(shù)據(jù)中去歸納。而且大語言的模型是在數(shù)據(jù)歸納里面的一個(gè)分支。所以大語言模型是排在第三位里面的一個(gè)分支,足見他是非常不重視的。
這個(gè)時(shí)候,伊利亞到了OpenAI之后,他在研究上做出了一系列的突破。特別是在Transformer之后,伊利亞第一個(gè)就拉著一幫工程師,他說你必須依照這個(gè)給我做模型出來。所以有GPT-1、GPT-2。到GPT-2的時(shí)候,才引起了哈薩比斯他們的關(guān)注,但還不到重視。
這時(shí)候就有一些他們從OpenAI挖來的人,就不斷地提醒他,你要重視大語言模型。一直到GPT-3出來的時(shí)候,才真的讓他們警醒了。
泓君:你覺得在整個(gè)過程中,哈薩比斯犯的最大的戰(zhàn)略性的錯(cuò)誤是什么?
周健工:我覺得他有他固執(zhí)的一面,不服輸?shù)囊幻?。他一直不愿意承認(rèn),通向AGI的另外一條可能的道路是深度學(xué)習(xí)。他認(rèn)為就是我強(qiáng)化學(xué)習(xí)。你看他當(dāng)時(shí)的AlphaFold已經(jīng)證明了,深度學(xué)習(xí)在AlphaFold里面其實(shí)是起到了比強(qiáng)化學(xué)習(xí)更大的一個(gè)作用。
但是他又藐視了語言。他一直認(rèn)為,AGI一定是接地的,他認(rèn)為語言是不接地的。當(dāng)然伊利亞就反駁他這個(gè)觀點(diǎn),他認(rèn)為語言里面間接地反映人類大量的接地的經(jīng)驗(yàn)和邏輯,是通過語言反映出來的。這個(gè)其實(shí)他是不承認(rèn)的。
還有一點(diǎn),他們一直認(rèn)為DeepMind應(yīng)該是一家以科學(xué)研究為主的機(jī)構(gòu)。但是他突然發(fā)現(xiàn),通過不僅僅是科研而且是工程,不僅僅是模型而且是產(chǎn)品,不僅僅是只做研發(fā)而且這個(gè)商業(yè),其實(shí)對于推進(jìn)AGI所起到的作用是非常巨大的。如果你不讓更多的人用它,你談什么通用,都是沒有意義的。
所以這些都是讓哈薩比斯反思的地方。當(dāng)然哈薩比斯沒有放棄,他內(nèi)心的那種,我認(rèn)為是某種程度的一種孤傲。他對這個(gè)事情,他另外一個(gè)情緒是非常的憤怒。書里面也寫了,他說他們把坦克開到了我們家草坪上了。他就覺得AGI這個(gè)地盤應(yīng)該是我DeepMind的,你現(xiàn)在OpenAI居然搞出這么大的一個(gè)挑釁,我必須要反擊。
泓君:在馬拉比寫整本書的過程中,我覺得DeepMind它雖然很強(qiáng)大,但它還是一個(gè)忍辱負(fù)重者。在2025年6月以后,整個(gè)形勢發(fā)生了逆轉(zhuǎn)。就從現(xiàn)在的情況來看,我們也可以說DeepMind它追上了。你覺得后面,它在追趕競爭對手的過程中間,谷歌進(jìn)行了怎樣的調(diào)整?它有哪些關(guān)鍵的策略?
周健工:我覺得第一個(gè)是,DeepMind和Google Brain的合并,是2023年4月份。當(dāng)時(shí)谷歌內(nèi)部進(jìn)入了一個(gè)據(jù)說是危機(jī)的狀態(tài),連另外一個(gè)創(chuàng)始人謝爾蓋-布林(Sergey Brin)都回來上班了,跟大家一起看代碼、看數(shù)據(jù)、看模型。
有點(diǎn)有意思的說,Google DeepMind的CEO是哈薩比斯,不是杰夫·迪恩。所以也證明了,當(dāng)初皮查伊不讓它分離出去,一直認(rèn)為它是一個(gè)戰(zhàn)略性的棋子,總有一天要用上。這個(gè)時(shí)候真的就用上了。
還一個(gè)就是說,DeepMind內(nèi)部的工作方式發(fā)生了變化,回到了以前DeepMind那種突擊隊(duì)式的工作方式,這樣就可以把所有的資源給集中起來,攻克最前沿的大模型。就是誰在哪個(gè)模塊、哪個(gè)環(huán)節(jié)取得了突破,就立刻內(nèi)部公開,然后立刻給予采納,就是完全透明的、高強(qiáng)度的攻關(guān)的這種方式。
另外以前很多人都在做各種各樣的Blue Sky Research,所謂藍(lán)天式的研究,他說這個(gè)要削減,即使是研究出來成果,也不及時(shí)發(fā)表了。
所以這幾點(diǎn)還是證明了比較有效,所以就慢慢地又趕上了。
泓君:對,所以整體來說,一個(gè)是谷歌組織架構(gòu)的大調(diào)整,然后是創(chuàng)始人的回歸,然后給錢、給算力資源。整體上這些基本盤的事情做了,追上來也是很快的事情。
泓君:事情發(fā)展到今年,就是我們錄播客的這個(gè)時(shí)間,就像我開始說的,我覺得現(xiàn)在整個(gè)AI的能力就表現(xiàn)出讓人恐懼。
其實(shí)在這本書里面他有提到,杰弗里·辛頓他自己一直在很多公開場合說,他覺得我們完了,他對AI是非常負(fù)面的看法,他覺得可能AI會毀滅人類。另一位圖靈獎的得主本吉奧,他也發(fā)出了AI的末日警告。
但是哈薩比斯依然覺得,AI是人類有史以來最有益的一個(gè)技術(shù)。您怎么看哈薩比斯這個(gè)人?你覺得他是一個(gè)樂觀主義者,還是一個(gè)被競爭裹挾的囚徒?
周健工:用最簡單的一句話說,我認(rèn)為他是一個(gè)好人。我跟他在交談中我就感覺,這個(gè)人是一個(gè)天生的、最底色的東西是偏樂觀的。他真正的理想還是科學(xué)發(fā)現(xiàn)。他身上有一種非常濃厚的英國科學(xué)革命和整個(gè)歐洲的這種人文精神。我覺得這是他跟硅谷的那些埃隆·馬斯克、黃仁勛、山姆·奧特曼、甚至阿莫迪,都不一樣的地方。
他還是相信AGI這個(gè)技術(shù),它最終能夠幫助人類,解決人類所面臨的最重大的一些挑戰(zhàn)。他認(rèn)為除了AI之外沒有別的辦法。
至于杰弗里·辛頓和本吉奧的警告,我自己不太喜歡那種AI的末世論、AI威脅人類生存的這些論調(diào)。很多人批評他們這種所謂“奧本海默情結(jié)”,本質(zhì)上是想夸大他們所發(fā)明的技術(shù)的威力。
泓君:對,還有我覺得對像哈薩比斯這樣的頂級科學(xué)家而言,即使他知道AI的威力很大,我記得書里其實(shí)有一句話,就是講為什么他還要研究這項(xiàng)技術(shù),是因?yàn)?ldquo;探索的樂趣”對他來說實(shí)在是太大了。我覺得這也是我在很多這個(gè)世界頂級的科學(xué)家身上看到的一種共同的特質(zhì),他們沒有辦法停止自己去探索、去創(chuàng)新。
周健工:對,在這本書的扉頁,馬拉比引用了馮·諾依曼在研制原子彈的時(shí)候?qū)懙囊痪湓挘何覀冎肋@個(gè)威力太大,但是我們作為科學(xué)家,如果我們不履行我們的發(fā)現(xiàn)的天責(zé),這是違背我們科學(xué)倫理的,但是一旦把這些產(chǎn)品的威力釋放出來,我們可能成為世界上最被憎恨的人。就是體現(xiàn)了他們矛盾的這種心情。
泓君:我自己是覺得,馬拉比對哈薩比斯的寫法,有一點(diǎn)點(diǎn)過于好了。我鮮少看到他在一些關(guān)鍵事件、關(guān)鍵抉擇的時(shí)候,展現(xiàn)的這個(gè)人的矛盾性。他很多的敘述,是在寫哈薩比斯的思想是什么、想法是什么。但是人很多時(shí)候是可以在事成之后,給自己安一個(gè)光鮮亮麗的理由的。這一點(diǎn)我不知道你是怎么看的?
周健工:我覺得跟他的英國立場是有一定的關(guān)系的。馬拉比是英國人。我認(rèn)為哈薩比斯是英國的“國寶”。他在寫自己的“國寶”的時(shí)候,傾向性會很自然地流露出來。而且你可以看到,他在書中談到AGI的未來、對人類究竟是好是壞這個(gè)事情上,他其實(shí)非常地不相信硅谷那幫人的。他流露出一個(gè)傾向就是——哈薩比斯這樣的人就在倫敦來引領(lǐng)AGI,可能代表了這個(gè)技術(shù)的未來。
泓君:我覺得一個(gè)人動人,他不僅僅是因?yàn)樯砩系膬?yōu)點(diǎn),有的時(shí)候也是因?yàn)樯砩系娜秉c(diǎn)。你覺得哈薩比斯這個(gè)人身上是有矛盾點(diǎn)的嗎?
周健工:我見他的第一印象,我就說他像一個(gè)普通的科研工作者,他不開口,你會覺得他是一個(gè)特別普通隨和、與世無爭的人。但是這本書里面就寫到,他是一個(gè)非常爭強(qiáng)好勝的人。他在任何智力游戲中,包括玩桌面足球、打撲克牌、象棋、雙陸棋,他不玩則已,他一玩一定要戰(zhàn)勝別人。他口口聲聲說,我不愿意控制別人,但是你一定要贏過別人,是不是另外一種控制呢?
泓君:我覺得這也是書中在反復(fù)討論的一個(gè)議題。哈薩比斯也有一個(gè)類似于“絕地武士”這樣的一種說服力,他同時(shí)也是口才非常好的。
周健工:我覺得他可以把所有的人給侃暈。他那種敏捷度和對你提問題的針對性,跨學(xué)科的邏輯的打通能力,我覺得在這個(gè)世界上很少有人能做到這一點(diǎn)。
泓君:今天整個(gè)的故事都非常的精彩。我覺得現(xiàn)在整個(gè)AI競賽也開始白熱化了,我們但愿我們聊的這樣一個(gè)天才,他是一個(gè)好人,也希望在整個(gè)AI的構(gòu)建過程中,這些人都是好人,而不是被資本綁架。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論