Cohere聯(lián)合創(chuàng)始人艾丹·戈麥斯(Aidan Gomez)(圖片來源:多倫多大學)

艾丹·戈麥斯(Aidan Gomez)是一位著名的AI研究者,也是Cohere的聯(lián)合創(chuàng)始人。他是少數(shù)在Google Brain工作時創(chuàng)造Transformer算法的研究者之一。此次交流中,他談到了自己的經(jīng)歷以及他的初創(chuàng)公司Cohere,該公司以他早些時候的工作為基礎(chǔ)。

戈麥斯在加拿大長大,后來他去了多倫多大學學習。在那里,他在大二的時候發(fā)現(xiàn)了人工智能,并開始狂熱地閱讀有關(guān)該主題的學術(shù)論文,是一名機器學習研究員和數(shù)學迷。

“我變得癡迷,我就是日夜不停地閱讀論文,”他回憶說。“我會帶著一篇研究論文入睡。”

他在文獻中一直看到一個名字——杰夫·辛頓(Geoffrey Hinton )——他的附屬機構(gòu)也是多倫多大學,盡管辛頓早已停止教學。戈麥斯通過電子郵件與他聯(lián)系,向辛頓提出一個小技術(shù)問題。令他驚訝的是,辛頓回應(yīng)了他,這位世界上最著名的AI研究者向一個當時還是匿名的本科生解釋了一個普通的問題。

在他的本科學習期間,戈麥斯前往科技創(chuàng)新的中心——硅谷——那里他成為了著名的Google Brain團隊的一名實習生。在那里,他與領(lǐng)域內(nèi)一些最聰明的人合作,包括在開發(fā)谷歌TensorFlow模型框架中發(fā)揮了重要作用的Lukasz Kaiser。

“Kaiser想把機器學習研究者們編譯的每一個數(shù)據(jù)集都放入一個模型中,使其在輸入和輸出方面都完全Multi-model(多模態(tài))。”戈麥斯說。

為了支持這個項目,戈麥斯幫助建立了一個名為Tensor2Tensor的軟件基礎(chǔ)設(shè)施,該設(shè)施可以在成千上萬的GPU之間分配計算任務(wù)。他說,這主要集中于自回歸模型,特別是基于注意力的模型。“我們聽說Google翻譯的一個團隊也對基于注意力的自回歸模型感興趣,Lukasz說服他們過來,并在Tensor2Tensor上構(gòu)建它。”

接下來的10周,我們一直在趕制這個模型。“由于我們得到的結(jié)果非常出色,所以壓力只是越來越大,”戈麥斯回憶道。“這是早期非常成功、可以大規(guī)模擴展的架構(gòu)之一,我們的大規(guī)模GPU集群帶來了極高的性能。”

“沒人在睡覺;我每天工作14個小時編碼,建設(shè)這個基礎(chǔ)設(shè)施,使它更為健壯,運行實驗,這就是我們得到變壓器算法的方式。”

現(xiàn)在,Transformer算法只有大約20行代碼?;緦邮且粋€多層感知器(MLP),Transformer實際上只是一些堆疊在一起的MLP和一個注意力層。在Transformer之前,有這些非常復(fù)雜的LSTM架構(gòu),沒有統(tǒng)一的架構(gòu)。有了Transformer,所有這些都被拆除,留下的是簡單的、表現(xiàn)良好的、可擴展的“內(nèi)核”東西。

Transformer算法為先進的自然語言處理打開了大門,使機器能夠理解和生成類似人類的語言。OpenAI的首席科學家Ilya Sutskever立即利用它建立了第一個生成預(yù)訓練Transformer模型——GPT,現(xiàn)在已經(jīng)發(fā)展到第四代GPT-4。Transformer引領(lǐng)了正在改變世界的生成AI革命。

戈麥斯接著共同創(chuàng)立了一家公司,Cohere,目的是使人們能夠接觸到這種變革性的算法和圍繞它構(gòu)建的大型語言模型。Cohere致力于使LLM(大型語言模型)盡可能地實用和有用,以滿足不同的垂直任務(wù)和行業(yè)的需要。

戈麥斯大部分時間都沒有參與關(guān)于生成式AI(AIGC)對人類的威脅的辯論。但考慮到AI近期的顯著進步,戈麥斯表示,越來越難以否認機器獲得感知能力的想法。

隨著AI感知潛力的展現(xiàn),戈麥斯強調(diào)了負責任開發(fā)和倫理考慮的重要性。他呼吁AI社區(qū)以保護人類價值、隱私和社會福祉的承諾來面對進步。他相信,通過培養(yǎng)對AI開發(fā)的深思熟慮和透明的方法,我們可以減少風險,最大化它所提供的好處。(本文首發(fā)鈦媒體App)

本文系作者 Craig Smith 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

14:59

部分娃哈哈宏勝工廠停產(chǎn),有工廠已放假

14:53

俄外長稱美謀求掌控全球能源市場

14:46

多晶硅價格繼續(xù)下跌,下游價格適當回穩(wěn)

14:43

趙樂際分別會見新加坡總理黃循財、斯里蘭卡議長維克拉馬拉特納

14:39

趙樂際同中外企業(yè)家代表座談

14:36

體育概念異動拉升,舒華體育漲停

14:36

綠電板塊局部異動,寧波能源4天3板

14:35

澳大利亞總理:美以伊戰(zhàn)事沖擊澳能源供應(yīng)安全

14:32

日韓股市收跌

14:31

3月27日全國農(nóng)產(chǎn)品批發(fā)市場豬肉平均價格為15.73元/公斤,比昨天上升0.5%

14:28

海爾新能源增資至4億,增幅約18%

14:25

日本超長期國債收益率繼續(xù)走高

14:14

馬斯克:人工智能將在3年后超過所有人類智能

14:01

滬深京三市成交額超1.5萬億元,較上日此時縮量725億元

13:56

麥格理警告:伊朗戰(zhàn)事若持續(xù)到6月,油價或升至200美元

13:52

中證協(xié)啟動《區(qū)域性股權(quán)市場自律管理與服務(wù)規(guī)范(試行)》評估工作,制度優(yōu)化信號明確

13:46

廣西:積極推進中越跨境鐵路、深水航道和大能力碼頭項目、內(nèi)河工程和集疏運體系等建設(shè)

13:39

工業(yè)氣體概念拉升,凱美特氣漲停

13:39

現(xiàn)貨黃金日內(nèi)漲幅擴大至2%,報4470.58美元/盎司

13:34

都市麗人:2025年公司擁有人應(yīng)占利潤1.23億元,同比下降2.18%

掃描下載App