隨著產(chǎn)能增加,供需轉(zhuǎn)向平衡,受生成式 AI 算力需求暴漲引發(fā)的英偉達GPU(圖形處理器)“短缺”情況正逐步緩解。
鈦媒體App3月10日消息,據(jù)報道,日前有超過六家使用 AI 芯片的公司表示,正在減少采購英偉達 AI 芯片訂單,同時從云服務(wù)廠商租用英偉達 H100 AI 芯片變得相對容易。而且,一些在早期瘋狂搶購GPU的買家,現(xiàn)在正尋求出售部分芯片存貨,從而降低 AI 算力成本。
英偉達CEO黃仁勛近期表示,最近幾個季度面臨供應(yīng)限制的問題正在“改善”。但他也提到,2024年甚至到2025年,GPU依然會“供不應(yīng)求”。
而英偉達競爭對手、英特爾CEO基辛格(Pat Gelsinger)也預(yù)計,今年多個公司對在 AI 芯片上的資金投入會更加謹慎。
如今估值 430 億美元的美國 AI 軟件公司Databricks 聯(lián)合創(chuàng)始人兼CEO阿里·戈德西 (Ali Ghodsi) 甚至直言,隨著明年供需再平衡,英偉達 GPU芯片價格將會大幅下降(暴跌),從而給眾多 AI 科技巨頭和初創(chuàng)公司的商業(yè)模式帶來影響。
“如此瘋狂的稀缺現(xiàn)象在2000年代也發(fā)生過。但正如互聯(lián)網(wǎng)(帶寬)限制在 2000 年代基本消失一樣,GPU 也會發(fā)生同樣的情況,”Ali Ghodsi日前在一場線上會議中表示。
據(jù)悉,Databricks是一家全球領(lǐng)先的“數(shù)據(jù)+AI”公司,于2013年在舊金山成立,該公司由Apache Spark(一個開源集群運算框架,由加州大學伯克利分校AMPLab所開發(fā))初始成員創(chuàng)立,阿里·戈德西是Databricks聯(lián)合創(chuàng)始人兼CEO。
除了在Databricks工作之外,Ali Ghodsi還是加州大學伯克利分校的兼職教授,以及加州大學伯克利分校RiseLab的董事會成員。
截至目前,Databricks已獲得超過36億美元的融資,投資方包括微軟、亞馬遜、a16z、CapitalG、卡塔爾投資局、Sanabil Investments、老虎基金、BlackRock(貝萊德)等37家機構(gòu),公司最新估值達到430億美元——CB Insights獨角獸排名中位列第五位,僅次于字節(jié)跳動、SpaceX、SHEIN、Stripe。
Ali Ghodsi坦言,AI 大模型的核心不僅僅是算力,數(shù)據(jù)也是十分重要的。當資本主義、供給和需求解決了GPU短缺問題,其價格會暴跌,這對于任何過度投入GPU算力支出的人來說,都是一個巨大的挑戰(zhàn)。
“人們想要在模型上投入越來越多的 GPU,對吧?你知道,花十億美元、一萬億美元買一個更大、更大的模型。但您構(gòu)建的模型越大,為其提供服務(wù)的成本就越高,它距離 AI 隨時隨地可用的情況就越來越遠。所以我認為,整個領(lǐng)域都走錯了方向,構(gòu)建更小的模型以及如何智能地制造小模型才是根本。”Ali Ghodsi稱,合成數(shù)據(jù)、模型質(zhì)量、AI 系統(tǒng)都是大模型發(fā)展的關(guān)鍵因素。
Ali Ghodsi表示,如果 OpenAI 停止共享知識產(chǎn)權(quán)(IP),微軟可能會面臨威脅。而他非??春?AI 開源模型的未來發(fā)展,稱其接近最先進的性能。
Ali Ghodsi強調(diào),大型語言模型(LLM)就是一場基于用戶體驗的革命性技術(shù)。
(本文首發(fā)鈦媒體App,作者|Kimi智能助手、林志佳,編輯|林志佳)![]()
Databricks CEO Ali Ghodsi
以下是Ali Ghodsi此次公開會議中進行的對話全文,基于Kimi智能助手進行 AI 中英文翻譯,鈦媒體App進行部分人工修正:
問:生成式 AI 初創(chuàng)公司的機會在哪里?哪些方面做得好,哪些方面做得不好?
Ali Ghodsi:我喜歡用的比喻是,當互聯(lián)網(wǎng)出現(xiàn)時……人們意識到它將擁有的巨大潛力,對各種初創(chuàng)公司投入了大量資金。然后泡沫破裂了。1999年,人們對路由器和網(wǎng)絡(luò)感到興奮,但后來發(fā)現(xiàn)這些對互聯(lián)網(wǎng)來說并不那么有趣,它們變成了一種商品。我認為在基礎(chǔ)模型(如OpenAI的GPT-4)這里也會發(fā)生同樣的事情。隨著時間的推移,這些模型的價值將下降到幾乎以成本價出售。
基礎(chǔ)設(shè)施層面非常有趣,那里將有大量的錢可以賺。你可以將其視為人工智能的亞馬遜網(wǎng)絡(luò)服務(wù)(AWS),是所有 AI 模型公司的基礎(chǔ)設(shè)施提供者。這是我們的主要賭注。應(yīng)用(針對消費者和企業(yè))將具有很大的價值,但我們現(xiàn)在還不清楚具體是什么。
我們在2000年甚至無法預(yù)測,Twitter、Facebook、Airbnb或Uber對于我們生活的重要變革。即使互聯(lián)網(wǎng)爆發(fā)已顯而易見,但很難預(yù)測,如今,它們實際上已成為全球非常有價值的大科技公司。所以問題是,這次會出現(xiàn)哪些公司?
問:人工智能初創(chuàng)公司面臨的最大挑戰(zhàn)是什么?
Ali Ghodsi:一些公司在這場瘋狂的人工智能浪潮之前的兩、三年就獲得了資金。對于那些公司來說,最大的挑戰(zhàn)是收入模式——你賺錢了嗎?一些公司現(xiàn)在可以產(chǎn)生大量的使用量和用戶,但他們能否將這些變現(xiàn)?
挑戰(zhàn)之二是,你如何讓這些東西真正有用?演示可能是人類有史以來最好的演示,但你如何確保它足夠可靠,讓人們每天都可以使用,而且不會出錯?你如何確保大模型擁有最新的信息?
第三個挑戰(zhàn)是隱私、安全和監(jiān)管。那里有很多不確定性,而當互聯(lián)網(wǎng)創(chuàng)建時并沒有這些問題。人們對這些事情的關(guān)注度不如現(xiàn)在。
問:你認為有哪些 AI 公司最后能成為贏家?
Ali Ghodsi:顯然,贏家是微軟。但他們的模型來自O(shè)penAI,所以并不是他們自己的模型。OpenAI會繼續(xù)生產(chǎn)最先進的模型嗎?他們也會向微軟提供模型權(quán)重嗎?或決定模型如何響應(yīng)的設(shè)置?整個事情取決于此。
如果你把你的[知識產(chǎn)權(quán)]交給了全球最大的企業(yè)銷售團隊……這是一個有趣的關(guān)系。我是Perplexity的忠實粉絲,我認為他們真的掌握了用戶體驗。它很快,很敏捷,我每天都使用它。但這些東西還沒有像我們六個月或一年前預(yù)期的那樣改變我們的生活。
挑戰(zhàn)性的問題是,很多初創(chuàng)公司是基于一種奇怪的(囤積)資金或GPU承諾(購買而構(gòu)建)模型開始的,我認為這將為他們未來帶來額外的挑戰(zhàn)。由于這個原因,我們將在未來12個月看到很多“動蕩”。
問:你能深入談?wù)剢?,Ali Ghodsi?
Ali Ghodsi:從過去來看,人們在購買這些GPU并用它們進行比特幣挖礦。然后以太坊決定改變模型,不再需要GPU。但后來發(fā)現(xiàn),OpenAI正在訓練巨大的模型,我們確實需要GPU。然后有一個供應(yīng)商——英偉達……每個人都急于獲取這些GPU。出現(xiàn)了如此瘋狂的稀缺性——而在2000年代,帶寬周圍也有類似的事情。結(jié)果證明,資本主義,供求關(guān)系解決了問題,帶寬的價格大幅下降,帶寬無處不在。同樣的事情也會發(fā)生在GPU上。
那么,對于那些做“GPU洗錢”的初創(chuàng)公司會發(fā)生什么,即他們從大的戰(zhàn)略投資者那里獲得巨額資金,然后從這些提供商那里租用云服務(wù)器,這些公司的估值很高,因為他們必須籌集數(shù)億美元只是為了GPU。
那么,當這些GPU價格下降,而有人對這些GPU有三年的承諾時,會發(fā)生什么?這將對任何在GPU支出方面過度承諾的人構(gòu)成巨大挑戰(zhàn)。
問:在這一點上似乎存在一些分歧,否則我們不會看到Sam Altman說他需要7萬億美元來解決GPU需求瓶頸,那么你反駁的觀點是什么?
Ali Ghodsi:有一些公司——我認為OpenAI和Anthropic——真的相信……精確預(yù)測你的大模型性能的……規(guī)模定律,你投入的GPU和美元越多,它就越好。
但問題一,當你在X軸向右移動時,你需要在硬件上花費指數(shù)級更多的錢,所以數(shù)字很快就會上升。即使這是正確的方法,并且沒有遇到任何障礙,有多少公司需要這樣做?也許只有三四個,對吧?如果隨著模型變得開源,一個這樣的開源模型,意味著沒有人需要在這些GPU上投入預(yù)訓練費用。
第二個問題是,你的LLM變得更聰明并不重要。你希望它對企業(yè)和用戶想要的任務(wù)真正有用。所以很多事情都會很重要——比如,合成數(shù)據(jù)(為訓練新 AI 模型而生成的數(shù)據(jù))、數(shù)據(jù)質(zhì)量、整個系統(tǒng)等。
如果你在做自動駕駛汽車,你不會只訓練最大的LLM。我認為有很多因素在里面,不僅僅是“投入更多的GPU”。
問:今天如果沒有微軟、谷歌、Salesforce或其中一家科技巨頭的支持,生成式 AI 初創(chuàng)公司很難生存。但你提到Databricks與微軟也有密切的關(guān)系。你如何看待初創(chuàng)公司與大公司之間的合作并競爭性“平衡”?初創(chuàng)公司應(yīng)如何處理這些關(guān)系?
Ali Ghodsi:現(xiàn)在,三大云服務(wù)提供商——谷歌、AWS、微軟公司都是Databricks的投資者。在CEO層面,我們與三者的關(guān)系都非常好。然后你下到某些產(chǎn)品團隊,可能會有重疊、有合作競爭。
我認為這將是常態(tài)。我覺得這個領(lǐng)域的任何初創(chuàng)公司都應(yīng)該對此感到舒適(心態(tài)平和)。
我交談過的大多數(shù)創(chuàng)始人,他們都有這種夢想,“我可以創(chuàng)建下一個谷歌”。在這種情況下,我只想說,不要太接近大公司,如果你變得過于親近和依賴……你放棄了很多優(yōu)勢。所以特別是保護你的知識產(chǎn)權(quán)。
所以這是長期與短期的權(quán)衡。如果你想要長期的東西、保持更獨立。如果你想要短期收入,這很好,很多人現(xiàn)在都想要,這是獲得更多風險資本的首要瓶頸。
而從大型云服務(wù)(它們轉(zhuǎn)售來自不同提供商如OpenAI、Anthropic和Cohere的AI模型)獲得收入是有幫助的。
但如果你想建立一個可持續(xù)的公司,你需要有很多客戶,而非大公司的“依賴”。
問:鑒于Apache Spark和你構(gòu)建的一切,以及你為企業(yè)所做的一切,你認為,Databricks的開源大模型能否接近現(xiàn)有的前沿模型性能和體驗,這種滯后會持續(xù)多久?
Ali Ghodsi:我們做了很多研究。我們自己的模型,內(nèi)部模型,做得非常好。每當我們在企業(yè)的具體用例上進行微調(diào)時,它們都能擊敗市場上的所有模型。
當然,我們是在“作弊”。我們使用企業(yè)提供的特定任務(wù)數(shù)據(jù),為該任務(wù)調(diào)整或構(gòu)建一個模型,然后我們一次又一次地擊敗了市場上的所有模型。這是你可以提出的一個論點。但我認為直接回答你的問題,如果你繪制模型在基準測試上的性能,這是我們今天不幸擁有的最好的東西,你看看開源,你看看曲線,它們正在向GPT-4的前沿“收斂”。
為什么是這樣?因為你正在使用整個網(wǎng)絡(luò)和你擁有的所有數(shù)據(jù)集。但每個人都在做這個。也許如果你有其他人沒有的數(shù)據(jù)集,那將是獲得優(yōu)勢的一種方式。
實際上,這就是我們所做的。所以我們做的是,我們收購一家Mosaic公司,他們有非常專業(yè)的數(shù)據(jù)集,我們會在那個數(shù)據(jù)集上從頭開始為他們構(gòu)建一個模型,然后給他們權(quán)重和模型,他們可以保留它。但如果你沒有特殊的數(shù)據(jù)集,你只是在網(wǎng)絡(luò)規(guī)模上進行訓練,那么,這是一個“巨大的工程壯舉”。
這使得大模型有點“商品化”了。
想象一下,如果企業(yè)客戶想要擁有自己的 AI 醫(yī)療垂直模型,需要擁有專注于數(shù)據(jù)集或微調(diào)等技術(shù)的專業(yè)公司,不太可能去用 OpenAI 這類基礎(chǔ)模型提供商。
問:我們已經(jīng)看到一些地方的銷售 AI 模型自動化產(chǎn)品,比如谷歌。而隨著生成性 AI 快速應(yīng)用,五年后你還會有和今天一樣多的軟件工程師、銷售員嗎?AI 是否取代了這些職位?
Ali Ghodsi:我認為在過去一兩年里,人們對 AI 將基本上取代所有軟件工程師、律師、市場營銷人員、醫(yī)生、教育工作者的想法有點極端。因為我們總是需要人類參與其中,而 AI 技術(shù)實際上是在增強人類。
如果你能更容易、更便宜地編寫軟件,那么更多的人更適合編寫軟件,這是一個基本的供求論點——結(jié)果就是會有更多的軟件工程師,而非 AI。
但我認為,未來市場會有變化……當你看具體的細節(jié),比如誰在做工作的哪一部分,它會發(fā)生變化。
現(xiàn)在回答你的特定問題。我沒有盡可能地推動我的軟件工程師,對吧?我有大約2000名員工,我正在盡可能地推動他們使用更多的 AI 編碼助手,其中大約70%的人使用它,而剩下的30%拒絕使用它。因為30%中的一些人的編寫代碼效果是最好的。
我們并沒有因為使用 AI 而減少軟件工程師的招聘。我們的需求仍然比以前多。在銷售方面,也是一樣。我認為,可能很快就會發(fā)生用 AI 自動化替代銷售開發(fā)、客服、發(fā)郵件等領(lǐng)域員工的事件。所以看看,我們的收件箱會發(fā)生什么會很有趣,未來誰會閱讀這些收件箱。是人類還是其他人?
但在企業(yè)銷售方面,我認為不會有大的變化。為什么?因為最終,你如何讓大銀行從你那里購買2000萬、3000萬美元的軟件,這是關(guān)于人際關(guān)系的事情——你必須去見CEO,必須說服 CIO 這是好的技術(shù),必須說服開發(fā)團隊它是安全的。這在很大程度上是關(guān)于人際關(guān)系。所以,這些工作實際上并沒有改變。
如果有什么變化,那么它會變得更加有價值。
問:AI 推理能夠在筆記本電腦等邊緣設(shè)備上完美運行,因此這引發(fā)了OpenAI的一些人所倡導(dǎo)的LLM作為下一個操作系統(tǒng)的想法,它將為許多 AI 設(shè)備提供動力。這也許是為什么Sam Altman在和Jony Ive談?wù)?AI 設(shè)備的原因。你怎么看?
Ali Ghodsi:人們想要投入更多的GPU,對吧?你知道,投入十億美元,投入數(shù)萬億美元,購買更大的模型。但你所構(gòu)建的模型越大,服務(wù)它就越昂貴。而且它離邊緣越遠,比如你的可穿戴設(shè)備等。所以我認為游戲的真正關(guān)鍵在于更小的模型,以及你能讓這些小模型變得多么智能。
我認為整個領(lǐng)域因為谷歌的一篇論文(DeepMind的“chinchilla paper”)走錯了方向,它基本上說這就是你需要投入的最佳金額來獲得一個模型。所以這意味著……我們已經(jīng)投入了小模型的最佳金額,它并不那么智能,所以它是一個相當愚蠢的模型,所以我們得轉(zhuǎn)向更大的模型。
現(xiàn)在很清楚……你可以讓小模型變得越來越智能。所以我認為,我們將看到令人驚嘆的小模型,它們完全可以在邊緣設(shè)備上運行,你甚至不需要專門的硬件來服務(wù)它,你不需要GPU。因為大型語言模型是一場用戶界面革命。我們今天做的所有事情,我有手機,我在手機上打字,我點擊菜單……未來將消失。我們將開始通過說話與很多東西互動,就像我們現(xiàn)在這樣。
![]()
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論