文 | 硅基觀察
10月29日,英偉達(dá)股價大漲,成為全球第一家市值突破5萬億美元的企業(yè)。而在2023年5月30日,英偉達(dá)才剛剛邁入萬億美元市值俱樂部。
英偉達(dá)的爆發(fā),再次證明了“賣鏟人”的價值。引爆這一輪AI行情的大模型公司們普遍尚未盈利,但英偉達(dá)兩年賺了超過1000億美元。
在整個生態(tài)中,英偉達(dá)成為唯一一家賺到巨額實(shí)際利潤的企業(yè),反映出AI產(chǎn)業(yè)鏈并未處于健康狀態(tài)。但各家公司別無選擇,GPU具備處理大量并行計算的能力,天然適合大模型訓(xùn)練和推理。而GPU行業(yè)玩家寥寥,英偉達(dá)在AI計算加速芯片領(lǐng)域處于實(shí)質(zhì)性壟斷地位,2024年全球市場份額超過80%。
這種情況下,問題出現(xiàn)了:英偉達(dá)的壟斷優(yōu)勢能保持多久?市場上何時出現(xiàn)一個足以抗衡英偉達(dá)的挑戰(zhàn)者?
目前來看,除老對手AMD外,市面上存在兩類挑戰(zhàn)者,一類是試圖擺脫英偉達(dá)GPU依賴的國際巨頭,以谷歌為代表;另一類則是面臨美國AI芯片出口制裁困境下,不得不自主研發(fā)AI計算加速芯片的中國企業(yè),包括華為、寒武紀(jì)、摩爾線程、海光信息、壁仞科技等。
這些企業(yè)都不愿意接受被英偉達(dá)“卡脖子”,因此不斷投入資金研發(fā)技術(shù)或扶持競爭勢力。AMD、摩爾線程沿用GPU路線,直接正面硬剛;谷歌、華為等企業(yè)則選擇比GPU效率更高的ASIC路線,雖然難題不少,但潛力巨大。
從技術(shù)和商業(yè)層面來看,毫無疑問,英偉達(dá)很難長期保持壟斷優(yōu)勢,未來行業(yè)內(nèi)必然將出現(xiàn)足以抗衡英偉達(dá)的挑戰(zhàn)者,剩下的只是時間問題。
國際巨頭和國內(nèi)對手,挑戰(zhàn)英偉達(dá)
目前來看,這些挑戰(zhàn)者與英偉達(dá)仍有明顯差距,但潛力也不容小覷。
在這些挑戰(zhàn)者中,AMD是英偉達(dá)的老對手。據(jù)官方數(shù)據(jù),AMD當(dāng)前量產(chǎn)的最新產(chǎn)品MI355X芯片推理性能優(yōu)于英偉達(dá)B200,僅次于英偉達(dá)當(dāng)前最強(qiáng)量產(chǎn)產(chǎn)品B300。
但整體來看,MI355X雖然采用了臺積電的3nm工藝,但并沒有顯著領(lǐng)先4nm的英偉達(dá)B200,同時在軟件生態(tài)、互聯(lián)、數(shù)據(jù)傳輸?shù)阮I(lǐng)域顯著落后于英偉達(dá)。
除AMD外,國內(nèi)外兩類英偉達(dá)的挑戰(zhàn)者,第一類是以谷歌為代表的國際巨頭。
谷歌是AI領(lǐng)域的老牌巨頭,底蘊(yùn)深厚,早在2013年就開始了TPU(Tensor Processing Unit,張量處理單元)的研發(fā),這是一款專為機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)加速設(shè)計的專用集成電路芯片(ASIC),2016年5月首次公開并應(yīng)用于AlphaGo上,目前已經(jīng)迭代至第7代。
今年4月發(fā)布的Ironwood TPU v7,在單芯片F(xiàn)P8算力、內(nèi)存配置、內(nèi)存帶寬等方面已經(jīng)媲美英偉達(dá)B200。同時,超強(qiáng)的規(guī)模擴(kuò)展能力,也被視為谷歌TPU的最大優(yōu)勢。目前,推出Claude模型的Anthropic是谷歌最大的客戶之一。
不過,谷歌TPU目前并不對外出售商品,僅以谷歌云服務(wù)對外出租算力,其生態(tài)體系也有待完善,目前客戶群體遠(yuǎn)不如英偉達(dá)。
除谷歌之外,幾乎所有大型AI公司都在加速自研AI芯片。如OpenAI和xAI一邊大舉購買英偉達(dá)芯片,另一邊推動自研算力芯片進(jìn)展,Meta也被媒體爆出正與博通合作開發(fā)定制芯片。
國內(nèi)則是另一番景象。從2022年開始,美國開始限制對中國的AI芯片出口,之后不斷升級,目前英偉達(dá)H20可以進(jìn)入國內(nèi)市場,但被曝出有“漏洞后門”,存在安全風(fēng)險,未來市場銷售存在較大不確定性,英偉達(dá)算力更高的H100及更高等級的產(chǎn)品仍被禁止進(jìn)入國內(nèi)市場。
在這種情況下,國內(nèi)企業(yè)加速算力替代步伐,形成多條路線,如摩爾線程與英偉達(dá)一樣主打全功能GPU,既支持AI計算加速,也具備圖形渲染、視頻解碼、物理仿真等功能。
目前,摩爾線程是國內(nèi)唯一一家量產(chǎn)的全功能GPU(既能做圖形顯示渲染也能進(jìn)行AI計算加速)企業(yè),在招股書中,摩爾線程表示,其最新的S5000計算加速卡在FP32精度上,算力為32TFlops,這一數(shù)據(jù)接近英偉達(dá)的H20的44TFLOPS。
海光信息、壁仞科技、沐曦股份等企業(yè)則與AMD類似主打GPGPU(省去圖形功能專做AI計算加速),專注執(zhí)行AI計算加速業(yè)務(wù)。華為海思、寒武紀(jì)兩者為非GPU路線,也采用與谷歌一樣的ASIC路線,定制AI計算加速芯片,推出NPU(嵌入式神經(jīng)網(wǎng)絡(luò)處理器)產(chǎn)品。
華為目前量產(chǎn)的昇騰910C,據(jù)媒體報道其推理性能已經(jīng)達(dá)到英偉達(dá)H100的60%。今年8月,據(jù)華為云CEO張平安介紹,華為云服務(wù)生產(chǎn)效率已經(jīng)達(dá)到英偉達(dá)H20芯片的3倍。
寒武紀(jì)是國內(nèi)ASIC路線先行者,其現(xiàn)有的思元590芯片,外界普遍認(rèn)為其性能達(dá)到英偉達(dá)A100的80%。
2024年,國內(nèi)AI計算加速市場,英偉達(dá)排名第一,仍占據(jù)54.4%的市場份額。華為海思份額為21.4%,AMD市場份額為15.3%。
從市場份額來看,華為海思是國內(nèi)AI計算加速芯片龍頭,其他國產(chǎn)AI芯片企業(yè)仍有待突破。在大國競爭的邏輯下,國產(chǎn)算力正在加速發(fā)展,成為替代英偉達(dá)的另一支重要力量。
綜合來看,國內(nèi)外AI計算企業(yè),已經(jīng)形成了抗衡英偉達(dá)的兩條主線,在行業(yè)發(fā)展的迫切需求下,這場挑戰(zhàn)英偉達(dá)的長期戰(zhàn)役已經(jīng)打響。
ASIC技術(shù),或?yàn)榭购庥ミ_(dá)的關(guān)鍵
目前來看,英偉達(dá)的競爭對手距離英偉達(dá)尚有著明顯差距,但從技術(shù)和商業(yè)角度來看,英偉達(dá)的壟斷地位很難長期保持下去。
技術(shù)層面,近年來不斷發(fā)展的大模型以及備受關(guān)注的世界模型,均需對海量數(shù)據(jù)進(jìn)行處理,因此對算力的需求持續(xù)增長。
展望未來,除非有顛覆性的技術(shù)出現(xiàn),AI模型必然也需要面對更多各層面數(shù)據(jù),從而實(shí)現(xiàn)真正的人工智能。這也意味著,AI行業(yè)的算力需求很難停止。
從這個基礎(chǔ)出發(fā),用專門定制的AI計算芯片(即ASIC)替代現(xiàn)有的GPU更符合半導(dǎo)體芯片的迭代邏輯:效率優(yōu)先。
“效率優(yōu)先”的邏輯在半導(dǎo)體行業(yè)歷史悠久,在目前芯片種類中,能效比排序?yàn)锳SIC>FPGA(現(xiàn)場可編程門陣列)>GPU>CPU。在對效率的追求下,行業(yè)應(yīng)用芯片大多遵循上述邏輯進(jìn)行迭代。
眾所周知,人們最早用CPU進(jìn)行圖像渲染,之后為了提升效率,出現(xiàn)了專門用于處理像素點(diǎn)的GPU,更專業(yè)的產(chǎn)品帶來了更強(qiáng)的處理效率。
在此前的比特幣礦機(jī)領(lǐng)域也是如此。人們最早用家用電腦CPU就能挖比特幣,但隨著挖礦難度提升,人們轉(zhuǎn)向效率更高的GPU。
之后,為了進(jìn)一步提升挖礦效率,企業(yè)專門開發(fā)出FPGA。后續(xù)隨著挖礦算法固定,ASIC芯片成為最終選擇。
GPU可以運(yùn)行大量并行計算,通用性和靈活性更強(qiáng)。AI的計算任務(wù)較為單一,ASIC芯片則完全為AI訓(xùn)練和推理定制,計算能力上限更高,具備較強(qiáng)的取代GPU的潛力,這也是谷歌、華為等企業(yè)選擇ASIC路線的原因之一。
目前全球表現(xiàn)最為突出的ASIC芯片即是前文所說的谷歌TPU,其紙面實(shí)力已經(jīng)媲美英偉達(dá)次旗艦產(chǎn)品B200,也被市場認(rèn)為是英偉達(dá)的最強(qiáng)對手。
去年7月底,蘋果公司曾發(fā)布過一篇論文,展示蘋果公司用谷歌TPU芯片訓(xùn)練其AI 模型。消息一出,英偉達(dá)股價暴跌超7%。
除此之外,國內(nèi)華為海思、寒武紀(jì)的NPU,在特定領(lǐng)域上也呈現(xiàn)出了對英偉達(dá)GPU的一定替代作用。
商業(yè)層面的邏輯更為簡單,基于AI行業(yè)對算力的龐大需求將長期存在的預(yù)期,無論從成本還是供應(yīng)鏈安全方面考慮,AI巨頭們必然將持續(xù)推動自研AI芯片或扶持新的AI芯片供應(yīng)商的進(jìn)程,這一點(diǎn)將是毫無疑問的。
目前,英偉達(dá)也在不斷調(diào)整布局以應(yīng)對被替代的風(fēng)險。技術(shù)層面,布局ASIC領(lǐng)域。此前有消息稱,英偉達(dá)已成立ASIC部門,將招募超過1000名芯片設(shè)計、軟件開發(fā)和AI研究人員。
歷史發(fā)展中,英偉達(dá)也曾借鑒谷歌TPU推出了Tensor Core來進(jìn)行矩陣運(yùn)算。在這之后,從Volta、Ampere、Hopper到最新的Blackwell架構(gòu),Tensor Core數(shù)量和尺寸不斷增加,從而帶來了更強(qiáng)的計算能力。
商業(yè)層面,近年來英偉達(dá)進(jìn)行了密集的AI領(lǐng)域投資,投資對象不僅有OpenAI、xAI這些巨頭,也有一些具備潛力的中小型公司,從廣泛的投資布局來綁定下游客戶、押注潛在的技術(shù)路線和發(fā)展方向,強(qiáng)化自身生態(tài)體系,以抵御可能的發(fā)展風(fēng)險。
不過,從任何角度來看,AI行業(yè)都不想要一個處于壟斷地位的英偉達(dá),抗衡英偉達(dá)的挑戰(zhàn)者的出現(xiàn),或許只是時間問題。







快報
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論