圖片系A(chǔ)I生成

“為解決AI算力供給不足,除了選擇英偉達(dá),我們也可以用CPU芯片實(shí)現(xiàn)AI推理。”國內(nèi)某云計(jì)算大廠基礎(chǔ)設(shè)施負(fù)責(zé)人在年初一次技術(shù)分享會(huì)上表達(dá)。

該負(fù)責(zé)人所指的AI推理芯片市場(chǎng)需求量正逐年增長(zhǎng)。VerifiedMarketResearch報(bào)告顯示,2023年人工智能推理芯片市場(chǎng)規(guī)模為158億美元,預(yù)計(jì)到2030年將達(dá)到906億美元,在2024-2030年預(yù)測(cè)期內(nèi)的復(fù)合年增長(zhǎng)率為22.6%。

今年早些時(shí)候,英偉達(dá)財(cái)報(bào)會(huì)上也有表示,公司全年數(shù)據(jù)中心里已經(jīng)有40%的收入來自推理業(yè)務(wù)。

分析其中緣由,除了邊緣計(jì)算和物聯(lián)網(wǎng)設(shè)備驅(qū)動(dòng)外,更重要的是AI應(yīng)用急劇擴(kuò)張,相較于需要大規(guī)模算力的AI(大模型)訓(xùn)練場(chǎng)景,AI推理對(duì)算力性能要求沒有AI訓(xùn)練嚴(yán)苛,主要是滿足低功耗和實(shí)時(shí)處理的需求。但在部署在實(shí)際終端場(chǎng)景中時(shí),會(huì)需要大量服務(wù)器進(jìn)行并行網(wǎng)絡(luò)計(jì)算,推理成本會(huì)驟然提升。

為此,硬件層面,廠商會(huì)不斷升級(jí)處理器和加速器,從CPU到GPU、FPGA、TPU等,以提高在AI推理方面的性能和能效比。在軟件和算法層面,廠商為大規(guī)模算力集群提供AI訓(xùn)練推理框架、軟件框架,做軟硬適配,同時(shí)在算法層面,如量化、稀疏化、蒸餾、剪枝等手段,從減少模型的計(jì)算復(fù)雜度和內(nèi)存占用入手,以降低推理所需存算空間。

“不可能三角”下的AI推理

一位頭部協(xié)同辦公軟件海外負(fù)責(zé)人在今年6月告訴鈦媒體,谷歌當(dāng)時(shí)將Gemini Nano模型應(yīng)用于Chrome瀏覽器,用于端側(cè)生成式AI實(shí)現(xiàn)。但問題是現(xiàn)在的實(shí)際效果比較堪憂,就是又要推理又要翻譯同時(shí)還要計(jì)算量低,不太現(xiàn)實(shí)。這種在端側(cè)AI技術(shù)上的“不可能三角”,讓該負(fù)責(zé)人所在企業(yè)還在觀望。

與此同時(shí),據(jù)路透社報(bào)道,OpenAI 正在與博通(Broadcom)合作開發(fā)其首款定制 AI 推理芯片,旨在處理其大規(guī)模的AI工作負(fù)載,特別是推理任務(wù)。

這意味著,對(duì)企業(yè)客戶而言,在模型推理或部署階段,需要考慮部署靈活性、性價(jià)比以及低門檻接入方式,這些都決定了企業(yè)TCO(總體擁有成本,Total Cost of Ownership)。Melius Research的分析師Ben Reitzes在給客戶的一份說明中表示:“有看法認(rèn)為,英偉達(dá)未來在推理領(lǐng)域的市場(chǎng)份額將低于訓(xùn)練領(lǐng)域。”

有需求的地方就有市場(chǎng),有市場(chǎng)的地方就有競(jìng)爭(zhēng)。如今,AI推理市場(chǎng)正在被英特爾、AMD、高通等CPU廠商盯上。

以英特爾為例。10月28日,英特爾宣布擴(kuò)容英特爾成都封裝測(cè)試基地,其成都基地?cái)U(kuò)容主要有兩方面:一是新增產(chǎn)能將集中在為服務(wù)器芯片提供封裝測(cè)試服務(wù),以響應(yīng)中國客戶市場(chǎng)需求;二是即將設(shè)立英特爾客戶解決方案中心,推動(dòng)為行業(yè)客戶提供基于英特爾架構(gòu)和產(chǎn)品的定制化方案。更早一個(gè)月,除了很早就預(yù)熱的Gaudi 3 AI加速器,英特爾還升級(jí)至強(qiáng)6處理器,其性能是前代產(chǎn)品的兩倍,可支持邊緣、數(shù)據(jù)中心、云環(huán)境中的AI大模型推理訴求。據(jù)外媒報(bào)道,目前73%的AI服務(wù)器都使用英特爾至強(qiáng)系列作為服務(wù)器機(jī)頭。

鈦媒體注意到,僅在企業(yè)級(jí)應(yīng)用市場(chǎng),中國云廠商、OEM、ODM、ISV等伙伴正密集對(duì)其搭載CPU芯片的通用算力服務(wù)器進(jìn)行升級(jí)。例如,阿里云基于方升架構(gòu)推出最新一代磐久計(jì)算型服務(wù)器,以及第九代阿里云英特爾平臺(tái)企業(yè)級(jí)計(jì)算實(shí)例產(chǎn)品;火山引擎對(duì)其第四代云服務(wù)器實(shí)例進(jìn)行了架構(gòu)和性能優(yōu)化;在基于松耦合開放架構(gòu)設(shè)計(jì)的服務(wù)器計(jì)算模組設(shè)計(jì)規(guī)范(OCM)下,浪潮信息元腦服務(wù)器第八代算力平臺(tái)也于近日正式推出,同時(shí)支持英特爾至強(qiáng)6處理器及AMD EPYC 9005系列處理器。

那么從英特爾等的技術(shù)升級(jí)進(jìn)程上可以理解,相比于昂貴且緊缺的GPU或者適合于小規(guī)模的RTX 4090,CPU處理器的能核能效正逐漸去適應(yīng)AI工作負(fù)載和高密度可擴(kuò)展的融合需求。

CPU用于AI算力背后的幾點(diǎn)變化

“當(dāng)下AI應(yīng)用層出不窮,尤其在產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域,已不單純是需要超大算力的訓(xùn)練場(chǎng)景,一個(gè)新的問題是,很多傳統(tǒng)應(yīng)用也存在一定智能化需求,比如在CRM系統(tǒng)中幫助客戶自動(dòng)識(shí)別線索、幫助銷售自動(dòng)填報(bào)信息。但是,這些AI需求并不見得需要配備AI加速卡去支撐。”浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥對(duì)鈦媒體APP等說道。

趙帥表示:“在AI訓(xùn)練場(chǎng)景中,CPU目前主要參與數(shù)據(jù)預(yù)處理環(huán)節(jié),包括數(shù)據(jù)清洗、格式轉(zhuǎn)換、特征提取等,目前大模型訓(xùn)練所需的數(shù)據(jù)集仍在呈指數(shù)級(jí)增長(zhǎng),需要有更強(qiáng)大的CPU。在AI推理場(chǎng)景,目前主流大模型月活非常高,這意味著AI推理需要同時(shí)處理高并發(fā)任務(wù),對(duì)整個(gè)CPU的資源調(diào)度能力是一個(gè)極其嚴(yán)峻的考驗(yàn)。CPU需要在極短的時(shí)間內(nèi)對(duì)各種任務(wù)進(jìn)行合理分配和調(diào)度,確保每個(gè)任務(wù)都能得到及時(shí)處理和實(shí)時(shí)響應(yīng)。”

在趙帥看來,多模態(tài)模型的出現(xiàn),對(duì)內(nèi)存容量提出了更大要求,以便支持?jǐn)?shù)據(jù)預(yù)處理和存儲(chǔ)。例如多模態(tài)模型LLaMA3.2包含60億圖文和1500小時(shí)的語音數(shù)據(jù),數(shù)據(jù)規(guī)模達(dá)到PB級(jí),相比LLaMA3.1的數(shù)據(jù)量已增加百倍以上。長(zhǎng)本文的出現(xiàn),導(dǎo)致某些先進(jìn)創(chuàng)企已經(jīng)提出要以KVCache為中心的分離架構(gòu)設(shè)計(jì),即根據(jù)不同計(jì)算特性將預(yù)填充服務(wù)器與解碼服務(wù)器分開,在大batch size及隊(duì)列場(chǎng)景下需要更大的系統(tǒng)內(nèi)存帶寬。此外,適配各種加速卡的處理器節(jié)點(diǎn)也面臨算力、內(nèi)存容量、內(nèi)存帶寬、IO擴(kuò)展等多方面的挑戰(zhàn),需要豐富的強(qiáng)大的CPU系統(tǒng)生態(tài)來實(shí)現(xiàn)系統(tǒng)資源的最佳利用。

據(jù)工信部今年9月公布數(shù)據(jù),中國在用算力中心機(jī)架總規(guī)模超過830萬標(biāo)準(zhǔn)機(jī)架,算力總規(guī)模達(dá)246EFLOPS(EFLOPS是指每秒進(jìn)行百億億次浮點(diǎn)運(yùn)算)。據(jù)中國信通院測(cè)算,截至2023年底,全球算力基礎(chǔ)設(shè)施總規(guī)模達(dá)到910EFLOPS,同比增長(zhǎng)40%;其中,美國、中國算力基礎(chǔ)設(shè)施規(guī)模位列前兩名,算力占比分別為32%、26%。

那么問題來了,當(dāng)算力中心仍在如火如荼建設(shè)中時(shí),這種在數(shù)據(jù)、內(nèi)存、算力、帶寬等需求的急劇變化下,算力落地挑戰(zhàn)將在未來被逐一放大。

更重要的是滿足場(chǎng)景需要

以服務(wù)器為例,作為算力的承載體系,正面向更智能、更開放、更綠色的算力體系不斷進(jìn)化。

不同于一年前市場(chǎng)端服務(wù)器采購的需求收緊,服務(wù)器尤其是AI服務(wù)器在大模型應(yīng)用需求的拉動(dòng)下,市場(chǎng)需求開始復(fù)蘇。Gartner數(shù)據(jù)顯示,2024 年第一季度,全球服務(wù)器出貨量同比增長(zhǎng) 5.9%,總出貨量達(dá) 282 萬臺(tái)。本季度供應(yīng)商收入同比增長(zhǎng) 59.9%,AI服務(wù)器需求推動(dòng)平均售價(jià)增長(zhǎng) 51.0%。而在全球服務(wù)器市場(chǎng)強(qiáng)勁增長(zhǎng)的態(tài)勢(shì)中,浪潮信息服務(wù)器出貨量全球第二,中國第一。

  2020-2030全球服務(wù)器市場(chǎng)規(guī)模(按產(chǎn)品劃分)

“我們面向于多場(chǎng)景需求滿足,每款產(chǎn)品都基于具體業(yè)務(wù)場(chǎng)景和客戶真實(shí)收益而來。你會(huì)發(fā)現(xiàn)我們的產(chǎn)品布局相較于其他廠商更為廣泛。這一優(yōu)勢(shì)很大程度上歸功于我們現(xiàn)行的解耦設(shè)計(jì)與開發(fā)模式。”趙帥對(duì)鈦媒體表示。

他指出,從客戶角度,往往面臨各種特定的方案需求場(chǎng)景。通過將部件設(shè)計(jì)成通用的構(gòu)建模塊(CBB),這些模塊經(jīng)過一次測(cè)試和驗(yàn)證后,便能在多個(gè)平臺(tái)上高效應(yīng)用,從而支撐起浪潮信息廣泛的產(chǎn)品布局,這也使得產(chǎn)品在更細(xì)分的場(chǎng)景中能夠發(fā)揮更高價(jià)值。

浪潮信息服務(wù)器產(chǎn)品線規(guī)劃經(jīng)理羅劍告訴鈦媒體,“第八代算力平臺(tái)最核心的技術(shù)攻關(guān),一是提升了軟件方面的智能化水平,比如故障告警的智能化處理水平,通過大模型對(duì)過去歷史故障數(shù)據(jù)進(jìn)行建模,對(duì)關(guān)鍵部件如內(nèi)存、硬盤等可能產(chǎn)生的故障進(jìn)行智能預(yù)判,從而減少客戶計(jì)劃停機(jī)外的業(yè)務(wù)影響;二是計(jì)算模組的解耦,還有內(nèi)存帶寬的提升,破除存儲(chǔ)墻、內(nèi)存墻。尤其是支持更高計(jì)算性能的處理器,會(huì)有大量數(shù)據(jù)吞吐需求,針對(duì)大內(nèi)存帶寬需求,元腦服務(wù)器可配備最高12T內(nèi)存,同時(shí)也可支持內(nèi)存容量和帶寬同步擴(kuò)展的CXL方案,其目的也是釋放計(jì)算性能的最大潛力,避免客戶在內(nèi)存資源上的閑置。”

鈦媒體注意到,目前基于OCM、OAM、CXL、整機(jī)柜標(biāo)準(zhǔn)的開放產(chǎn)品,浪潮信息實(shí)現(xiàn)了在計(jì)算、存儲(chǔ)、I/O擴(kuò)展、整機(jī)柜部署和智算的五種場(chǎng)景化優(yōu)化機(jī)型。除了在硬件層面,浪潮信息此前基于龍蜥社區(qū)開發(fā)的下游商業(yè)版服務(wù)器操作系統(tǒng)KOS進(jìn)行了升級(jí),實(shí)現(xiàn)軟硬協(xié)同優(yōu)化。

此外,過去一個(gè)月內(nèi),不只是浪潮信息,中興通訊、聯(lián)想、新華三等服務(wù)器廠商相繼公布多款算力新品,同樣覆蓋了通用算力、人工智能、液冷、存儲(chǔ)型等多個(gè)用途場(chǎng)景。一位服務(wù)器售前專家與鈦媒體交流時(shí)指出,他們圍繞下游客戶訴求而采取的是earlyship策略,“在還沒有交付時(shí),實(shí)現(xiàn)大批量提前供應(yīng),其優(yōu)勢(shì)在于能保證建設(shè)時(shí)客戶拿到的是真正先進(jìn)的芯片。”

算力多元化時(shí)代,用戶根據(jù)場(chǎng)景來選擇不同的算力單元,滿足不同的計(jì)算需求,服務(wù)器廠商為滿足客戶訴求也不再局限于提供單一算力產(chǎn)品。(本文首發(fā)于鈦媒體APP,作者 | 楊麗,編輯 | 蓋虹達(dá))

本文系作者 TechHorizon 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 有需求的地方就有市場(chǎng),有市場(chǎng)的地方就有競(jìng)爭(zhēng)

    回復(fù) 2024.10.31 · via h5
  • 多模態(tài)模型的出現(xiàn),對(duì)內(nèi)存容量提出了更大要求

    回復(fù) 2024.11.01 · via pc
  • AI算力,不只有英偉達(dá)

    回復(fù) 2024.10.31 · via iphone

快報(bào)

更多

2026-04-01 23:02

國內(nèi)期貨主力合約大面積飄綠,乙二醇、低硫燃料油(LU)跌超4%

2026-04-01 23:01

宜美智向港交所提交上市申請(qǐng)書

2026-04-01 23:00

XREAL向港交所提交上市申請(qǐng)

2026-04-01 22:59

伊朗以色列同時(shí)大規(guī)模互襲

2026-04-01 22:54

波音漲逾5%,連續(xù)2日大漲

2026-04-01 22:54

美國制造業(yè)擴(kuò)張速度創(chuàng)2022年來最高,伊朗戰(zhàn)爭(zhēng)推動(dòng)投入成本躍升

2026-04-01 22:50

美國鋁業(yè)公司股價(jià)短線拉升,一度漲5.2%

2026-04-01 22:40

馬克龍說法國不參與對(duì)伊軍事打擊

2026-04-01 22:37

圣邦微電子再次遞表港交所

2026-04-01 22:36

手機(jī)回收價(jià)出現(xiàn)下跌,舊手機(jī)回收價(jià)一周跌百元

2026-04-01 22:34

美股存儲(chǔ)板塊持續(xù)走高,美光科技漲8.18%

2026-04-01 22:31

美國能源信息署:美國上周原油庫存增加545.1萬桶,遠(yuǎn)高于市場(chǎng)預(yù)期

2026-04-01 22:24

特朗普成為美國歷史首位出席最高法院庭審的在任總統(tǒng)

2026-04-01 22:15

克羅地亞決定釋放儲(chǔ)備柴油

2026-04-01 22:14

俄羅斯表示將繼續(xù)推進(jìn)火箭核發(fā)動(dòng)機(jī)研究

2026-04-01 22:11

Flagship Pioneering與亞馬遜云科技合作,加速藥物發(fā)現(xiàn)與生命科學(xué)創(chuàng)新

2026-04-01 22:08

德國回應(yīng)特朗普“退約”威脅,稱將繼續(xù)支持北約

2026-04-01 22:01

美國3月ISM制造業(yè)指數(shù)為52.7,預(yù)估為52.3

2026-04-01 21:58

伊朗回應(yīng)特朗普停火言論,稱霍爾木茲海峽不對(duì)敵開放

2026-04-01 21:55

美股存儲(chǔ)概念股延續(xù)強(qiáng)勢(shì)上漲,西部數(shù)據(jù)漲超9%

3

掃描下載App