隨著人工智能加速步入千行百業(yè)、落地深水區(qū),如何真正“用好”而非僅僅“擁有”算力,正成為企業(yè)解鎖AI業(yè)務(wù)價(jià)值的關(guān)鍵瓶頸——高昂成本資源錯(cuò)配的“陷阱”之下,專業(yè)化、價(jià)值導(dǎo)向的算力服務(wù)需求日益凸顯。??

在不久前的2025世界人工智能大會(huì)(WAIC)上,這股轉(zhuǎn)型浪潮尤為明顯。展館一層,華為昇騰384超節(jié)點(diǎn)“算力核彈”真機(jī)坐鎮(zhèn),為應(yīng)用提供底座能力的AI芯片、服務(wù)器、智算中心也密集亮相。而硬件的“繁榮”背后,筆者在現(xiàn)場(chǎng)見到的北京超級(jí)云計(jì)算中心(以下簡稱“北京超算”)總經(jīng)理吳迪,卻道出了一個(gè)更加深刻的行業(yè)變化邏輯。

“北京超算用14年時(shí)間,驗(yàn)證了超算中心商業(yè)化路徑的可行性。”吳迪介紹到。作為專注高性能計(jì)算領(lǐng)域15年的中國計(jì)算機(jī)學(xué)會(huì)理事,她也從個(gè)人視角向筆者介紹了本屆大會(huì)的深層變化:今年WAIC產(chǎn)業(yè)鏈上下游完備度顯著提升垂直領(lǐng)域企業(yè)密集入場(chǎng),垂類大模型呈現(xiàn)爆發(fā)態(tài)勢(shì)。這一切,都在倒逼算力服務(wù)市場(chǎng)的邏輯重構(gòu)。

算力服務(wù)市場(chǎng)固有的“需求牽引”特性在當(dāng)下格外突出。垂類場(chǎng)景爆發(fā),正促使企業(yè)開始用最終的業(yè)務(wù)結(jié)果而非FLOPS數(shù)值來丈量算力價(jià)值。落地到具體實(shí)踐中,衡量標(biāo)準(zhǔn)則回歸“成本”與“質(zhì)量”?,它們構(gòu)成了當(dāng)下企業(yè)評(píng)估算力服務(wù)價(jià)值的核心標(biāo)尺。

“純算力本身并不會(huì)產(chǎn)生價(jià)值”

垂直領(lǐng)域模型密集落地背后,是算力正從訓(xùn)練向應(yīng)用場(chǎng)景擴(kuò)散。據(jù)麥肯錫2024年6月報(bào)告,44%的中國企業(yè)已進(jìn)入大模型測(cè)試或試點(diǎn)階段;IDC同期調(diào)研亦顯示,約42%企業(yè)正推進(jìn)大模型概念驗(yàn)證(PoC)。與此同時(shí),不免回顧起近兩年的中國算力市場(chǎng)變化,吳迪印象最為深刻的則是作為導(dǎo)火索的“供需關(guān)系”。

2022年底,ChatGPT的發(fā)布引爆全球AI熱潮,在需求端,大模型競賽推動(dòng)算力“軍備賽”,BAT、字節(jié)等中國互聯(lián)網(wǎng)巨頭及百川智能、中科聞歌等創(chuàng)業(yè)公司均密集啟動(dòng)大模型項(xiàng)目,算力需求一度呈“十倍級(jí)增長”。而除訓(xùn)練外,大模型落地應(yīng)用催生推理算力需求,游戲、金融、醫(yī)療等行業(yè)加速AI化,進(jìn)一步推高算力消耗。

反觀當(dāng)時(shí)的供給端,芯片禁令與產(chǎn)能瓶頸產(chǎn)生雙重夾擊,國產(chǎn)替代也尚處爬坡期,加劇市場(chǎng)供不應(yīng)求狀態(tài),由此引起的算力價(jià)格飆升甚至倒逼了“恐慌性采購”等市場(chǎng)扭曲行為。2023年左右,中國算力市場(chǎng)出現(xiàn)的“供不應(yīng)求、搶購為先”現(xiàn)象,是多重因素疊加作用的結(jié)果。

那時(shí)的企業(yè)秉持著‘能用就行’的態(tài)度搶抓算力,很少有企業(yè)會(huì)關(guān)注算力服務(wù)。但純算力本身并不會(huì)產(chǎn)生價(jià)值,它最終還是要延伸到服務(wù)層來。”吳迪直言,算力其實(shí)具備一定的“工具屬性”。

簡單來講,若算力是“原材料”,那么服務(wù)就是“加工廠”。英偉達(dá)H100顯卡的原始算力達(dá)1979 TFLOPS,但若僅堆砌硬件而不結(jié)合CUDA優(yōu)化、分布式調(diào)度框架(如NCCL),其實(shí)際訓(xùn)練效率可能不足理論值的30%。但疊加服務(wù)層,通過算法優(yōu)化、任務(wù)編排、故障自愈等能力,就可以將裸算力轉(zhuǎn)化為可用、穩(wěn)定、高性價(jià)比的AI生產(chǎn)力。

如今算力市場(chǎng)也走向內(nèi)卷,據(jù)吳迪觀察,企業(yè)對(duì)算力的要求從“可用”轉(zhuǎn)向“好用”。雖不排除有大型企業(yè)愿意花一些時(shí)間自己搭建服務(wù),但有這種能力的企業(yè)僅僅是少數(shù),對(duì)于常規(guī)企業(yè)用戶來說,最終還是要走到算力服務(wù)這一側(cè)。

“我們服務(wù)的客戶包括研究所,他們的主要任務(wù)是做科研成果的創(chuàng)新,它需要更多關(guān)注自己本身的業(yè)務(wù),怎么把模型做的更快發(fā)布、更好用?那么底層的算力只是一個(gè)手段、一個(gè)工具,他們只需要考慮誰能提供一個(gè)既可用又好用的工具。”吳迪進(jìn)一步舉例。

算力模式走向“價(jià)值服務(wù)”

怎樣才算好用的算力?對(duì)于企業(yè)來說,其關(guān)心的則是最單純的“成本”與“質(zhì)量”問題,二者相互影響,構(gòu)成了企業(yè)衡量算力服務(wù)價(jià)值的核心標(biāo)的。

然而目前,一個(gè)不容忽視的現(xiàn)象是,許多企業(yè)在衡量算力成本方面還存在認(rèn)識(shí)誤區(qū)。并行科技AI云事業(yè)部總經(jīng)理趙鴻冰指出,“利用率”是企業(yè)衡量算力建設(shè)成本的一個(gè)關(guān)鍵指標(biāo)。

“許多企業(yè)自己在進(jìn)行算力建設(shè)時(shí)往往是按照100%的利用率去算的,但實(shí)際使用狀況并不樂觀。”據(jù)趙鴻冰觀察:“并行科技在2015年左右的時(shí)候曾推出一個(gè)叫OITS(在線IT服務(wù))的業(yè)務(wù),那時(shí)我們服務(wù)了全國300多套大中小級(jí)別的集群,但反觀這幾年服務(wù)的結(jié)果,這些集群平均的利用率不到30%,甚至有些非常低的只有百分之十幾的利用率,用100%的利用率指標(biāo)和實(shí)際利用率進(jìn)行換算,其實(shí)成本至少差著大約一個(gè)數(shù)量級(jí)。”

除此之外,市場(chǎng)上還存在大量“資源錯(cuò)配”情形,資金充裕的企業(yè)盲目囤積高端芯片卻業(yè)務(wù)簡單,導(dǎo)致資源嚴(yán)重浪費(fèi);而資金有限的企業(yè)又因貪圖便宜采購低性能算力,最終拖累業(yè)務(wù)效率。

這些情況都反應(yīng)了當(dāng)下企業(yè)獲取算力時(shí)的“踩雷點(diǎn)”:即對(duì)自身業(yè)務(wù)狀況與業(yè)界狀態(tài)缺乏清晰的認(rèn)知,并未找到真實(shí)的業(yè)務(wù)需求進(jìn)行算力匹配。

算力服務(wù)市場(chǎng)是很典型的“需求牽引”市場(chǎng),如今,垂類場(chǎng)景爆發(fā)也在重構(gòu)算力服務(wù)市場(chǎng)邏輯:越來越多的企業(yè)開始用業(yè)務(wù)結(jié)果而非TFLOPS數(shù)值丈量算力價(jià)值。為了盡可能避免不合理的設(shè)計(jì)與資源浪費(fèi),類似“專家服務(wù)”的算力服務(wù)模式應(yīng)運(yùn)而生。

據(jù)吳迪介紹,為解決這一問題,北京超算拆解完整的專家服務(wù)工作流程,第一步就是進(jìn)行企業(yè)需求診斷與深度的業(yè)務(wù)交流,再根據(jù)不同業(yè)務(wù)場(chǎng)景推進(jìn)資源選型與架構(gòu)設(shè)計(jì)。“合理的選型是質(zhì)量保障的第一步,如果選型出錯(cuò),后面一系列的事情花多少時(shí)間效率都會(huì)比較差。”吳迪強(qiáng)調(diào)道。

以PixArt AI模型為例,北京超算運(yùn)用了應(yīng)用運(yùn)行特征分析的方法,了解程序在業(yè)務(wù)場(chǎng)景下算力集群各個(gè)算力組件的性能發(fā)揮情況,同時(shí)定位性能關(guān)鍵指標(biāo)與性能依賴,幫助企業(yè)實(shí)現(xiàn)算力資源的精準(zhǔn)選型。據(jù)北京超算CTO甄亞楠介紹,為持續(xù)降低企業(yè)的業(yè)務(wù)成本,北京超算目前也已整合北京懷柔、寧夏中衛(wèi)、內(nèi)蒙古和林格爾等國家“東數(shù)西算”節(jié)點(diǎn)的算力資源,以提供彈性、穩(wěn)定且高效的算力服務(wù)。

在選型完成之后,企業(yè)還需要有安全穩(wěn)定可靠的基礎(chǔ)服務(wù)的保障。包括對(duì)業(yè)務(wù)運(yùn)行過程的實(shí)時(shí)監(jiān)控與數(shù)據(jù)分析,以及時(shí)定位算力瓶頸,進(jìn)行部署優(yōu)化與性能調(diào)優(yōu),提升模型運(yùn)行效率;此外,還要有針對(duì)突發(fā)問題的及時(shí)響應(yīng),對(duì)問題嚴(yán)重性進(jìn)行分層級(jí)處理,提供專家部署支持和動(dòng)態(tài)擴(kuò)容機(jī)制。

不過依據(jù)每個(gè)企業(yè)自身狀況,趙鴻冰也提出建議,企業(yè)自己搭建服務(wù)并非不可取,算力服務(wù)的發(fā)展也并不一定要求所有企業(yè)都到公有云上來,企業(yè)還是要結(jié)合自己的業(yè)務(wù)情況合理配置。比如業(yè)務(wù)達(dá)到了一定的規(guī)模時(shí),會(huì)拉低算力建設(shè)各個(gè)方面的邊際成本,企業(yè)就可以根據(jù)自身業(yè)務(wù)體量設(shè)置出一些基本的算力來保障日常業(yè)務(wù);當(dāng)有突發(fā)算力需求時(shí),再結(jié)合到公有云上來,形成一種混合云的形態(tài)。這樣能更好的滿足企業(yè)的業(yè)務(wù)需求,更好的實(shí)現(xiàn)降本。(本文首發(fā)鈦媒體APP 作者 | 賈雨微)

本文系作者 散落拾獲 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

10:52

現(xiàn)貨黃金向上觸及4700美元

10:52

奢侈品股跌至2022年以來最低,受需求擔(dān)憂加劇影響

10:48

中央決定:姚來英任國家煙草專賣局黨組書記

10:47

美登月版圖巨變,NASA擬讓SpaceX替代波音核心職能

10:44

體育概念震蕩拉升,共創(chuàng)草坪漲停

10:43

小米汽車:新一代SU7“準(zhǔn)現(xiàn)車”鎖單后預(yù)計(jì)1—5周即可交付

10:42

壓力大會(huì)加重皮炎,中國科學(xué)家首次發(fā)現(xiàn)科學(xué)證據(jù)

10:41

高盛擬4月啟動(dòng)績效裁員,規(guī)?;?yàn)?%-3%

10:38

今日MMLC電池級(jí)碳酸鋰(早盤)價(jià)格較昨日上漲50元/噸

10:36

世貿(mào)組織:中東沖突或拖累全球貿(mào)易增長前景

10:35

消息稱英特爾本月底CPU漲價(jià)10%

10:34

籌資1000億美元,亞馬遜貝索斯擬設(shè)立基金收購制造企業(yè)并引入AI

10:29

工信部部長李樂成調(diào)研信息技術(shù)創(chuàng)新應(yīng)用和未來產(chǎn)業(yè)發(fā)展研究工作

10:28

滬深兩市成交額突破1萬億,較上一日此時(shí)放量超400億

10:27

美國批準(zhǔn)部分俄羅斯原油的交付與銷售

10:24

預(yù)測(cè)市場(chǎng)Kalshi完成新一輪超10億美元融資,估值達(dá)220億美元

10:22

德國汽車半導(dǎo)體公司Elmos考慮出售,市值23億歐元

10:22

章源鎢業(yè)上調(diào)3月下半月長單采購報(bào)價(jià)

10:21

太空光伏概念震蕩走強(qiáng),拉普拉斯?jié)q近10%

10:20

聯(lián)邦快遞第三財(cái)季業(yè)績和展望均超預(yù)期,盤后股價(jià)大漲逾9%

掃描下載App