圖片系A(chǔ)I生成
以大模型為代表的AI技術(shù),正在重構(gòu)云計(jì)算,不僅局限在算力層。
大模型需要巨大的計(jì)算資源來(lái)進(jìn)行訓(xùn)練和推理,算力需求指數(shù)級(jí)增長(zhǎng)增加,但云計(jì)算是一個(gè)工程和生態(tài)體系,做智算云不能只做算力,與之相關(guān)聯(lián)的軟硬件技術(shù)棧都需要做一次升級(jí),商業(yè)和產(chǎn)業(yè)邏輯也處于動(dòng)態(tài)變化中。
中國(guó)工程院院士鄭緯民針對(duì)國(guó)內(nèi)云計(jì)算與算力產(chǎn)業(yè)提出四點(diǎn)建議,一是面向國(guó)產(chǎn)算力,建立完善的軟硬協(xié)同生態(tài);二是面向算力互聯(lián),形成算力聯(lián)網(wǎng)統(tǒng)一調(diào)度;三是面向算力互通,構(gòu)建統(tǒng)一的編程框架和編譯軟件;四是加強(qiáng)云計(jì)算領(lǐng)域軟硬件的自主創(chuàng)新能力。
對(duì)于天翼云來(lái)說(shuō),其“國(guó)云”定位也有多重要求。中國(guó)電信董事長(zhǎng)柯瑞文表示,國(guó)云的發(fā)展已經(jīng)走出了一條符合自身特點(diǎn)的道路。從中國(guó)電信的實(shí)踐來(lái)看,既要把握趨勢(shì)也要結(jié)合實(shí)際,趨勢(shì)指云計(jì)算和人工智能的發(fā)展方向,結(jié)合實(shí)際則是指中國(guó)電信的主責(zé)主業(yè)、資源稟賦、隊(duì)伍結(jié)構(gòu)和使命責(zé)任。
在數(shù)字中國(guó)峰會(huì)期間,中國(guó)電信天翼云宣布,2024年年底智算規(guī)模將達(dá)到21EFLOPS,上海的萬(wàn)卡集群已經(jīng)建成投產(chǎn),北京的萬(wàn)卡集群也將在6月份上線。同時(shí)天翼云發(fā)布了智算云體系,涵蓋算力、平臺(tái)、數(shù)據(jù)、模型、應(yīng)用等方面,并且強(qiáng)調(diào)自主創(chuàng)新的重要性。
值得一提的是,本次大會(huì)上國(guó)資監(jiān)管云中央節(jié)點(diǎn)暨國(guó)資央企智算云調(diào)度管理平臺(tái)正式上線。以中國(guó)電信京津冀智能算力中心為基礎(chǔ),輻射全國(guó),支持國(guó)資監(jiān)管各類應(yīng)用系統(tǒng)全面上云和智能化升級(jí),由天翼云作為主要支持廠商。
“每一家AI獨(dú)角獸的背后都能看到頭部云廠商的身影。Ai是由算力、平臺(tái)、數(shù)據(jù)、模型、安全、應(yīng)用,還有終端等要素組成的復(fù)雜產(chǎn)業(yè)鏈,所謂云智一體,云絕對(duì)不僅僅是底座,而是發(fā)揮成長(zhǎng)賦能加速的全鏈條帶動(dòng)作用。“中國(guó)電信集團(tuán)有限公司總經(jīng)理助理,天翼云科技有限公司董事長(zhǎng)、總經(jīng)理胡志強(qiáng)表示。
![]()
拆解來(lái)看,承載是指云可以提供豐富的算力資源;賦能是指為AI從業(yè)人員提供工具、數(shù)據(jù)、模型、環(huán)境等平臺(tái)化的能力;加速是助力AI的商業(yè)化落地。目前來(lái)看,頭部云服務(wù)商更有能力拉通產(chǎn)業(yè)鏈各個(gè)環(huán)節(jié),推動(dòng)大模型產(chǎn)業(yè)鏈的商業(yè)閉環(huán)。
當(dāng)前智算云體系仍有不少問(wèn)題待解決,首先是算力的高質(zhì)量供給,也是產(chǎn)業(yè)當(dāng)前面臨的最大問(wèn)題。一方面,業(yè)內(nèi)是已經(jīng)出現(xiàn)了多個(gè)萬(wàn)億級(jí)參數(shù)的基礎(chǔ)模型,10萬(wàn)億參數(shù)模型也即將出現(xiàn),面對(duì)指數(shù)級(jí)的算力需求,需要單集群超大規(guī)模的算力供給。
另一方面,大模型訓(xùn)推一體,要求高端和低端算力在同一個(gè)資源池部署,對(duì)異構(gòu)算力管理和資源調(diào)度能力提出了很高的要求。
其次是基于云平臺(tái)能力實(shí)現(xiàn)跨層協(xié)同和優(yōu)化。Ai大模型技術(shù)棧非常復(fù)雜,萬(wàn)億參數(shù)以上的模型訓(xùn)練必須要從云側(cè)的基礎(chǔ)設(shè)施、資源調(diào)度以及AI側(cè)的訓(xùn)練框架、推理框架、模型算法、向量數(shù)據(jù)庫(kù)等多個(gè)維度進(jìn)行跨層級(jí)協(xié)同與優(yōu)化,并形成平臺(tái)化的服務(wù)能力。
第三是解決兼容性問(wèn)題,推進(jìn)國(guó)產(chǎn)算力規(guī)模應(yīng)用。目前國(guó)內(nèi)外AI芯片設(shè)計(jì)的差異性,以及軟件棧的不同,跨生態(tài)遷移難度較大,必須要加速開(kāi)發(fā)端到端的工具鏈,并通過(guò)算子優(yōu)化、并行加速等技術(shù)來(lái)解決算效問(wèn)題,實(shí)現(xiàn)國(guó)產(chǎn)算力從可用到好用。
安全體系和治理體系也需要與時(shí)俱進(jìn),在訓(xùn)練推理和傳輸過(guò)程中,海量數(shù)據(jù)的安全和隱私保護(hù)問(wèn)題面臨更為嚴(yán)峻的挑戰(zhàn),同時(shí)大模型的復(fù)雜結(jié)構(gòu)和黑箱機(jī)制也帶來(lái)了內(nèi)容安全領(lǐng)域的新挑戰(zhàn)。
此外,AI應(yīng)用創(chuàng)新的重心正在向端側(cè)轉(zhuǎn)移,但無(wú)論是PC、手機(jī)還是XR設(shè)備,在算力、功耗、交互等各個(gè)方面,都還沒(méi)有辦法完全實(shí)現(xiàn)和云側(cè)媲美,因此云端一體已經(jīng)成為了AI終端廠商的優(yōu)選解決方案。
最后是產(chǎn)業(yè)生態(tài)的深度協(xié)同,大模型層出不窮,但是站在產(chǎn)業(yè)發(fā)展的角度,在技術(shù)共研、數(shù)據(jù)共享,業(yè)務(wù)場(chǎng)景等方面共創(chuàng),才能推動(dòng)整個(gè)產(chǎn)業(yè)鏈的健康發(fā)展。
柯瑞文表示,天翼云作為國(guó)云的框架從基本成型到全面成型,“息壤”“云驍”“慧聚”三大平臺(tái)的建成標(biāo)志著天翼云作為國(guó)家云已經(jīng)越過(guò)向智能云發(fā)展的拐點(diǎn),進(jìn)入了新的發(fā)展階段。國(guó)云的發(fā)展已經(jīng)走出了一條符合自身特點(diǎn)的道路。
天翼云做智算云的自身特點(diǎn)可以概括為兩點(diǎn),云網(wǎng)融合和自主創(chuàng)新,其智算云體系由算力基礎(chǔ)設(shè)施、智算平臺(tái)能力、星辰大模型能力、數(shù)據(jù)要素能力等組成。
一是在智算平臺(tái)能力方面,通過(guò)“息壤”“云驍”“慧聚”平臺(tái)升級(jí),不斷提升算力調(diào)度能力、集群加速能力和多模型服務(wù)能力,提供自主可控智算服務(wù),滿足大模型訓(xùn)練及推理需求。
一體化計(jì)算加速平臺(tái)“云驍”,具備超大規(guī)模集群管理、運(yùn)營(yíng)和算力加速能力,可提供通智超一體化服務(wù),集“異構(gòu)計(jì)算+高速存儲(chǔ)+無(wú)損網(wǎng)絡(luò)+算力加速+高效運(yùn)營(yíng)”于一體;一站式智算服務(wù)平臺(tái)“慧聚”,是為大模型訓(xùn)練、推理、應(yīng)用提供全棧工具鏈的智算服務(wù)平臺(tái),構(gòu)建了模型訓(xùn)練、模型推理、運(yùn)營(yíng)運(yùn)維、生態(tài)平臺(tái)、智算容器、AI框架六大功能模塊;算力分發(fā)網(wǎng)絡(luò)平臺(tái)“息壤”,天翼云攻克了算力插件、算力網(wǎng)關(guān)、算數(shù)協(xié)同等一系列關(guān)鍵技術(shù),支持第三方算力與天翼云自有算力并網(wǎng)。
二是在星辰大模型能力方面,基于“通用大模型、行業(yè)大模型、垂直應(yīng)用大模型”技術(shù)迭代,持續(xù)完善大模型能力,提升語(yǔ)言、視覺(jué)和多模態(tài)大模型的認(rèn)知水平和推理性能。
三是在數(shù)據(jù)要素能力方面,通過(guò)“星海”“靈澤”“銀河”平臺(tái)升級(jí),不斷提升企業(yè)內(nèi)部數(shù)據(jù)、政府公共數(shù)據(jù)、跨境數(shù)據(jù)等數(shù)據(jù)要素的治理、流通和應(yīng)用創(chuàng)新能力,全面確保安全可靠。
四是生態(tài)合作,中國(guó)電信在研發(fā)開(kāi)源、應(yīng)用場(chǎng)景、數(shù)據(jù)要素、銷售渠道等,與合作伙伴實(shí)現(xiàn)資源共享。
據(jù)了解,中國(guó)電信下一步將在自研AI框架、算子加速庫(kù),推進(jìn)大規(guī)模GPU集群算子與國(guó)產(chǎn)芯片加速框架適配方面做更多技術(shù)工作,同時(shí)今年將在云、大數(shù)據(jù)、人工智能三大領(lǐng)域以及新型工業(yè)化與智慧城市兩大重點(diǎn)應(yīng)用領(lǐng)域,新開(kāi)放超300個(gè)場(chǎng)景,與產(chǎn)業(yè)伙伴打造繁榮生態(tài)。
(本文首發(fā)于鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達(dá))
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論