全球人工智能產(chǎn)業(yè)正高速擴(kuò)張,大模型訓(xùn)練與推理對(duì)計(jì)算資源的需求持續(xù)飆升,專用AI芯片已成為云計(jì)算廠商的核心競爭力。作為行業(yè)頭部企業(yè),谷歌云在4月22日正式推出新一代張量處理單元(TPU),旨在覆蓋AI開發(fā)與運(yùn)行的全流程,進(jìn)一步提升服務(wù)的速度與效率。
這次發(fā)布的TPU系列包含兩個(gè)針對(duì)性版本:TPU 8t主打AI模型訓(xùn)練,專為大規(guī)模分布式訓(xùn)練打造,支持多芯片集群協(xié)同工作,能有效縮短千億參數(shù)級(jí)大語言模型、多模態(tài)生成模型的訓(xùn)練周期;TPU 8i則面向推理場景,重點(diǎn)優(yōu)化低延遲與高吞吐量的平衡,適合智能問答、實(shí)時(shí)圖像識(shí)別等已部署AI服務(wù)的實(shí)時(shí)響應(yīng)需求。
從技術(shù)層面看,雙版本設(shè)計(jì)體現(xiàn)了對(duì)不同場景的精準(zhǔn)適配:TPU 8t采用更高的計(jì)算密度與內(nèi)存帶寬,通過優(yōu)化互連架構(gòu)減少分布式訓(xùn)練中的數(shù)據(jù)傳輸延遲,提升并行計(jì)算效率;TPU 8i則重點(diǎn)優(yōu)化能效比,在降低推理功耗與資源占用的同時(shí),確保實(shí)時(shí)響應(yīng)速度。這種布局能為開發(fā)者提供從模型構(gòu)建到部署的端到端計(jì)算支持。
這次發(fā)布對(duì)行業(yè)而言意義顯著:一方面能鞏固谷歌云在專用AI芯片領(lǐng)域的技術(shù)優(yōu)勢,形成差異化競爭壁壘;另一方面通過場景細(xì)分,幫助企業(yè)降低AI開發(fā)與運(yùn)行成本——訓(xùn)練階段用TPU 8t加速模型迭代,運(yùn)行階段用TPU 8i優(yōu)化資源利用,從而實(shí)現(xiàn)全流程效率的提升。
行業(yè)近期動(dòng)態(tài)顯示,云計(jì)算廠商都在加速AI芯片布局:亞馬遜AWS在2024年3月更新了Graviton4芯片,重點(diǎn)優(yōu)化AI推理性能與能效;微軟Azure則在2024年第一季度加強(qiáng)與英偉達(dá)的合作,推出基于H100 GPU的AI計(jì)算實(shí)例,進(jìn)一步提升服務(wù)能力。當(dāng)前AI基礎(chǔ)設(shè)施競爭已進(jìn)入精細(xì)化、場景化階段,谷歌云這次發(fā)布正是應(yīng)對(duì)這一趨勢的關(guān)鍵舉措。






快報(bào)