鈦媒體App 3月31日消息,
中信證券研報(bào)稱,AI從“簡單對(duì)話”向“智能體(Agent)”演進(jìn),驅(qū)動(dòng)上下文長度激增。據(jù)Epoch AI數(shù)據(jù),最長上下文窗口約每年增長30x,KV Cache顯存容量和上下文長度呈線性增長關(guān)系,遠(yuǎn)超硬件配置增速。目前大模型廠商、硬件廠商主要通過量化、分層存儲(chǔ)、模型架構(gòu)優(yōu)化的方式解決存力瓶頸,但仍不改顯存需求爆發(fā)。
中信證券認(rèn)為,顯存優(yōu)化有望降低單Token生成成本,進(jìn)而刺激用戶開啟更高并發(fā)與更長上下文,總存力需求將不減反增,存力升級(jí)為當(dāng)前Agent推理核心需求,堅(jiān)定看好存儲(chǔ)成長趨勢。(廣角觀察)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論