阿里萬(wàn)相視覺(jué)生成大模型正式開(kāi)源
鈦媒體App 2月25日消息,阿里云旗下視覺(jué)生成基座模型萬(wàn)相2.1(Wan)正式開(kāi)源,此次開(kāi)源采用最寬松的Apache2.0協(xié)議,14B和1.3B兩個(gè)參數(shù)規(guī)格的全部推理代碼和權(quán)重全部開(kāi)源,同時(shí)支持文生視頻和圖生視頻任務(wù)。
據(jù)介紹,14B萬(wàn)相模型在指令遵循、復(fù)雜運(yùn)動(dòng)生成、物理建模、文字視頻生成等方面表現(xiàn)突出,在權(quán)威評(píng)測(cè)集VBench中,萬(wàn)相2.1以總分86.22%的成績(jī)大幅超越Sora、Luma、Pika等國(guó)內(nèi)外模型,穩(wěn)居榜首。1.3B版本測(cè)試結(jié)果超過(guò)了更大尺寸的開(kāi)源模型,甚至還接近部分閉源模型,同時(shí)能在消費(fèi)級(jí)顯卡運(yùn)行,僅需8.2GB顯存就可以生成高質(zhì)量視頻,適用于二次模型開(kāi)發(fā)和學(xué)術(shù)研究。
本文內(nèi)容僅供參考,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論