阿里達(dá)摩院低調(diào)上線文本生成視頻大模型,已開放試玩
鈦媒體App 3月22日消息,近日,阿里達(dá)摩院低調(diào)地在魔搭社區(qū)(ModelScope)放出了“文本生成視頻大模型”。根據(jù)官方介紹,目前文本生成視頻大模型,由文本特征提取、文本特征到視頻隱空間擴(kuò)散模型、視頻隱空間到視頻視覺空間這3個(gè)子網(wǎng)絡(luò)組成,整體模型參數(shù)約17億。支持英文輸入。擴(kuò)散模型采用Unet3D結(jié)構(gòu),通過從純高斯噪聲視頻中,迭代去噪的過程,實(shí)現(xiàn)視頻生成的功能。
本文內(nèi)容僅供參考,不構(gòu)成投資建議,請謹(jǐn)慎對待。
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論