智譜技術(shù)團(tuán)隊(duì)近日宣布,已推出并開放源代碼的最新版視頻模型——CogVideoX v1.5,迎來了重大升級。這款新型模型在視頻生成性能上有了顯著提升,能夠輕松產(chǎn)出高質(zhì)量短片。
據(jù)悉,CogVideoX v1.5不僅能生成5至10秒長、768P分辨率、每秒16幀的流暢視頻,更在I2V模型上支持了多種尺寸比例。這一改進(jìn)顯著提升了圖像轉(zhuǎn)視頻的質(zhì)量,同時增強(qiáng)了模型對復(fù)雜語義的理解能力。
新版模型還將登陸“清影”平臺,并與新發(fā)布的CogSound音效模型攜手合作。這一組合將為用戶帶來更加豐富的視聽體驗(yàn),標(biāo)志著AI視頻生成技術(shù)邁入了新的階段。
升級后的“清影”平臺展現(xiàn)了多項(xiàng)引人注目的新特性。在質(zhì)量方面,無論是圖像轉(zhuǎn)視頻的美學(xué)表現(xiàn),還是運(yùn)動合理性,乃至對復(fù)雜提示詞語義的理解,都得到了大幅度的增強(qiáng)。
平臺現(xiàn)在還支持生成長達(dá)10秒、4K分辨率、60幀的超高清視頻,為用戶帶來了前所未有的視覺盛宴。同時,為了滿足不同播放場景的需求,“清影”還提供了可變比例的視頻生成功能。
在創(chuàng)作效率方面,“清影”同樣表現(xiàn)出色。同一指令或圖片現(xiàn)在可以一次性生成4個視頻,極大地提升了創(chuàng)作者的工作效率。更為驚艷的是,新平臺還能為視頻匹配生動的音效,讓每一部作品都更加栩栩如生。