谷歌公司近期揭曉了其視頻生成技術的最新力作——Veo 2模型,這一創新成果在模擬現實世界的物理現象、人類動作及面部表情的細膩度上實現了質的飛躍,視頻的整體觀感有了顯著提升。
Veo 2模型具備強大的視頻生成能力,它能夠創造出4K分辨率(4096 x 2160像素)且時長可達2分鐘的視頻內容。與OpenAI的Sora模型相比,Veo 2在分辨率上提升了整整4倍,時長更是達到了前者的6倍之多。然而,值得注意的是,在谷歌的實驗性工具VideoFX中,Veo 2的使用受到了一定限制,分辨率上限為720p,時長也被限制在8秒以內。
Veo 2不僅能夠根據文本提示生成視頻,還能結合文本與參考圖像,更逼真地模擬運動軌跡、流體動力學效應以及光線變化,為視頻創作者打開了前所未有的創意空間。為了應對潛在的濫用問題,谷歌引入了名為SynthID的專有水印技術,該技術能在Veo 2生成的每一幀視頻中嵌入難以察覺的標記,以便有效識別出由AI生成的內容。
據DeepMind產品副總裁Eli Collins透露,團隊正積極收集用戶反饋,并計劃在未來數月內對Veo 2模型進行持續的優化與迭代。目前,Veo 2模型尚處于測試階段,僅向部分用戶開放。在此期間,用戶仍可在Vertex AI平臺上繼續使用原始的Veo模型。谷歌方面表示,盡管Veo 2在減少錯誤方面已取得顯著進步,但仍需進一步完善以達到最佳效果。