近日,谷歌在AI技術(shù)領(lǐng)域邁出了重要一步,為Gemini Advanced訂閱用戶(hù)帶來(lái)了其最新的視頻生成AI模型——Veo 2。從本周二起,Gemini Advanced用戶(hù)將能夠在Gemini應(yīng)用程序的模型選項(xiàng)中找到Veo 2,這一創(chuàng)新技術(shù)源自DeepMind,為用戶(hù)提供了前所未有的視頻創(chuàng)作體驗(yàn)。
Veo 2允許用戶(hù)通過(guò)簡(jiǎn)單的文本或圖像提示,生成8秒鐘的視頻片段,分辨率為720p,寬高比為16:9。這一功能不僅為用戶(hù)提供了便捷的視頻創(chuàng)作工具,還拓寬了視頻內(nèi)容的創(chuàng)作邊界。用戶(hù)可以通過(guò)Gemini的分享功能,輕松將這些視頻上傳至TikTok、YouTube等社交平臺(tái),或下載帶有谷歌SynthID水印的MP4文件。然而,谷歌也明確表示,目前該功能對(duì)每月可創(chuàng)建的視頻數(shù)量有所限制,并且暫不支持谷歌Workspace的商業(yè)和教育計(jì)劃。
不僅如此,谷歌還在其Google Labs的實(shí)驗(yàn)性功能Whisk中整合了Veo 2。Whisk原本就允許用戶(hù)使用圖片作為提示詞來(lái)生成新圖片,而此次新增的Whisk Animate功能,更是將用戶(hù)生成的圖片轉(zhuǎn)化為由Veo 2生成的8秒視頻。Google Labs作為谷歌展示早期AI產(chǎn)品的平臺(tái),目前僅對(duì)Google One AI Premium訂閱用戶(hù)開(kāi)放,訂閱費(fèi)用為每月20美元。
谷歌推出Veo 2的舉動(dòng),被外界視為對(duì)OpenAI Sora平臺(tái)的有力回應(yīng)。Sora平臺(tái)以其強(qiáng)大的文本到視頻生成能力而備受矚目,在教育、娛樂(lè)等多個(gè)領(lǐng)域展現(xiàn)出廣泛應(yīng)用前景。例如,Sora可以生成與課程內(nèi)容緊密相關(guān)的視頻,為在線教育提供有力支持。相比之下,Veo 2在功能上雖然相對(duì)基礎(chǔ),但谷歌DeepMind首席執(zhí)行官德米斯·哈薩比斯表示,公司計(jì)劃將Gemini AI模型與Veo相結(jié)合,以提升Gemini對(duì)物理世界的理解能力,這將為Veo 2的未來(lái)發(fā)展帶來(lái)無(wú)限可能。
然而,隨著Veo 2、Sora等視頻生成工具的出現(xiàn),藝術(shù)家和創(chuàng)作者們也開(kāi)始表達(dá)他們的擔(dān)憂(yōu)。這類(lèi)工具的出現(xiàn)可能會(huì)對(duì)整個(gè)創(chuàng)意產(chǎn)業(yè)造成顛覆性影響。據(jù)好萊塢動(dòng)畫(huà)師和漫畫(huà)家工會(huì)委托進(jìn)行的一項(xiàng)研究顯示,到2026年,AI技術(shù)將擾亂美國(guó)超過(guò)10萬(wàn)個(gè)電影、電視和動(dòng)畫(huà)領(lǐng)域的就業(yè)崗位。這一預(yù)測(cè)引發(fā)了廣泛關(guān)注和討論,關(guān)于AI技術(shù)與人類(lèi)創(chuàng)意產(chǎn)業(yè)的未來(lái)關(guān)系,也成為了業(yè)界和學(xué)術(shù)界關(guān)注的熱點(diǎn)話(huà)題。