【沃資訊】3月1日消息,近日彭博社對OpenAI的視頻生成模型Sora進行了一次測試,結果卻出現了一些不如人意的情況。
據報道,彭博社給OpenAI提供了一系列提示詞,要求其使用Sora模型生成相應的視頻場景。然而,在生成的視頻中,卻出現了多處不符合現實場景的動作和物體變形等問題。例如,在一段僅有10秒的視頻中,一只鸚鵡在飛過猴子時翅膀會扭曲,而且視頻中出現了多只鸚鵡,與提示語中的“一只鸚鵡”不符。此外,猴子的臀部似乎還出現了一條鸚鵡的尾巴,讓整個場景顯得非常詭異。
針對這些問題,OpenAI研究科學家Bill Peebles也承認了Sora模型在生成視頻時存在一些奇怪的動作和物體相互穿過等問題。這些問題反映了Sora模型在理解和呈現物體的物理特性方面還存在一定的不足。
據沃資訊了解,Sora模型是一款文本轉視頻模型,采用了Diffusion transformer技術。它將視頻內容分解成一系列patch(視覺編碼塊),并通過去噪技術從帶有噪聲的patch中預測出清晰的原始圖像信息,最終合成為連貫的視頻。雖然Sora模型在某些方面表現出色,但在復雜場景下仍會出現一些問題,如物理交互的準確性、對象狀態變化的一致性等方面還有待提高。
此次測試的結果表明,Sora模型雖然在視頻生成方面取得了一定的進展,但仍面臨著一系列技術挑戰和局限性。OpenAI表示,他們將繼續努力改進Sora模型,提高其生成視頻的質量和準確性。對于推新飛快的OpenAI來說,解決這些問題應該不會太久。