MiniMax上線圖生視頻功能,實測:輸入白貓生成黑貓

10月10日,大模型初創企業MiniMax官宣視頻模型上線圖生視頻功能,南都記者實測發現,目前向該視頻模型輸入一張圖片,能生成一段長達6秒的視頻。不久前的9月2日,MiniMax發佈了視頻模型abab-video-1。MiniMax還透露,在過去的一個月內,其大模型創意平臺海螺AI網頁版訪問量增速超800%,登上AI產品榜(web)9月全球增速榜、國內增速榜雙榜單TOP 1。

南都記者以“兩隻貓在廚房,左邊的貓在包餃子,右邊的貓在切韭菜,鏡頭聚焦到包餃子的貓手上,它包得特別快”爲提示詞,向視頻模型中輸入一張有兩隻白貓的原始照片。

實測發現,MiniMax視頻模型能實現上傳的圖片,也能理解輸入的提示詞。輸出的視頻裡,畫面中出現了兩隻貓,一隻在包餃子,一隻在邊包餃子邊切韭菜。不過,雖然MiniMax視頻模型基本完成了視頻輸出的主要任務,也基本做到了轉場、鏡頭切換和聚焦,但在南都記者實測中,輸入圖片中的貓和生成視頻中的貓並不完全一致,圖片中的兩隻白貓在視頻中變成了兩隻黑貓。

實測視頻↓↓

MiniMax還表示,海螺AI視頻同步上線了提示詞優化功能。開啓時,模型會自動優化用戶的提示詞,以提升視頻生成質量。

此前南都記者針對阿里雲通義、字節即夢、快手可靈、智譜清影、愛詩科技pixverse、生數科技vidu 六款目前已上線圖生視頻功能的視頻大模型做了測評。實測發現,相較於文生視頻功能,目前大多數的視頻模型的圖生視頻功能仍有很大提升空間。大多數視頻模型只能粗淺表現讓照片中的兩隻貓動起來,能理解提示詞並在視頻中加入新物品、加入轉場效果的視頻模型並不多,也更容易出現“翻車”現象(詳見此前報道>>>)。

採寫/視頻:南都記者 林文琪