AI影像生成重大變革!谷歌推模型Veo 2 保證不會出現「6根手指」
▲谷歌推出全新的人工智慧影像生成器「Veo 2」。(圖/翻攝自YouTube)
記者羅翊宬/綜合報導
如今全球高度關注人工智慧(AI)的發展,爲了不讓OpenAI專美於前,由Google所收購的人工智慧公司「Google DeepMind」於當地時間16日再度發表新版影片生成工具Veo 2,實現不同的鏡頭和電影效果,能更加細微呈現人類的表情變化,真實模擬運動、流體力學、光的特性,解析度比OpenAI的Sora模型高出4倍。
綜合外媒報導,Google DeepMind於16日發表新版影片生成工具「Veo 2」,其生成影片的解析度最高可以達到4K(4096×2160)、影片時長爲2分鐘,在解析度上是Sora模型的4倍、影片生成時長則爲Sora的6倍,其大幅提升實體世界物理作用、人類表情細微差異、人類運動上的理解程度,使得生成影片變得更加細緻,提高真實性。
其中,用戶只需指定文類、鏡頭與想要的影像效果,包括可以要求從場景中間以低角度平移追蹤,或是某位科學家觀看顯微鏡時的臉部特寫,以及從用戶所輸入的18mm鏡頭的提示要求,達到生成此常用鏡頭的廣角影像,而若是輸入「淺景深」,則能達到背景模糊、焦點集中在主題上的效果。
在影像的生成過程中,能夠大幅降低「多餘的手指頭」(6根手指)等AI常見錯誤的出現頻率。Veo 2的出現,使AI影片創作方面產生重大變革,使Google成爲AI生成視覺效果的佼佼者,爲創作者提供專業級工具,重塑影像生成的未來。