【獨家】字節發佈文生圖開放模型SDXL-Lightning

界面新聞從知情人士處獲悉,字節發佈文生圖開放模型SDXL-Lightning。

從AI開源社區Hugging Face的最新榜單上,界面新聞查詢到了該模型。SDXL-Lightning 躋身模型趨勢榜,同時也成爲Hugging Face Spaces上的熱門模型。

與SDXL-Lightning一同上榜的,是谷歌新近推出的“最強開放大模型”Gemma系列,以及Stability AI的新一代文生圖模型Stable Cascade。

在圖像生成領域,先進模型的生成技術依賴於擴散過程,就是把噪聲逐步轉化爲圖像樣本的迭代。這個過程通常需要20到40次調用神經網絡,不僅會耗費巨大的計算資源,生成速度也比較慢。生成一張高質量圖像,大約需要5秒。

據知情人士透露,字節跳動的SDXL-Lightning通過漸進式對抗蒸餾的技術,實現前所未有的生成速度。該模型能夠在2步或4步內生成極高質量和分辨率的圖像,將生成速度加快十倍,是1024分辨率下速度最快的文生圖模型,計算成本則降低爲十分之一。

一位分析人士表示,對於需要快速圖像生成的應用場景,如實時廣告創意、遊戲角色設計等,SDXL-Lightning模型表現出一些應用潛力。這項技術也可以被運用於快速且高質量生成視頻、音頻以及其他多模態內容。

字節跳動智能創作團隊對界面新聞迴應稱,開源開放的浪潮已成爲推動人工智能迅猛發展的關鍵力量,SDXL-Lightning模型基於已有繁榮生態的文生圖開放模型SDXL,設計之初就考慮到與開放模型社區的兼容。SDXL-Lightning可以作爲增速插件無縫整合到卡通、動漫等多樣風格的SDXL模型中,並支持當前流行的控制插件ControlNet、生成軟件 ComfyUI,方便開發者、研究人員和創意從業者結合使用這些工具,助力整個行業的創新和協作。