今天,你“文生圖”了嗎?

最近一段時間,“文生圖”異常火爆,或者叫AI繪畫、AI作畫,其實叫什麼不重要的,重要的是本質,就是這一新技術究竟會給社會帶來怎樣的影響或顛覆。

隨着一幅幅精美的“文生圖”繪畫作品出現在網絡空間,抖音開始出現各種教授網友製作文生圖的視頻教程,而在小紅書和閒魚上甚至還出現了賣AI壁紙、AI文生圖描述語句的職業。

簡單來說,文生圖,就是輸入一些描述語句,AI可以爲你生成創意畫作,這是當下AI最火熱的應用領域之一——AI作畫。其實也是AIGC的一種。最近幾年,AI寫作、AI作曲,AI在內容創作方面的應用可謂越來越廣泛了。

對於“文生圖”這樣一個新事物,無論是百度、谷歌這樣的互聯網大廠,還是新銳創業公司都已入局。

最近,百度旗下的AI藝術和創意輔助平臺——文心一格的發佈引起比較大的關注。畢竟以人工智能技術驅動發展的百度,此前已經在搜索引擎、自動駕駛、數字人、AI語音交互等領域取得了不俗的成績,在AI作畫領域,百度的“文心一格”也備受期待!

文生圖作畫效果怎麼樣?

文生圖效果好不好,先來上一組圖,大家自己看。

我也親測了一下,整體效果還不錯!

比如輸入“晴朗夏日竹林裡的少年”,生成了這樣一幅圖!

基本符合預期。

輸入“古風美男,長髮飄飄”,選擇動漫風格。就出現了下面這張圖。

用這張圖片用來給一篇分析二次元、國漫方面話題的文章配圖肯定是ok的。

輸入“深秋,陽光下的小女孩”。基本可用。當然也有不足的地方。比如手部細節不夠完美。這幾乎是目前所有“文生圖”平臺的通病,就是臉部細節和手部細節的呈現不夠完美。需要平臺提供就文生圖畫作局部調整的功能。比如圈定要修改區域,輸入描述,然後進一步優化,就能輸出調整後的結果。估計,這將是“文心一格”下一步要上線的功能。

再輸入“深秋一位打太極拳男子的背影”,出來的圖片,背影不完整。

然後輸入“天空中的一條龍”,出來的龍並不是我想要的中國龍,重新調整詞彙,輸入“雲層中一條咆哮的中國龍”就得到了想要的結果。

嘗試下來,整體感覺,輸入一句話比輸入幾個詞彙結果更令人滿意,描述字句越詳細,畫面細節也越豐富。

時間方面,“文心一格”顯示“請等待2分鐘”,但是通常是幾十秒,就能得到四種結果,供用戶選擇。

之前使用過Stable Diffusion的AI做圖,由於只支持英文交互,所以對於英文一般的我而言,還是比較限制表達。雖然現在有各種翻譯軟件,但是還是比較麻煩。百度的“文心一格”無疑更適合中國用戶。

不難看出,“文生圖”技術,對中文語義的理解尤爲關鍵。對於設計師而言,能準確理解客戶需求就能交付好的作品讓客戶滿意。對於AI作畫同樣存在這個問題。這一點“文心一格”還是比較優秀的。

比如輸入“草原上奔跑的寶馬”,究竟是什麼馬?究竟是汽車寶馬,還是一匹駿馬?輸入“佛跳牆”會出現什麼樣的內容?是一尊佛從牆上跳下來,還是佛跳牆這道菜?對比一下文心一格與其他文生圖平臺的結果,“文心一格”顯然對中國文化的理解更精準。

如何做到對需求的準確理解?

在我看來,對需求的準確理解,應該是“文生圖”這項技術最重要的能力。那麼,如何做好這一點?

百度技術中臺事業羣市場部負責人張全文提到了一個關鍵詞——大模型。

張全文介紹:“文心一格”“AI作圖”產品順利落地,是百度依託于飛槳、文心大模型持續進行技術創新的結果。百度的文心跨模態大模型ERNIE-ViLG 2.0是全球首個知識增強的AI作畫大模型,也是目前全球參數規模最大的AI作畫大模型。近年來以深度學習爲代表的算法發展,以及數據量井噴式增長,讓百度在訓練大模型方面取得了長足的進步。

所謂大模型,就是讓算法在大規模、海量的、沒有標註的、無規律的數據裡面進行自我學習,挖掘規律,進而生成一個基礎的模型。之後在這個基礎的模型之上,結合各個領域的少量的任務數據,再進行訓練、調優,之後就可以適用很多場景。

今年7月,百度用大模型復原了元代畫家黃公望的傳世畫作《富春山居圖》。這幅畫作在之前被火焚燒,分成了兩段,2011年前後半卷首次在臺北故宮博物院展出。百度的工程師,運用AI大模型技術去學習原畫做的筆觸和風格,並邀請普通用戶藉助百度的技術,按照心中所想來補全該畫作。不同的人呈現出不同的《富春山居圖》,每一幅畫作卻都那麼和諧,不禁令人驚歎AI技術之妙用。

在科技想象力不斷破圈的今天,AI作畫正處在高速發展的黃金階段。相信,不久之後這項能力就會成爲用戶日常獲得圖像內容的基礎選項,完全融入我們的生活與工作之中。

除了AI作畫之外,文心大模型投入產業應用,服務千行百業的節奏應該也是非常快的。

據張全文介紹,文心大模型具有兩大核心特色,一是知識增強,二是產業級。得益於兩大特色,文心大模型通用性好、泛化性強,作爲人工智能“基礎設施”的一部分,進一步拓寬了人工智能技術落地的場景覆蓋廣度,更加深了產業應用的深度。

目前,文心大模型已大規模應用於搜索、信息流、智能音箱等互聯網產品,並已通過飛槳開源開放平臺、百度智能雲等賦能到工業、能源、金融、通信、媒體、教育等各行各業。

幫助有圖片需求的人“降本增效”

有了文生圖以後,作爲從事自媒體工作的我來說,還是非常開心的。畢竟對於自媒體創業者來說,只要能“降本增效”的技術都是要積極擁抱的。

此前爲了節省圖片製作成本,嘗試過各種大小網站,海報製作,AI摳圖,照片轉漫畫等等。本着節約設計費的角度,能省一張是一張。幾年下來,充值了五六個網站,也沒能很好的解決這個問題。仍然需要人工設計來完成公衆號封面製圖工作。文章內的配圖,則是儘量少配圖,甚至不配圖,避免侵權問題。

熟悉知頓公號的朋友到知道,我們在一番嘗試之後,將公號圖片風格確定爲漫畫風格,目前是真人畫師手繪。好處是有顏值,有識別度,有一致的風格,有自己的版權。付出的代價是按照數量付費,用得越多,成本越高。

文生圖技術的出現,確實可以部分替代封面圖設計製作問題。如果能定製風格,或者輸入參考風格的圖片,那麼這個替代作用會更好用。

目前“文心一格”還處於免費階段,即使日後收費,大概率也是按照會員收費,整體成本還是要大大低於設計費用。

估計該技術將在設計、繪畫領域率先落地,特別是影視、動漫、遊戲、漫畫、媒體、廣告、出版、時尚、媒體等行業,大面積商業化指日可待。

文生圖會取代人類畫師嗎?

這麼一來,可能很多人要擔心:“設計師、畫師是不是要下崗了!”其實,這個擔心不無道理,但是歷史的車輪永遠向前滾動,新技術的對傳統領域的解構和重塑一直都在發生。

短期來看,文生圖是AI輔助創作,還是很難代替設計師、畫師的。畢竟真實世界的需求,很多是目前AI技術無法精準理解和實現的。積極的一面是,設計師、畫師可以藉助AI,提高自己創作的效率,甚至激發無窮的想象力。畢竟AI從海量數據中學習到的知識,是靈感得以實現的基礎,人類畫作數千年的積累和沉澱爲AI文生圖提供了可能;AI生成圖像過程中的隨機性,是靈感的補充,AI可以學習一千種人類繪製山峰的方式,甚至創造出“第一千零一種可能”。

但是,也必須承認,AI作畫確實會給一部分缺少創意能力,設計和繪畫水平一般的人帶來衝擊。

回顧人類發展歷史,新技術的出現,改變了很多行業。比如電腦的普及和輸入法的出現,讓打字員這個職業迅速消失。其實,一些職業的消失也並不是壞事。比如中國古代每個女人都是要學習針織刺繡這樣的女工手藝,以滿足一家老小的穿衣需求。即使在我小的時候,冬天穿的棉衣褲、春秋穿的毛衣毛褲也都是母親手工製作。那時候有“裁縫”這個專門的職業,而如今裁縫這個職業基本消失了,卻出現了服裝設計師。精細化的分工,讓服裝實現了工業化生產和流通,人們隨處都可以買到服裝。

當技術浪潮來臨之際,做弄潮者,還是被拍死在沙灘上,答案不言而喻。作爲繪畫創作者,主動去擁抱“文生圖”這樣的新技術或許是最好的選擇。正如人工智能專家吳軍說過的那樣,“任何一次技術革命,最初受益的都是發展它、使用它的人,而遠離它、拒絕接受它的人,在很長的時間裡都將是迷茫的一代。”

點燃普通人的繪畫創作熱情

不同於設計師和畫師,AI作畫那麼對於普通用戶又意味着什麼?

在我看來,更多的是點燃了普通人的創作熱情!

舉個例子:一位爸爸,通過文心一格,給女兒做了一個繪本。講述了他和妻子從學生時代相識、相愛,到結婚,以及妻子懷孕,給女兒佈置房間,女兒長大成爲一名小學生的過程。不懂繪畫的爸爸,通過AI繪畫的方式,配上自己充滿愛的語言,給孩子親手製作這樣獨特的記憶繪本。

繪畫是一個需要長期培養,投入一定時間的技能。每個人小時候或多或少都有繪畫創作的熱情,但是,這種熱情往往在漫長的技法學習與練習中被逐漸磨滅,能堅持下來的畢竟是少數。AI繪畫可以讓沒有繪畫基礎的普通人,點燃創作熱情,實現創作自由。

當技術降低創作的門檻,就會使得這一領域迅速繁榮起來,就如同生物界的“涌現”。在AI繪畫領域也一定會出現這樣的“涌現”情況,這大概是這項技術給普通人帶來的新機會。

關於AIGC的發展趨勢,百度CEO李彥宏曾表示,未來AIGC將走過三個發展階段:“助手階段、協作階段、原創階段。在第一階段,AIGC將輔助人類進行內容生產;第二階段,AIGC以虛實並存的虛擬人形態出現,形成人機共生的局面;第三階段則是原創階段AIGC將獨立完成內容創作。”顯然當前我們還處於第一階段。“隨着技術的突破,AI作畫,AI創作視頻,甚至構建整個虛擬世界可能變得像手機拍照一樣簡單。”對於AI繪畫,我們可以有更多的期待!

如何避免技術作惡?

每一次新技術誕生之後,人們總是免不了擔憂。“文生圖”技術是否會也被濫用,坦白說,很難完全避免。

比如輸入倒在血泊中的一匹馬,可能平臺會提示,請修改輸入語句。但是將語句調整爲,一匹馬倒在紅色的湖泊中,AI就能自動生成圖片了。這方面就需要平臺對搜索詞彙進行甄別了。我們有理由相信,有着20年搜索引擎經驗的百度,無疑會比其他公司做得更好一些。困難雖然多,但是總會找到解決的方法,不至於因噎廢食。

百度董事長兼首席執行官李彥宏曾提出人工智能倫理的四原則,即 AI 的最高原則是安全可控;AI 的創新願景是促進人類更平等地獲取技術和能力;AI 的存在價值是教人學習,讓人成長,而非超越人、代替人;AI 的終極理想是爲人類帶來更多自由與可能。

“這是技術可以有所作爲,也應當有所作爲的方向”深以爲然十分認同!(文 / 知頓 書華 )