☰

今天，你“文生圖”了嗎？

最近一段時間，“文生圖”異常火爆，或者叫AI繪畫、AI作畫，其實叫什麼不重要的，重要的是本質，就是這一新技術究竟會給社會帶來怎樣的影響或顛覆。

隨着一幅幅精美的“文生圖”繪畫作品出現在網絡空間，抖音開始出現各種教授網友製作文生圖的視頻教程，而在小紅書和閒魚上甚至還出現了賣AI壁紙、AI文生圖描述語句的職業。

簡單來說，文生圖，就是輸入一些描述語句，AI可以爲你生成創意畫作，這是當下AI最火熱的應用領域之一——AI作畫。其實也是AIGC的一種。最近幾年，AI寫作、AI作曲，AI在內容創作方面的應用可謂越來越廣泛了。

對於“文生圖”這樣一個新事物，無論是百度、谷歌這樣的互聯網大廠，還是新銳創業公司都已入局。

最近，百度旗下的AI藝術和創意輔助平臺——文心一格的發佈引起比較大的關注。畢竟以人工智能技術驅動發展的百度，此前已經在搜索引擎、自動駕駛、數字人、AI語音交互等領域取得了不俗的成績，在AI作畫領域，百度的“文心一格”也備受期待！

文生圖作畫效果怎麼樣？

文生圖效果好不好，先來上一組圖，大家自己看。

我也親測了一下，整體效果還不錯！

比如輸入“晴朗夏日竹林裡的少年”，生成了這樣一幅圖！

基本符合預期。

輸入“古風美男，長髮飄飄”，選擇動漫風格。就出現了下面這張圖。

用這張圖片用來給一篇分析二次元、國漫方面話題的文章配圖肯定是ok的。

輸入“深秋，陽光下的小女孩”。基本可用。當然也有不足的地方。比如手部細節不夠完美。這幾乎是目前所有“文生圖”平臺的通病，就是臉部細節和手部細節的呈現不夠完美。需要平臺提供就文生圖畫作局部調整的功能。比如圈定要修改區域，輸入描述，然後進一步優化，就能輸出調整後的結果。估計，這將是“文心一格”下一步要上線的功能。

再輸入“深秋一位打太極拳男子的背影”，出來的圖片，背影不完整。

然後輸入“天空中的一條龍”，出來的龍並不是我想要的中國龍，重新調整詞彙，輸入“雲層中一條咆哮的中國龍”就得到了想要的結果。

嘗試下來，整體感覺，輸入一句話比輸入幾個詞彙結果更令人滿意，描述字句越詳細，畫面細節也越豐富。

時間方面，“文心一格”顯示“請等待2分鐘”，但是通常是幾十秒，就能得到四種結果，供用戶選擇。

之前使用過Stable Diffusion的AI做圖，由於只支持英文交互，所以對於英文一般的我而言，還是比較限制表達。雖然現在有各種翻譯軟件，但是還是比較麻煩。百度的“文心一格”無疑更適合中國用戶。

不難看出，“文生圖”技術，對中文語義的理解尤爲關鍵。對於設計師而言，能準確理解客戶需求就能交付好的作品讓客戶滿意。對於AI作畫同樣存在這個問題。這一點“文心一格”還是比較優秀的。

比如輸入“草原上奔跑的寶馬”，究竟是什麼馬？究竟是汽車寶馬，還是一匹駿馬？輸入“佛跳牆”會出現什麼樣的內容？是一尊佛從牆上跳下來，還是佛跳牆這道菜？對比一下文心一格與其他文生圖平臺的結果，“文心一格”顯然對中國文化的理解更精準。

如何做到對需求的準確理解？

在我看來，對需求的準確理解，應該是“文生圖”這項技術最重要的能力。那麼，如何做好這一點？

百度技術中臺事業羣市場部負責人張全文提到了一個關鍵詞——大模型。

張全文介紹：“文心一格”“AI作圖”產品順利落地，是百度依託于飛槳、文心大模型持續進行技術創新的結果。百度的文心跨模態大模型ERNIE-ViLG 2.0是全球首個知識增強的AI作畫大模型，也是目前全球參數規模最大的AI作畫大模型。近年來以深度學習爲代表的算法發展，以及數據量井噴式增長，讓百度在訓練大模型方面取得了長足的進步。

所謂大模型，就是讓算法在大規模、海量的、沒有標註的、無規律的數據裡面進行自我學習，挖掘規律，進而生成一個基礎的模型。之後在這個基礎的模型之上，結合各個領域的少量的任務數據，再進行訓練、調優，之後就可以適用很多場景。

今年7月，百度用大模型復原了元代畫家黃公望的傳世畫作《富春山居圖》。這幅畫作在之前被火焚燒，分成了兩段，2011年前後半卷首次在臺北故宮博物院展出。百度的工程師，運用AI大模型技術去學習原畫做的筆觸和風格，並邀請普通用戶藉助百度的技術，按照心中所想來補全該畫作。不同的人呈現出不同的《富春山居圖》，每一幅畫作卻都那麼和諧，不禁令人驚歎AI技術之妙用。

在科技想象力不斷破圈的今天，AI作畫正處在高速發展的黃金階段。相信，不久之後這項能力就會成爲用戶日常獲得圖像內容的基礎選項，完全融入我們的生活與工作之中。

除了AI作畫之外，文心大模型投入產業應用，服務千行百業的節奏應該也是非常快的。

據張全文介紹，文心大模型具有兩大核心特色，一是知識增強，二是產業級。得益於兩大特色，文心大模型通用性好、泛化性強，作爲人工智能“基礎設施”的一部分，進一步拓寬了人工智能技術落地的場景覆蓋廣度，更加深了產業應用的深度。

目前，文心大模型已大規模應用於搜索、信息流、智能音箱等互聯網產品，並已通過飛槳開源開放平臺、百度智能雲等賦能到工業、能源、金融、通信、媒體、教育等各行各業。

幫助有圖片需求的人“降本增效”

有了文生圖以後，作爲從事自媒體工作的我來說，還是非常開心的。畢竟對於自媒體創業者來說，只要能“降本增效”的技術都是要積極擁抱的。

此前爲了節省圖片製作成本，嘗試過各種大小網站，海報製作，AI摳圖，照片轉漫畫等等。本着節約設計費的角度，能省一張是一張。幾年下來，充值了五六個網站，也沒能很好的解決這個問題。仍然需要人工設計來完成公衆號封面製圖工作。文章內的配圖，則是儘量少配圖，甚至不配圖，避免侵權問題。

熟悉知頓公號的朋友到知道，我們在一番嘗試之後，將公號圖片風格確定爲漫畫風格，目前是真人畫師手繪。好處是有顏值，有識別度，有一致的風格，有自己的版權。付出的代價是按照數量付費，用得越多，成本越高。

文生圖技術的出現，確實可以部分替代封面圖設計製作問題。如果能定製風格，或者輸入參考風格的圖片，那麼這個替代作用會更好用。

目前“文心一格”還處於免費階段，即使日後收費，大概率也是按照會員收費，整體成本還是要大大低於設計費用。

估計該技術將在設計、繪畫領域率先落地，特別是影視、動漫、遊戲、漫畫、媒體、廣告、出版、時尚、媒體等行業，大面積商業化指日可待。

文生圖會取代人類畫師嗎？

這麼一來，可能很多人要擔心：“設計師、畫師是不是要下崗了！”其實，這個擔心不無道理，但是歷史的車輪永遠向前滾動，新技術的對傳統領域的解構和重塑一直都在發生。

短期來看，文生圖是AI輔助創作，還是很難代替設計師、畫師的。畢竟真實世界的需求，很多是目前AI技術無法精準理解和實現的。積極的一面是，設計師、畫師可以藉助AI，提高自己創作的效率，甚至激發無窮的想象力。畢竟AI從海量數據中學習到的知識，是靈感得以實現的基礎，人類畫作數千年的積累和沉澱爲AI文生圖提供了可能；AI生成圖像過程中的隨機性，是靈感的補充，AI可以學習一千種人類繪製山峰的方式，甚至創造出“第一千零一種可能”。

但是，也必須承認，AI作畫確實會給一部分缺少創意能力，設計和繪畫水平一般的人帶來衝擊。

回顧人類發展歷史，新技術的出現，改變了很多行業。比如電腦的普及和輸入法的出現，讓打字員這個職業迅速消失。其實，一些職業的消失也並不是壞事。比如中國古代每個女人都是要學習針織刺繡這樣的女工手藝，以滿足一家老小的穿衣需求。即使在我小的時候，冬天穿的棉衣褲、春秋穿的毛衣毛褲也都是母親手工製作。那時候有“裁縫”這個專門的職業，而如今裁縫這個職業基本消失了，卻出現了服裝設計師。精細化的分工，讓服裝實現了工業化生產和流通，人們隨處都可以買到服裝。

當技術浪潮來臨之際，做弄潮者，還是被拍死在沙灘上，答案不言而喻。作爲繪畫創作者，主動去擁抱“文生圖”這樣的新技術或許是最好的選擇。正如人工智能專家吳軍說過的那樣，“任何一次技術革命，最初受益的都是發展它、使用它的人，而遠離它、拒絕接受它的人，在很長的時間裡都將是迷茫的一代。”

點燃普通人的繪畫創作熱情

不同於設計師和畫師，AI作畫那麼對於普通用戶又意味着什麼？

在我看來，更多的是點燃了普通人的創作熱情！

舉個例子：一位爸爸，通過文心一格，給女兒做了一個繪本。講述了他和妻子從學生時代相識、相愛，到結婚，以及妻子懷孕，給女兒佈置房間，女兒長大成爲一名小學生的過程。不懂繪畫的爸爸，通過AI繪畫的方式，配上自己充滿愛的語言，給孩子親手製作這樣獨特的記憶繪本。

繪畫是一個需要長期培養，投入一定時間的技能。每個人小時候或多或少都有繪畫創作的熱情，但是，這種熱情往往在漫長的技法學習與練習中被逐漸磨滅，能堅持下來的畢竟是少數。AI繪畫可以讓沒有繪畫基礎的普通人，點燃創作熱情，實現創作自由。

當技術降低創作的門檻，就會使得這一領域迅速繁榮起來，就如同生物界的“涌現”。在AI繪畫領域也一定會出現這樣的“涌現”情況，這大概是這項技術給普通人帶來的新機會。

關於AIGC的發展趨勢，百度CEO李彥宏曾表示，未來AIGC將走過三個發展階段：“助手階段、協作階段、原創階段。在第一階段，AIGC將輔助人類進行內容生產；第二階段，AIGC以虛實並存的虛擬人形態出現，形成人機共生的局面；第三階段則是原創階段AIGC將獨立完成內容創作。”顯然當前我們還處於第一階段。“隨着技術的突破，AI作畫，AI創作視頻，甚至構建整個虛擬世界可能變得像手機拍照一樣簡單。”對於AI繪畫，我們可以有更多的期待！

如何避免技術作惡？

每一次新技術誕生之後，人們總是免不了擔憂。“文生圖”技術是否會也被濫用，坦白說，很難完全避免。

比如輸入倒在血泊中的一匹馬，可能平臺會提示，請修改輸入語句。但是將語句調整爲，一匹馬倒在紅色的湖泊中，AI就能自動生成圖片了。這方面就需要平臺對搜索詞彙進行甄別了。我們有理由相信，有着20年搜索引擎經驗的百度，無疑會比其他公司做得更好一些。困難雖然多，但是總會找到解決的方法，不至於因噎廢食。

百度董事長兼首席執行官李彥宏曾提出人工智能倫理的四原則，即 AI 的最高原則是安全可控；AI 的創新願景是促進人類更平等地獲取技術和能力；AI 的存在價值是教人學習，讓人成長，而非超越人、代替人；AI 的終極理想是爲人類帶來更多自由與可能。

“這是技術可以有所作爲，也應當有所作爲的方向”深以爲然十分認同！（文 / 知頓書華）

今天，你“文生圖”了嗎？

相關資訊