ChatGPT殺瘋了

01

“正如移動設備通過GPS、攝像頭和網絡連接等新功能釋放了新類型的應用程序一樣,我們預計這些大型模型將激發生成式AI應用程序的新浪潮。就像十年前移動互聯網被一些殺手級應用打開了市場一樣,生成式AI的殺手級應用程序也會出現,比賽開始了。”9月,紅杉美國的兩位合夥人在一篇題爲《Generative AI: A Creative New World》的文章裡這樣預判。

這不,上週末開始風靡社交網絡的ChatGPT已經有點“殺手級應用”的意思了。

ChatGPT是一個由Open AI於11月底推出的AI對話模型。註冊ChatGPT後,用戶可以要求人工智能系統回答一系列問題,它的吸引力在於,除了具體的知識性問題,它可以回答開放式問題,並以對話方式與你交互。比如,你可以和它聊聊人生哲學,探討一下生命的意義,或是找它尋求追求真愛的建議。在各種場景的對話中,它都可以生成流暢的內容,從創作指定風格的詩歌、小說和電視腳本,再到回答瑣事問題以及編寫和調試代碼行。

週一,Open AI的聯合創始人、硅谷投資人Sam Altman在Twitter上表示,ChatGPT的用戶已突破100萬。熱情涌入的新用戶還一度使其宕機。

ChatGPT的火不難理解,這得益於免費帶來的傳播度,也得益於產品自身很強的交互性,照顧到了用戶對“好玩”的追求。

按照Open AI對ChatGPT的官方定義,這是一個優化的對話語言模型。“對話”格式賦予ChatGPT的能力體現在:它可以在回答初始問題之後,繼續回答用戶追問的問題,還能承認錯誤,挑戰用戶提出的不正確的前提並拒絕不適當的請求。

這背後又是技術的勝利。OpenAI團隊使用人類反饋強化學習(RLHF)訓練該模型,這一訓練方法增加了人類對模型輸出結果的演示,並且對結果進行了排序。具體來說,OpenAI使用監督微調訓練了一個初始模型:人類AI訓練員提供對話,他們在對話中扮演雙方——用戶和AI助手。在人類扮演聊天機器人的時候,會讓模型生成一些建議,輔助訓練師撰寫回復,訓練師會對回覆選項打分排名,將更好的結果輸回到模型中,通過以上獎勵策略對模型進行微調並持續迭代。

自然語言處理是人工智能皇冠上的明珠。過去,Open AI開發過幾款先進的語言處理模型,其中包括GPT-3,這是迄今爲止最強大的語言處理模型之一,它在2021年問世時也曾激起人們的討論興趣。相比於GPT-3,ChatGPT的主要提升點在於記憶能力。ChatGPT可以儲存對話信息,延續上下文,從而實現連續對話,這極大地提升了用戶體驗。

ChatGPT的了不起之處在於,這是AI界第一次免費向公衆提供如此強大,而使用界面又如此友好的工具,由此引發普通人廣泛的參與和討論。

但ChatGPT有時也會寫出看似合理但錯誤的答案,這同樣與其技術模型有關。

ChatGPT等AI生成文本模型通過尋找文本中的統計規律來學習,簡單來說,它通過用從互聯網上提取的數十億文本示例訓練的統計模型,對哪些文本位屬於同一個序列進行概率猜測。這意味着,它依靠的是經驗,而缺乏關於世界上某些系統如何運作的編碼規則,這使其容易給出錯誤的答案,或是生成一段流利的廢話。比如,它並不是一個很好的計算器,即使是簡單的加減法,也可能因爲訓練材料裡沒有這類文本而無法得出正確的結果,而暢銷書作者凱文凱利在ChatGPT那裡也被認爲是《黑天鵝》一書的作者。

據科技媒體The Verge報道,程序員聚集的問答網站Stack Overflow已暫時禁止用戶分享由ChatGPT生成的回覆,主要問題便是ChatGPT產生的答案有很高的錯誤率。

此外,ChatGPT官方列出的一些使用限制還包括:

對輸入措辭的調整或多次嘗試相同的提示很敏感。比如,當你給定一個問題的措辭,模型會聲稱不知道答案,但只要稍作改寫,它又可以正確回答。

生成的內容通常過於冗長並過度使用某些短語,例如重申它是OpenAI訓練的語言模型。這些問題源於訓練數據的偏差(訓練者更喜歡看起來更全面的長答案)和過度優化問題。

由於目前所有的回答都來自於已有訓練的數據庫,所以ChatGPT的答案也會出現時效性的問題。

02

和AI有關的話題總會引發人類被取代的焦慮,這一次也不例外,創意工作者、程序員乃至VC都成了危機羣體。

已經有業內人士指出,ChatGPT一類的研究主要動機並不是陪人聊天,而是更具商業價值的虛擬人。比如,你可以想象一下,通過此類系統,是不是可以輕鬆養出一堆看上去像是真人在維護的社交賬號?只會寫官樣新聞稿的記者和生產三流套路故事的編劇也該捏一把汗了。

不過,AI真要落到實處取代人類,可能也沒那麼容易。我問了一個在大廠做程序員的朋友,類似這樣的AI模型對他的編程工作會產生什麼影響。他的回答是,其實沒什麼影響。“很多花裡胡哨的概念在實際工作中都不適用,就像之前流行的低代碼平臺。”歸根結底,看似標準化的開發工作也並非遵循同一套標準,目前人還是重要一環,在一個系統之中,不同部門配合中產生的那些繁複的需求還是隻有人能領會清楚。AI不具備自己的思考能力,現階段還是依靠模式匹配和識別。

另一個關鍵的點在於,出於保護公司機密的考慮,大公司不會輕易購買外部的AI系統,自行研發則會受限於訓練材料和高昂的成本。舉個例子,Open AI的GPT-3和谷歌的transformer模型都屬於自然語言處理(NLP)模型,但是,這兩種模型之間存在一些關鍵差異,主要區別之一是模型的大小。谷歌模型有600億個參數,GPT-3比transformer模型大得多,有1750億個參數,這可都是用錢堆出來的。

有意思的事,有人用ChatGPT撰寫了一份AIGC行業報告,ChatGPT在其中如是分析AI對話系統面臨的挑戰:“關鍵挑戰之一是人工智能系統目前無法複製人類工作者擁有的許多複雜認知能力。例如,人工智能系統不具備常識推理、同理心或創造力,而這些在許多工作中都是關鍵技能。因此,人工智能不太可能在許多需要這些能力的工作中取代人類工人。此外,人工智能在工作場所的廣泛採用也可能受到經濟、社會和道德因素的限制。例如,人工智能失去工作可能會產生負面的經濟後果,例如更高的失業率和收入不平等。在工作場所使用人工智能也可能存在道德問題,例如公平性和問責制。”

無論如何,ChatGPT的流行又讓AIGC的概念火了一把,而且這次看來是有破圈的作用。

AIGC(AI-generated content),按照中金7月發佈的研究,指的是一種通過AI技術來自動或輔助生成內容的生產方式。通過輸入指令,人類讓AI去完成冗雜的代碼、繪圖、建模等任務,從而生成內容。今年早些時候流行的AI繪畫已經讓一部分人瞭解到AIGC,ChatGPT所在的公司Open AI也推出了AI繪畫系統DALL-E,只不過這個產品並不免費,而是通過訂閱制實現商業化。

海外,這個賽道已經跑出了獨角獸。

10月,AI繪畫平臺Stable Diffusion背後的Stability AI宣佈獲得1.01億美元來自Coatue和光速的投資,投後估值攀升至10億美元。

在紅杉資本關注的近50家AIGC公司中,自動生成社交媒體內容的Jasper歷史融資額已達1.25億美元,自動撰寫營銷內容的copy.ai融資近1400萬美元。

就在今天,圖片和視頻編輯領域的AIGC公司Runwa宣佈完成了5000萬美金的C輪融資,估值5億美金。

國內,AIGC概念創業公司也迎來了資本的追捧。

兩個月前我寫過,一個還在內測階段的AI生成內容平臺已經被十餘家美元基金圍獵。

這個月,AI生成3D內容的數字品牌AVAR獲得天使+輪融資,由奇績創壇投資,老股東華創資本、唯獵資本跟投。這家公司成立一年間已經連續完成三輪融資。

另一家主攻代替人使用軟件的AI自動化公司跨越星空也在半年內連續完成兩輪總計數千萬人民幣融資,其最新一輪投資方爲盈動資本、GGV啓航加速計劃、奇績創壇。

新技術浪潮洶涌,難免讓人心情複雜。作爲一個面臨被取代風險的記者,面對AI,我的態度是,恐慌毫無意義。

生成式AI的最佳用途是提供輔助:首先,人類產生創作衝動,給人工智能下達指令,AI生成一個選項菜單,然後人類選擇其中之一,對其進行編輯,並向他們需要的方向延伸。

在這個過程中,人類所能做的,我大概能想到下面兩條:

第一,做一個能準確提問的人,學會駕馭如此靈巧的工具,爲己所用。

第二,要知道,擔憂從不能解決問題,AI學得快,又不會偷懶,作爲人類的我們是不是也應該在學習和工作中更充分發揮主觀能動性呢?(文/劉燕秋 來源/投中網)