拿到數億融資後,梅濤想說說這代AI創業者的創業解法
「暗涌Waves」獨家獲悉,AI視頻生成初創公司智象未來,繼完成敦鴻資本領投的Pre-A輪融資後,又新獲以合肥產投爲主的國資基金領投的A輪融資,融資規模共計數億人民幣。同時參與投資的還包括安徽省人工智能母基金和湖北省長江電影集團有限公司等機構,此前曾獲阿爾法公社與訊飛兩輪領投。智象未來是全球第一家上線文生視頻的AI公司。創業之初,創始人兼CEO梅濤就精心算了一筆賬:從對算力和資源的依賴看,相比大語言模型,多模態模型是一種絕對的降維;而從商業化的可能來看,它又可以走的更早、更快。這看似是一種更理性、務實的浪漫,但現實顯然比想象的要更爲冷酷。
從年初的Sora、年中的可靈、再到Google Veo 2,2024年的視頻生成早已是兵家必爭、且其狂熱絲毫不亞於大語言模型的賽道。
即便如此,創業仍是梅濤這代AI研究者很難拒絕的一種誘惑——AI從未如此接近商業和現實。
作爲中國科學技術大學畢業生,在微軟的12年,梅濤登頂過學術的高峰:在多媒體分析和計算機視覺領域發表論文300多篇,先後15次榮獲最佳國際論文獎。他不僅成爲IEEE Fellow和加拿大工程院外籍院士,也是科技部科技創新2030人工智能重大項目首席科學家。
這段經歷,也讓他看到從技術到產品的鴻溝,並最終決定要把這個鏈條打通。2018年之後在京東的五年,是梅濤步入工業界的開始。作爲京東副總裁和京東探索研究院副院長,他開始了技術到商業化的探索之路。之後,他創立的智象未來,則是更密切地將這一切串在了一起。
梅濤的創業境遇,很像這個時代AI創業者的一個切片:擁抱產品時,不能放棄模型,否則很可能被吞噬;試水國內市場時,又不能放棄出海,因爲國內消費市場有很多創業公司無法撬動的困局。至於融資,在當前的資本冷週期中,往往意味着,創業者還要把信心反哺給投資人。
這些也讓梅濤意識到,在大公司做高管和自己下場創業的真正差異——前者是你的身後,始終還有別人;而現在“你後面沒有人了”,“所有問題都會到你這裡來,而你必須要把它們都處理掉。”
以下是創業一年多,梅濤關於融資、商業化等方面的一些心得總結:
視頻生成賽道的確離商業化更近
1. 前段時間,Sora正式發佈,但整體功能跟我們的預期差不多。客觀來看,在當前的視頻生成領域,OpenAI已不再具備太大優勢。剛出來時,它雖然只是個Demo,卻讓整個方法論都發生了改變;但時至今日,從產品落地角度來看,無論是海外還是國內的其他產品,其實都已經相差無幾。
2. 今年開始,視頻生成整個賽道變得很擁擠。6月份,可靈和Luma AI上線,我們在7月的上海世界人工智能大會上也官宣了新模型上線。8月是MiniMax 海螺、最近是World Labs和Google Veo 2,它們甚至已經從圖片處理過渡到3D領域。競爭的熾熱,來自這個賽道更短的商業化路徑,和相比於大語言模型更快的產品落地速度。
3. 去年全球AIGC的真正收入大概有200億美金,其中50~60%的收入來自視頻和圖像生成,或者是跟圖像視頻相關的工具性收入;30%是跟大語言模型相關的,比如chatbot類的收入。所以很多公司開始往這個賽道轉,它已經成爲大模型公司的必爭之地。
4. 對於初創公司來說,我們不會跟OpenAI、字節這些大廠正面競爭,我們一是要在算法上有獨闢蹊徑的創新,二是要把細分行業的最後一公里問題解決好,用產品和閉環價值佔領用戶的心智。大廠有算力,特別是C端流量的優勢,但他們要爲財務報表負責,所以一定會緊盯主流賽道的業務,產品也必須服務好現在的主流產品,像字節的即夢也好,快手的可靈也好,都要服務好他們現有的創作者生態。
5. 我們絕不會在大廠的路徑上去做重複的事,而是有自己專業的、細分的領域。之前我們做的是1+3+N,指的是一個大模型、三個核心產品加很多場景生態。之後我們會發佈一個新的、對標GPT-4o的多模態理解模型,將這個“1”做厚做寬。
6. 模型方面,我們自主研發了對標OpenAI Sora的全球首個商用百億級參數的視頻生成大模型。我們有國內最全的多模態版權語料、數十萬小時版權視頻素材以及上萬個授權IP。不僅涵蓋了國內70%影視數據,且已形成上億條AIGC二創素材,目前在影視、文旅、營銷等場景得到廣泛應用。截至11月底,累計服務100多個國家和地區的1000多萬用戶和4萬多家企業,月度經常性收入也實現了規模性增長。
7. 同時,我們即將發佈一個MoE架構的混合專家新模型。訓練時,它不只有DiT(Diffusion Transformer架構,也有AR(Auto-Regressive)架構,而且能集合兩者優勢,既把DiT架構的視覺生成效果體現出來,又能把AR架構中Token的離散化問題解決。目前我們已在圖像上得到驗證。
從模型整體來看,我們先做了生成,又做了理解。未來我們會有一個大一統的模型架構,把理解模型和生成模型融合爲一個統一的架構,目前還在實驗階段。再往後,我們也希望能把我們積累的國內最全的版權視頻素材做成AI視頻搜索服務。
8. 除大廠外,轉到這個賽道的底座大模型公司也有其獨特優勢,比如它們有萬卡集羣的架構經驗。但從對視頻生成的技術路線和對數據的理解來說,我們這些多模態原生的創業公司,要更垂、更專。
另外視頻生成領域的市場很大,有的公司動畫風格做的好,有的公司寫實風格做的好,有的影視級風格、3D做的好。絕不是一家廠商能把所有的事情做好,不同公司和用戶之間也不是完全重合。因此,賽道的擁擠並不會影響我們按照自己的節奏前進。
2.商業化過程中那些交過的學費
9. 都說這代AI創業者,DAY1就得既要星辰大海,又要腳踏實地。從我們創業第一天起,我們就非常有危機感意識,就想着怎麼樣去找PMF。我們在商業化方面走得比較早,也比較快。雖然我們融的錢並不是最多的,但是花的每分錢、招的每個人、我們都是想明白的。10. 這也和我之前在京東所受的訓練有關。京東是一家零售企業,毛利比較低,所以公司文化講究精細化運營。很多時候,老闆會用極限思維,就是用最少的資源來做成一個業務。除此外,產品三要素——成本、效率和體驗,也被再三強調缺一不可。這放在任何公司,任何產品也都成立。我們公司對商業化做了很多嘗試,也交了一些學費,慢慢的找到感覺了。
11. 做C端產品,我們一定要考慮的是怎麼解決雙非百的問題。現在的AIGC產品有兩個非百問題:一是用戶不能百分百用好產品,二是模型不能百分百生成用戶期望的效果。因此,AIGC產品目前需要跨越兩個鴻溝:如何從技術嚐鮮者到專業用戶,以及如何從專業用戶到普通用戶。我們的C端產品增長勢頭強勁,前不久也出現在2024 中國AI產品榜出海產品潛力獎榜單上。
12. 至於企業端,以前我在京東做供應鏈分析時,就瞭解到中國企業雖然數量多,但真正規模化的企業並不多。這種情況下,讓企業“買東西”還是比較難。中國的SaaS也一直很難破局,但AIGC技術出現後,有可能改變這種處境。
13. 做企業服務,我們的KA客戶,主要是一些央國企和頭部的互聯網企業。去年,我們給品牌商做上架的商拍產品叫PixMaker。今年戰略升級後,我們開始做營銷素材的生產,特別是爲短視頻的營銷生產提供工具。因爲我們覺得AIGC相關的最大產業是內容生產,而內容生產裡最大部分是跟營銷相關。目前,我們已經有四萬多家合作的中小企業,大企業也有超過百家。像我們跟運營商合作推出的AI視頻彩鈴,就可以把我們AIGC產品變成一個真正的國民級產品。
14. 此外,我們比較關注工具化和SaaS服務。我們覺得國內有個好處,是可以先通過服務大客戶把產品打造好,再反向去出海做SMB(中小客戶)服務。SMB和大C或專業個人用戶,產品邏輯基本一樣,都不需要做點對點的服務,我們已經有好幾款產品做得不錯。說到底,商業化我們主要做了兩件事:一是給創作者提供好的創作平臺和內容生態,二是給需要做營銷的品牌企業做好廣告內容生產,未來我們也會探索從生產到投放環節的嘗試。
3.這代創業者的融資解法
15. 前不久,我們拿到兩筆融資。一筆是市場化基金,一筆是國資,我們把Pre-A輪和A輪放在一起了。前者是專注於文化科技領域知名頭部基金敦鴻資本,後者是以合肥產投爲主的國資基金,也包括安徽省人工智能母基金、湖北省長江電影集團有限公司等。現在的AI初創公司很難去融美元基金的錢,這是不爭的事實。所以,我們現在是兩條腿走路——國資的在談,市場化和產業資本的也在談。
16. 拿國資融資時,我覺得要考慮國資背後的政府着力發展的產業方向是否和公司方向吻合,以及能否把公司往龍頭或鏈主企業打造。現在的國資,比如像合肥產投,他們也有很專業的視角、看法和盡調,有基於市場的判斷。而且國資也代表了當地政府的一些產業方向,初創公司也可以藉助這種勢能。
17. 去年我們第一輪融資,來自一個名爲“中喝大”的中科大校友羣。這個羣大概100多個人,基本由中科大一些企業家和學者組成,平時經常一起組織校友活動,做一些創業方面的交流。就是這個羣的15箇中科大校友,組成一個合夥人LLP,來支持了我們的第一筆融資。
一直以來,中科大的培養模式都是培養偏數理化的科學家,所謂“千生一院士”。但在工科以及商業方面就顯得不那麼突出,所以他們就想一起扶持一個人來做這件事,而我正好也想出來創業。這筆錢被稱作“中喝大種子一號”,可能很快就會有種子二號和種子三號等。
18. 最開始融資時,還有一些美元基金進來,他們喜歡大故事,越星辰大海越好;但後來,美國法令條款出來後,很多美元基金就不敢投了,我們就換成了人民幣架構。關於美元還是人民幣,我覺得取決於你的業務在哪裡、客戶在哪裡。如果未來我們的業務真的能做到全球化,我們也可以去拿美元基金,架構也是可以調的。
19. 三年前你出來創業,100塊錢隨便拿;但現在,70%的美元基金已經不可能了,還剩30%的人民幣又四處分散。可能其中只有一小部分是產業基金,而且現在產業資本也變謹慎了。目前多模態的創業公司,能在外面融資的,現在也沒幾家。如果在十年前,至少得有十幾家吧。但邏輯都是一樣的,如果沒有商業化數據,最後誰來接盤?我過往的工業界經歷告訴我,一家公司一定要創造真正的商業價值,要給股東創造價值,否則這個公司沒有意義。
20. 我經常跟我的投資人說他什麼時候可以退出。我們的上限有多高,我不知道,因爲很多時候取決於大勢和一些偶然;但我會告訴他,我們的下限有多高。那就是,我會保證我們的公司健康、穩定地去運行。
4.浪來時,要跟着跳起來
21. 創業讓我覺得我的人生從未如此完整過。在一個大公司做高管,只要把技術或者團隊管好就行了,至於戰略,你後面還有老闆。成爲一個創業者就不一樣了,你後面沒有人了,所有的問題最終都會到你這裡來,而你必須把它們終結。
22. 每個加入創業公司的人,一定要自己先做好心理建設,你必須得自己想清楚。否則遇到一點點困難,就會想我憑什麼要來受這個罪?我經歷過技術到產品,中間又做了一段商業化,但真正創業時發現還需要更多的東西。
23. 2015年左右,四小龍起來時,我還在微軟。當時很多人找我出來創業,我沒出來。一是覺得自己羽翼沒豐滿,學術上還可以再往前一步;另外覺得那波浪潮的商業模式還比較薄。我選擇在2018年出來,是覺得自己學術已經有了一些積累,更想去all in一個產品。
24. 在微軟研究院,我們就經常說,從一個技術到一個產品,可能需要一百個工程師;要把產品賣好,可能還需要一百個解決方案專家或BD,可見中間的Gap有多大。當時我就想,我一定要找個地方去把鏈條打通。後來去京東,我做的每項技術都用到了產品裡。這個過程可以看作:從技術到產品,到一條業務線,再到一家公司。
25. 當時選擇視頻這個賽道,也是一種理性思考的結果。去年我們判斷,做大語言模型競爭過於激烈。而視頻生成在國內和國外的差距並不大。另外,商業模式上,大語言模型是用在人機交互和理解上,講究的是準確性,出現幻覺會比較糟糕。而視頻生成是一種數字創意產業,用戶不會那麼在意幻覺問題。去年3月公司成立,5月拿到第一筆錢,8月第一版智象模型就在HiDream.ai網站上線了。當時,我們是全球第一個上線文生視頻的AI公司。
26. 我們既做模型,又做應用。如果模型不自研只做應用,就太單薄了,很可能被模型擊穿。但我們做的不是通用模型,而是垂類模型。我覺得只要保證在這個領域裡面,我們模型的能力一直是全球最好那一批,以及我們的產品能解決好用戶體驗的最後一公里問題,這家公司就能成立。
27. 一路走下來,會發現做企業家,比做科學家挑戰更大。科學家可以每天只需要想0-1的創新,不需要解決具體的產品化問題;而對於企業家來說,做完0-1後,還得把1做到100,再做到10000。這個過程,你要消除自己的ego。讓自己從之前某個專業的頂峰先下來,自我清零,再去爬另外一個頂峰。創業時,我就是在主動打破自己的舒適區去尋求這種改變。
28. 現在的環境下,創業者確實需要成爲六邊形戰士。但我現在越來越享受不確定性。人工智能浪潮,往前看60年,是三起三落。我們現在正處於第三波浪潮的中間,還沒往下落。我始終覺得人要順勢而爲。當浪潮來臨時,不要逆流而動,而應順勢跳躍,乘勢而上。
29. 我願意把未來十年放在這個公司,把商業從頭到尾經歷一遍。如果未來有機會,我希望可以把這些經驗傳授給年輕人。在這樣一個環境下,有很多事等着你去做,這也很好。爲什麼很多財務自由的人要去登一次珠峰,就是因爲人會始終想着去找新起點,而不是閒着,驟然老去。