☰

騰訊和字節的幽靈在中國AI的上空徘徊

作者｜ Yoky郵箱｜ yokyliu@pingwest.com

2023年4月，產品經理鬆鵝（化名）從騰訊離職兩天後，就從深圳來到北京，加入一家基座大模型的初創公司。彼時，這家公司還沒什麼資本追捧和用戶聲量，只有一個聽起來挺拗口的中文名字：月之暗面。

那時候這家公司的產品團隊，只有鬆鵝一個人。

同月，曾經在字節跳動全程參與搭建抖音和TikTok等產品的王長虎，在中美都狂“卷”文生圖時，，創業成立一家文生視頻公司：愛詩科技。

幾乎也是同一時間，在嘗試了AI口語軟件、AI換臉、AI心理諮詢等多個AI項目之後，用戶量的激增、投資人的熱情讓身在騰訊的萬磊發現：屬於AI的風口真的到了。

大模型最終要靠產品來落地，這是這些嗅覺靈敏的產品經理們看到的機會。而故事也就此開始。

鬆鵝來到月暗6個月後，他們做出了Kimi，又過了6個月，Kimi在全網爆了；在Sora沒火之前，愛詩的產品團隊已經開始重點突破“一致性”的難題，反覆進行迭代優化；萬磊被投資人質疑多次“AIGC應用沒有核心技術壁壘，很容易被模仿”之後，在藍馳的閉門會上遇到了剛剛從蘇黎世聯邦理工大學畢業，帶着大模型技術的姜昱辰。一個懂產品，一個有技術，他們組成了波形智能。

如果拿移動互聯網的歷史來對照，一個技術滲透到普通人生活的必經之路，就是應用的井噴。大模型領域今天似乎正在經歷相似的事情。每天都能看到一兩個新的產品誕生，走紅，被廣泛討論，它們的目標都是成爲一款“AI Native”的超級應用。

而在這些看似新生的AI明星產品背後，一個有意思的現象越來越明顯：

在它們身上你總能找到上個時代的影子，更確切一些，是騰訊和字節的影子——這兩個中國移動互聯網時期產品最強的公司，正像幽靈一樣，在中國大模型產品的上空徘徊。

騰訊的“門徒”

騰訊的人出來，總是很“騰訊”。他們做產品，也是忠誠的門徒。

鬆鵝的個人欄目叫《鵝庫》，而萬磊存着一堆張小龍的表情包。

鵝和張小龍，都是騰訊的“圖騰”。

在產品風格上，騰訊的產品經理們深受張小龍這位“微信之父”的影響。產品，是馬化騰一直強調的“連接器”，它是技術和用戶之間的連接，在騰訊的產品體系中，2C產品就是要把使用體驗做到“極致”。

2023剛開年，鬆鵝還在騰訊會議團隊待的好好的，用他自己的話甚至可以說是“很開心”。

它是目前最可用的會議工具之一，甚至一度可以說是騰訊繼微信之後的下一個明星產品。在其他所有廠商將IM、會議、文檔、OA都打包整合成一個軟件的時候，騰訊把它們拆開了。

極簡，是張小龍時代提出的“少即是多”的理念，而鬆鵝離開騰訊會議後繼續執行着這樣的理念。

鬆鵝曾在社交平臺上分享道：“做一個產品，添加一個功能很容易，不添加功能迭代用戶體驗很難，減少一個功能最難。大部分產品都是因爲不停地加功能而變的臃腫。”簡直是張小龍產品語錄的翻譯版。

而Kimi身上確實也能找到對應的烙印。

早期打開Kimi，除了對話框，幾乎什麼都沒有。在不斷更新的版本中，它“長”出了幾個按鈕。

這些按鈕包括了“首頁”、“新會話”、“歷史會話”和“Kimi＋”，和Kimi的特色能力“網頁鏈接”、“文件上傳”，將核心功能凝聚成一個個按鈕，是騰訊的另一個傳統。

爲了讓用戶能夠了解按鈕的作用，Kimi中也存在着大量的“氣泡”，來進行進一步解釋。不僅如此，在Logo的下方，具有文藝感的文案，句句不同。

根據鬆鵝分享的一個有意思的例子，也能看出這種騰訊的烙印並非所有做產品的人都默認的原則。尤其是，當你的團隊也有了字節系的人——4月18號，在一次需求會中，鬆鵝提出在產品的某個位置需要一個文案。而“一位來自字節的同事當即反駁：在字節做產品從來不會有這種要求，這不會提升轉化。”他分享到。

“但這裡確實得有個文案，還得是比較有功底的文案。嗯，現在差點意思。”頓了頓，鬆鵝講道：“我們在騰訊做產品是這樣。”

把用戶的需求一個個拆到“事無鉅細”，以人爲本是騰訊做產品的靈魂。目前Kimi是唯一一個國內大模型，兼具了網頁版、App小程序形態的大模型產品，一位獨立開發者對我們反饋道：“表面上Kimi設置的網頁版、APP版和小程序版和其他同類產品沒有太大的差別，但當其作爲插件在網頁中使用時，Kimi的呈現效果要更好。”

右側爲Kimi插件

靈活的產品形態讓Kimi更具有大衆性和普遍性，Kimi插件可以直接翻譯＋整理重要信息，同時還可以進行自定義調整需求，進行個性化設置。鬆鵝告訴我們，網頁插件版本是開發者自發調用API生成的，並不出自月暗團隊。

同樣由騰訊系產品經理打磨的蛙蛙寫作，產品形態上和Kimi有很多風格相似的地方。對於不同場景的拆解和功能介紹、教程導覽，在很多細節上的“較真”和“死磕”。

比如，對於一款生成文本內容的AI產品，萬磊的團隊發現，目前的模型生成能力往往並不能夠直接生成整篇可用的內容，往往部分可用需要進行二次甚至三次調整。他們給出的答案很騰訊——在大模型的生成結果中，添加了“滑詞”功能，以便於AI生產後的二次優化。

與此同時，騰訊的另一個靈魂“社交”，也快速展示在這些產品身上。

大學畢業之後，萬磊進入了騰訊，在全民K歌中負責社交關係鏈的部分，後又轉到“創新項目”部門，不斷追趕互聯網風口，做過數字人、元宇宙遊戲，陌生人交友，也做了一堆和AI相關的小項目，在不斷的探索中，他對於產品的思考越來越寬。

全民K歌推出之前，K歌已經有了標杆產品“唱吧”。那時的唱吧已經吸引和培養了一大批KOL，也在產品細節比如調音、製作MV上下足了功夫。

這盤逆風局，怎麼打？參考了以前微信借勢QQ、企業微信借勢微信的套路，全民K歌更加強調“誰在聽”而不是“誰在唱”。和微信打通之後，社交關係鏈自然而然的轉移到了K歌平臺，也爲後續的發展創造了土壤。

當你打開蛙蛙寫作就會發現，和其他產品不同的是，它更強調社交傳播，“邀請送會員”、“進羣有禮”讓人夢迴2018年全網都在“裂變”拉新之際。

我們曾與多位Agent創業者聊過當下的創業環境，他們的反饋往往是，“如今面臨的不是做不出來，而是做出來給誰用的問題”。

“找用戶”，無論是在移動互聯網時代還是AI時代，都是第一個核心問題。對於文案寫作工具而言，寫出來是一方面，給誰看是另一方面。在羣裡，用戶可以溝通和交流經驗，互相分享成果，甚至通過蛙蛙寫作的渠道報名參加小說比賽。

萬磊分享道：“我們光電話訪談的用戶累計有上百個了，有時候我們會把關鍵用戶叫到辦公室，當着我們的面使用產品，發現問題後產品團隊立刻進行調整，我們希望藉助自研模型把工具做細膩做透，和市面上其他套殼的寫作工具拉開差距。”

這些產品風格上的“路徑依賴”正隨着產品的長大而凸顯，這些主觀、細碎甚至有些執念的做法，很騰訊。

字節的“繼承者”

但字節的風格幾乎是光譜的另一端。體現在新的一批AI產品上，則是它不以人爲載體傳承，而強調一種產品邏輯上徹底的創新。

字節的人出來創業，帶着的是一種做產品的方法，而不是產品的風格。

“19年的時候我們組裡來了一個字節的小女生，感覺很不一樣。雖然我們平時也會看數據，但明顯她對數據和AB test更加敏感，所有的需求根據數據結果進行推演，包括好與不好，都是通過數據來評判。”萬磊回憶道。

字節系的產品跑得比較好的，產品模型基本長得很相似且粗暴簡單，推薦系統中臺+足夠規模化的數據input，從內涵段子到頭條到抖音到後來小一點的懂車帝，番茄小說都一樣，而騰訊產品做得好的產品基本離不開社交關係鏈。

騰訊像文科生，做產品的都是人類社會學研究學者；而字節是理科生，灌數據、做AB測試，然後跑數據，出結果。愛詩科技產品負責人牧之這樣總結。

算法是整個“字節系”產品的靈魂，公開資料顯示，王長虎在字節跳動負責了視覺算法平臺和業務中臺的搭建，用算法爲代表的方法論來決定產品的樣貌，這種方式同樣帶到了他的愛詩科技。

“推薦算法技術中臺的打造是最困難的，他需要給足夠的空間和自由度，讓產品能夠在短時間內完成更多需求測試，同時他也需要足夠開放，對未來產品發展空間的承壓能力和適應空間。”牧之說道。

參考移動互聯網時代的抖音，幾百萬視頻播放量時搭出的推薦算法框架，到了幾百億觀看的規模，算法是不是仍然適用，仍然能夠高效的分析每個用戶的喜好。

這裡我們舉個簡單例子，用雙向標籤對照的體系，爲用戶打標籤，也爲內容打標籤，進行雙向匹配，這樣無論內容體量多龐大，用戶體量如何增長，這樣的機制能夠保證實現“千人千面”。

字節系信奉這套方法論，在不同的場景、不同的行業這套方法論會出現不同的結果，也會遇到不同的難題。比如，對於愛詩來說，產品經理想設計一套機制，跑一個推薦模型，怎麼讓你的Tranformer或者Diffusion模型，通過產品能夠拿到足夠多的前期數據？

“第一重要的仍然是需要知道用戶到底要什麼，他要這個視頻來做什麼，對應到我需要什麼楊的數據，第二是設計一套機制，無論是自己生產數據，採買或者爬取數據，還是強化學習來回收數據也好，input到你的模型。”牧之講道。

所以在推出PixVerse之前，愛詩產品團隊做了很長時間的時間用戶調研，爲了完成第一步。

通過對國內外比較核心的專業視頻生產者的前期調查，愛詩發現，清晰度是用戶的一個核心剛需，一致性是對視頻生成模型能否成爲生產力的一個更高標準，產品通過市場調查反哺技術，技術團隊對此進行模型突破。

對於AIGC的使用場景，在早期根據歷史軌跡的推演下，只能替代現有的一部分而很難開發新場景，且在技術發展的早期，比如文生視頻的時間只能有3-4秒的高質量輸出，能夠滿足的需求有限，產品需要找到一個合適的切入點。

有了切入點以後的下一步，是建立一個良性的算法模型。

牧之舉了一個例子，在訓練鏡頭這個事情上，如果產品能明確好當下用戶其實最爲需要的是一些專業性的鏡頭，那麼你在做數據收集和數據標註以及清晰的時候，是會存在很強的傾向性的，就是需要這些專業鏡頭的數據，有了這樣的判斷，往往能用更少的數據和更低的訓練成本得到一個更好的結果。

隨着用戶量的增長，標註的元數據越來越多，算法也就越來越靈。

目前PixVerse在海外文生視頻產品榜單中下載量連續排名靠前，也通過不停的算法優化和數據積累，形成了產品突破力，滾動的雪球開始有了實體。

技術與產品的新羈絆

騰訊和字節的產品風格區別，其實還暗含着一個本質的問題：技術與產品之間的平衡。

騰訊系的產品誕生和成熟於互聯網時期和移動互聯網初期，技術是現成的，需要產品提供的對用戶需求的準確理解，來把它的價值體現出來。字節系的產品在移動互聯網的另一個階段快速成長，這時候以算法爲核心的技術，本身在一種不穩定中快速進步，它帶來的強大能力是頭條和抖音這類產品可以出現的根本，產品經理的“上帝”的角色就讓位給了算法技術。

這種產品與技術之間的牽絆在今天AI大模型時代，換了形式繼續籠罩在各個產品的製造過程中。

“如今做產品和移動互聯網最大的不同是，需要思考技術能解決的問題，和產品能解決的問題”。幾乎我們問到的所有產品經理，都給出了這樣的答案。但同樣的，不同的底色依然決定着問題的答案。

對於視頻生成產品，一方面模型的效果本身就與技術資源密切相關：比如顯卡、顯存的限制或者算力的不足會直接影響效果；另一方面，視頻本身存在着大量的敘事邏輯，和對於劇情的完全可控，這導致了無法滿足理想的產品形態。於是就像字節的產品那樣，愛詩的產品設計也要很大程度從算法技術出發思考。

一開始大多數的視頻生產產品只能生成4s的視頻，但一個電影的平均單個鏡頭都有6秒，技術要進步如何突破時長，而產品則需要思考，即便是4s的視頻，能夠使用在什麼場景。

而即便是在4s的限制下，仍然能解決傳統的影視製作中，補缺一些空鏡頭和漏幀，解決重拍補拍的成本高昂的問題。

而且在底層大模型還在不停迭代的今天，對產品細節的追求，也要建立在技術差異之上，它甚至直接決定了產品的形態。Kimi和蛙蛙寫作看似都是文本生成類的大模型產品，但技術能力完全不同。

衆所周知Kimi擅長的是長文本的輸入，能夠一口氣讀完一本《三體》，但在應用中就會發現，Kimi的長文本輸出能力不夠強，無論給怎樣的提示詞，其輸出的內容經常爲1000字左右，所以Kimi的使用場景經常爲“修改部分論文”、“寫小紅書文案”等等。

而蛙蛙寫作作爲一款在創意文案生成上更垂類的產品，它的核心技術能力是長文本輸出和長期記憶，以小說功能作爲切入點，通過對小說的背景、任務、主線劇情進行設定，蛙蛙寫作往往能夠生成幾千字的小說內容，並能夠完整保存前序劇情。對於企業級的數據庫定製和固定文件的模仿輸出，也更遊刃有餘。

“在所有文本生成中，寫小說其實是最難的。它需要嚴格按照世界觀框架輸出、人物情緒刻畫要到位、人物臺詞要足夠擬人、故事反轉要緊扣設定等等。即便Sora是物理世界的模擬器，它仍然需要文字先將所有的前情全部設定好，再進行生成。未來文字創作內容將作爲底層，各個獨立的多模態技術真正要落地，還是要被底層所調用纔能有更大的價值”萬磊講道。

但相信產品依然是個“手藝活”的人們，並不會就此把一切都交給技術。

你可以看到，國內的通用大模型產品，在生成內容底部，往往會出現一個“點贊”和“點踩”的按鈕，這是人類自主給大模型進行的評價和反饋。

萬磊講道：“如果讓技術自己識別哪些生成內容是好的，哪些是不好的，靠技術實現很困難，但是在產品中加了一些設計，便可以反哺技術，讓生成結果越來越精準。”

更重要的是，在這個階段，產品是扔向市場的一個“鉤子”，只有不斷的使用、不斷反饋才能不斷迭代不斷進化。只有產品鉤得住用戶，之後的一切纔有意義。

“技術的高速發展最終的結果就是越來越同質化，這時候需要產品形成差異性，我認爲那時候產品經理的空間將會更大。”牧之說。

從做產品的方法，到所謂的產品哲學，再到產品與技術的關係，這些決定着中國AI未來走向的問題，某種程度都在延續着騰訊和字節在移動互聯網的故事，這兩個幽靈會繼續遊蕩在中國AI的上空。

騰訊和字節的幽靈在中國AI的上空徘徊

相關資訊