如何把商業交給大模型?京東科技何曉冬:需要更嚴肅地把大模型“幻覺率”降下來

從談參數、談技術,再到談協同、談應用,百模大戰初始的狂熱開始變得冷靜,今年,大模型公司們明顯變得更加務實、實際,市場也逐漸迴歸理性。

7月30日,京東雲對外發布了一系列產品,包括企業大模型服務、言犀智能體平臺、智能編程助手JoyCoder、言犀數字人3.0等。《每日經濟新聞》記者從京東雲方面瞭解到,目前在京東內部,有100多個AI場景,以及35萬自有配送員、23萬商家和2萬採銷都被大模型的應用覆蓋。

無論是否擁有產業一側的基因,大模型都開始在不同場景更實際地落地,大模型公司們也從參數和技術的比拼,來到了商業生態之上,端到端產品的較量。比如,今年以來一些雲廠商開始聚焦AI PC的落地,談起具身智能的前景等。

不過,在產業應用之前,大模型依然有很多待解的難題。京東探索研究院院長、京東科技人工智能業務負責人何曉冬認爲,想在更多產業側應用落地,其一就是需要更嚴肅地把大模型的“幻覺率”降下來。

也就是說,在答錯“13.8和13.11哪個數字大”,生成視頻畫面變形扭曲嚴重之時,你都還無法將自己的商業交給大模型。

談數字人直播:正在超越80%真人主播 關鍵在“零幻覺”

清華系大模型公司生數科技,今日(7月30日)在全球範圍上線視頻生成模型Vidu,全面開放文生、圖生視頻能力。Sora之後,從快手可靈到如今的Vidu,國內視頻生成大模型驚喜不斷。

不過,何曉冬指出,目前視頻生成大模型產品的幻覺率普遍還是很高。他舉例Sora的“漫步在東京街頭的女子”這則視頻,雖然整體視頻效果栩栩如生,但仔細觀察會發現,視頻中人物在行動時,左右腳交替時有扭曲的痕跡。

“這當然是瑕不掩瑜,也不能說這個技術不驚豔,但想把這種技術應用到商用場景下會出現很多問題。”何曉冬如此解釋。

這一點體悟來自於4月數字人劉強東直播帶貨的時候。當時劉強東數字人連續直播了4場,場觀都在千萬級以上,但同時引發的關注和爭議都很多。比如,採銷東哥數字人是否“一眼假”?形態、動作和口音的擬真程度有多高?當然,也有數字人馬雲何時出現的有趣討論。

在當下直播電商爆火的時代,主播其實是“稀缺品”,特別是跑出來的大主播,其實對其氣質形象、直播內容和產品服務的介紹專業度等都有着很高很複雜的要求。

“在過往的產業實踐中,通過一些有效的效果轉化指標,我們能看到數字人直播已經可以達到真人主播的均值。”何曉冬認爲,數字人直播除了需要具備零幻覺之外,還要有零樣本、大姿態和超寫實等幾個特性,做到真實、高效和可控。

不過他也指出,數字人直播要做的不是替代20%的優質主播,而是希望通過更個性化的角色和豐富的玩法,覆蓋80%需求還沒有被滿足的品牌。

今年“618”,數字人劉強東爆火後,董明珠等也在京東雲定製了數字人形象並上播。除直播外,數字人還活躍在文旅導覽、智能導購、金融客服、個人助理、政務諮詢等業態中。

談具身智能:重點聚焦服務型機器人

前幾天,香港投資管理有限公司正式宣佈投資具身機器人公司“銀河通用”,投資金額未披露。其實不久前,銀河通用纔剛宣佈完成天使輪融資,總規模7億元人民幣,投方包括藍馳創投、北汽產投、美團戰投、商湯國香基金、啓明創投、經緯創投、源碼資本等一衆明星機構。

具身智能是一個涉及人工智能、機器人學和認知科學的跨學科概念。它主要研究如何使機器或系統能夠通過身體(物理形態)與環境進行交互,從而實現智能行爲。簡單來說,其中的一種應用就是,系統通過執行器(如機械臂、輪子等)對環境進行物理操作,實現移動、抓取物體等行爲。

這自然也成了大模型及其相關技術產品一次更前沿的外延性應用和嘗試。銀河通用聯合創始人姚騰洲透露,銀河通用首款具身多模態大模型機器人Galbot率先應用在零售業完成上貨、取貨及盤點等工作任務,後續會探索社區養老、家庭服務等場景。

何曉冬在談及具身智能時認爲,具身智能是數字人走向物理世界的載體。而智能體、數字人、具身智能又是未來大模型與終端用戶的核心交互介質。記者注意到,京東探索研究院不久前發佈了國內首個雙臂移動機器人操作數據集JD ManiData。

在談及最新研究時,何曉冬透露,在基礎模型上,團隊正研發多模態具身智能的基礎模型,讓機器人的執行效率更高,動作更流暢。重點則是聚焦在服務型機器人產品上。

“在端側上我們也基於模仿學習,迭代端側多技能操作能力,在指令驅動下可以完成不同操作任務,爲的是可以做到更高價值的應用。”

伴隨大模型而來的AI、機器人浪潮不斷席捲資本市場。

這也不難讓人聯想到,繼去年12月數千萬元A輪投資後,前幾日,京東2億元再度戰略投資AI炒菜機器人公司橡鹿科技,目的是探索“機器人+”產業,在端側做更多AI、大模型技術的嘗試。

談Scaling Law和價格戰:只提升模型規模,天花板並不遠

今年5月,OpenAI推出了GPT-4o,並宣佈了免費試用政策,API調用的價格也比GPT-4-Turbo少了一半。大模型市場價格戰正式打響。7月18日,OpenAI推出最具成本效益的小模型GPT-4o mini。據OpenAI介紹,小模型產品是想通過顯著降低AI使用成本,擴大AI使用範圍。包括Meta、谷歌等科技巨頭也紛紛推出最新產品,並在價格上無一例外地開卷。

國內大模型價格戰也被點燃。5月6日,大模型公司DeepSeek深度求索宣佈將輸入價格降至1元/百萬tokens。隨後,字節跳動的豆包大模型、阿里巴巴的通義系列模型以及百度的文心一言模型等紛紛跟進,均採取了降價策略。

何曉冬認爲,價格戰在短期內的確可以帶來繁榮,但長期來看並不見得是件好事。“很可能連電費都付不起。”他坦言。

最直接的影響在於,短期內,價格戰有助於大模型在B端、C端等市場層面的普及。但犧牲短期利益,是否可以實現長期的用戶價值,實現規模化的應用,最終推動技術成爲基礎設施,這還需要打個問號。

何曉冬說:“我們看到一方面大模型技術在飛速發展,但目前也面臨一些問題,首先就是Scaling Law(規模定律)。由於數據和算力的持續限制,如果簡單只是提升模型規模,看起來這個天花板其實並不遠。某種意義上,我們的大模型從百億到千億再到萬億(參數)的增長,問題還是出現在其所帶來的經濟效益在何處。”

因此,他判斷,如果大模型帶來經濟效益不足以支撐大模型本身的成本的話,那麼這個模式是難以持續的。他還坦言,大模型的商業化落地,現在目前看起來還是稍微有些落後,從中長期看起來,會成爲一個問題。他覺得,產業和技術應該是互爲驅動的。