一年融資12億的銀河通用也面臨數據缺失難題
獲國內具身智能賽道最大融資額的公司來了。
11月18日,界面新聞獲悉,北京銀河通用機器人有限公司(下稱銀河通用)完成5億元戰略輪融資,加上今年6月宣佈的7億元天使輪融資,累計融資12億元,創下該賽道融資紀錄。
本輪投資方包括上汽集團恆旭投資、香港投資公司HKIC、上海人工智能產業基金、北京機器人產業基金、深創投、建銀國際、智友科學家基金、容億投資、金景資本等,同時老股東IDG、經緯、藍馳、北京人工智能產業基金等繼續大幅追加投資。
值得注意的是,銀河通用背後已經站了超過30家投資方,包括美元投資人、知名科研機構、產業戰略投資人,同時集齊了從中央到北京、上海、香港、深圳四大政府基金的共同加持,這一情況在創投行業並不多見。
今年初到現在,具身智能正在接替大模型,成爲AI融資的熱點。近日,藍馳創投合夥人曹巍便感嘆,每兩週就會有新的具身智能機器人Demo面世。銀河通用創始人兼CTO、北京大學助理教授王鶴也頻繁現身不同活動。
“不要認爲具身智能就等於具身AGI。”近日,王鶴在藍馳創投的一場論壇上表達了這樣的觀點。包括他在內的多位行業人士認爲,具身智能領域仍面臨數據缺失難題。
王鶴指出,通用機器人背後的技術一定是具身大模型,要用數據驅動基礎機器人大模型,讓機器人能夠有極高泛化性(模型經過訓練後,能夠應用到新數據並做出準確預測的能力)、零代碼部署能力和跨行業應用能力。這背後就需要海量的自研合成數據,10億級別的靈巧手抓取數據去訓練大模型,讓大模型真正擁有泛化性,而不被真實世界能夠採集的數量所侷限。但現有數據不足以支持通用機器人的發展。
另一個重要問題在於,用什麼方法來獲取數據。靈初智能創始人兼CEO王啓斌在上述論壇上指出,具身智能行業的數據有三個發展階段,一是公司內部實驗室的數據,二是國內大部分正在建設的數據中心,三是在真正的頭部客戶的搜索中使用。這三個階段中,數據一定是關鍵的驅動因素。
智元新創技術有限公司研究院執行院長兼具身業務部部長姚卯青也同意這一觀點,認爲具身智能發展的核心仍然圍繞AI的主要元素,即算法、數據和算力。
姚卯青指出,大模型有海量的免費互聯網和圖文本數據可以直接獲取,而具身智能更多需要虛擬或現實中操作的關節本體的詳細數據。目前這些數據是缺失的,常用的谷歌數據只有100萬條,與大公司數十億token相比,差距很大。“如果數據能突破,很多初級應用可能會快於我們的想象。”
爲了解決數據不足的問題,當前,銀河通用等公司主要採用合成數據用於訓練和泛化模型。據王鶴透露,銀河通用內部除了採用VLA範式(Vision-Language-Action Model,一種多模態模型)解決真實場景的數據鏈問題外,還在三維表徵基礎上進行強化學習。該團隊創建了一個10億規模的數據集,覆蓋各種物體,進行大規模抓取標籤生成,這個數據集使其訓練的擴散模型能夠以90%以上的成功率抓取任何給定物體。
其內部的Aloha項目也會通過合成數據解決複雜任務,如訓練機器人疊衣服——通過在仿真環境中對數萬件衣服進行合成仿真,最終訓練出能夠處理各種衣服的能力。
但王鶴也強調,具身智能真正的變化需要10億條以上的合成高質量數據來驅動泛化,目前全世界沒有看到公佈的技術能做到這一點。
“高質量的仿真數據將推動移動抓取放置的迅速泛化,打造真正的基礎模型。”王鶴預測,未來兩到三年,機器人能夠在貨架場景中進一步推進抓取放置;未來三到五年,銀河通用的目標是把落地做得越來越泛化,進而發展出一個千億規模的人形機器人公共抓取放置市場。
中長期來看,該公司希望把抓取放置不斷向更深的技能延展,例如掛衣服的能力,包括對柔性物體的捏、抓、拉等動作。而要讓人形機器人獨立完成整個洗衣週期,可能發生在五年後,這將是走向家庭端的殺手級應用。