元宇宙聊天室|人形機器人何時實現規模化?

“下一波人工智能浪潮,具身智能會是一個非常核心的方向,相當於是連接了虛擬空間和真實空間的橋樑。”在剛剛結束不久的世界人工智能大會(WAIC 2024)上,談及“具身智能”和“人形機器人”的關聯,來自科大訊飛股份有限公司的機器人首席科學家季超說。

過往一年,大模型技術的出現讓機器人擁有了“大腦”,實現了知行合一,在物理世界裡感知、理解物理世界。如何理解具身智能?人形機器人與具身智能兩者之間的關聯在哪裡?人形機器人落地商業化場景中有哪些難點?

2024WAIC大會期間,澎湃科技(www.thepaper.cn)邀請北京大學助理教授、北大-銀河通用具身智能聯合實驗室主任王鶴、科大訊飛股份有限公司機器人首席科學家季超和藍馳創投合夥人曹巍,做客“元宇宙聊天室”,暢談當下具身智能和人形機器人的關聯,以及人形機器人未來發展的技術路徑和當前面臨的難點。

以下爲直播摘要

具身智能是未來技術發展的趨勢

澎湃科技:此次2024WAIC,具身智能的概念非常火,各位是如何理解具身智能這一概念的?具身智能和人形機器人之間的關係該如何釐清?

王鶴:具身智能強調的是機器人的智力能力,人形機器人強調的是機器人的本體即身體。這兩點結合,與現有的專用機器人相比,具備革命性的下一代機器人就是通用機器人,即具有人形的本體,有極高的靈活度、和人最相似、通用性最好。

具身智能則是在人形機器人的身體之上發展能夠根據人們的需求去執行泛化的通用的操作和移動的能力。當具身智能和人形結合在一起,未來會有極大的市場規模。

季超:人形機器人的概念其實在幾十年前就已經提出來。具身智能最大的兩個特點,一是知行合一,二是讓機器人用通用的方式來執行不同的任務、場景。在這個過程中,具身智能和人形機器人結合,我們更願意稱爲未來的具身通用機器人,來執行較爲複雜的任務。

不過,我們需要區分兩個概念,工業機器人或專用機器人和通用機器人是兩個概念。專用集成邏輯效率高,但不夠泛化;而通用機器人帶來泛化性,但效率較低,沒有專用機器人那麼高。

曹巍:具身智能,是人工智能在物理世界的進一步延伸。具身智能的價值體現在機器人在物理世界裡感知、理解物理世界,以及實現了與物理世界高頻交互;具身智能作爲非常具有特色的技術棧,這幾年有很大的變化。

2016年,當時藍馳創投在投資理想汽車、高端機器人時,看到的變化是機器人在空間定位、導航等技術上的能力在提升,以及激光雷達感知成本的下降;現在機器人有新的技術棧出現,在技術變化帶領下,讓機器人去理解物理世界、實現高頻複雜的交互,這將會是巨大的力量。

澎湃科技:具身智能是不是下一波的浪潮?上一代機器人的技術路徑又是怎樣的?

王鶴:工業機器人比如機械臂,永遠沿着既定的軌跡去操作,是一成不變的,即“專爲一件事而生”。效率顯然很高,成功率也很高,但除了擰螺絲、移動車門等,它幹不了任何其他事情,複雜程度不夠。

從專用機器人到具身智能,核心是通過一個身體幹很多事情,在這個過程中,對機器人的感知、決策和執行,三個環節都能夠泛化、隨機應變地去處理。

從感知的角度,多模態大模型是唯一能夠應付各種開放環境和開放任務感知需求的。留給我們的問題是如何將大模型技術很好地與具身智能融合在一起。

季超:從本質上講,具身一定跟本體相關。我們認爲,下一波人工智能浪潮,具身智能會是一個非常核心的方向,相當於是連接了虛擬空間和真實空間的橋樑。在這個過程中,特別是以人形機器人爲代表的通用機器人能實現具身智能和大模型的結合。

我們認爲,未來在一些多品種、少批量通用泛化的場景下,人形機器人有巨大的商業價值。

算賬的邏輯也很清楚。過去工業機器人非常核心的效能體現在成本里。未來,一個機器人可以在開放的場景裡執行多任務,成本可以得到極大的分攤。從技術的發展演進路線來看,這毫無疑問是未來發展的趨勢。

曹巍:工業機器人非常強調圍繞現場作業的能力,當通用具身智能機器人真正實現時,機器人將不再侷限於原始的精度維度,從而走向更智能的程度,對任務的理解能力和實現閉環的能力都將有巨大的提升。

落地難點:數據、成本、場景

澎湃科技:具身智能的浪潮會持續多久?在這個過程中,面臨的技術難點又會有哪些?

曹巍:從具體的落地視角來看,第一點要突破數據。王鶴老師也在最近的分享中強調,數據是人工智能的前提,沒有數據,人工智能無從談起。如何訓練數據達到理想的效果,來解決關鍵場景中的問題,這是目前需要突破的核心問題。

第二點,從項目的角度來看,當前的營銷存在許多問題。首先,機器人的結構非常複雜,導致耗電量很高,成本非常昂貴。在落地層面上,機器人的價格昂貴,也過於嬌貴,容易損壞。因此,在機器人末端執行上,能在市場競爭力和耐用性兩方面都做好非常重要。

第三即對場景的深度理解。

王鶴:對於具身智能快速發展的前沿技術,要考慮技術能否支撐產品。通用機器人和專用機器人不一樣,成功率、耐用度都需要技術進一步的發展,才能在專用場景裡和專用機器人匹敵。在技術滿足產品標準之後,還需要考慮定價問題。比如,現在國際知名英國公司生產的單隻靈巧手售價高昂,應用領域也較爲單一。我們認爲,未來在靈巧手上,要真正實現PMF(Product-Market Fit:產品市場契合度)。

季超:GPT模型的底層邏輯是通過大量數據、算力的堆疊,最後呈現出驚豔的效果。但對於具身智能機器人來說,面臨的問題更復雜。

一是數據稀缺,儘管語音和圖像數據可以通過互聯網獲取進行標註訓練,但機器人需要的特定場景數據極爲稀缺。譬如以谷歌的機器人學習項目爲例,通過大量工程師和資源投入,構建了有限的數據集,花了大概一千多萬美元,最後才實現了比較好的效果。

另外,算力也是一個不可忽視的因素。現在大家都在講雲端算力,其實端側算力的壓力更大。未來,計算機能力將基於強大的視覺和多模態感知,而不僅僅依賴雲端算力。

所以,高端算力芯片的研發是一個亟待突破的點。在此,需要思考如何從應用角度來針對具體的任務構建合適的具身小模型。

我們認爲,當前人工智能對數據、算力的要求極大,短期內投入產出的走向可能不會那麼正向。

澎湃科技:關於現階段機器人投入、產出方面,三位能否展開討論。

王鶴:現階段我們在思考有沒有比雙腿落地更成熟、成本更可控的方案。銀河通用提出了360°萬向輪盤底,它能跪下,抓取地面的東西,當實現大規模量產後,成本可能更會逐步降低。

機器人落地商店、工廠,還涉及到一定的落地部署費用。我認爲應該要實現自動部署、開箱即用,把這項成本也省掉。

至於算力成本,未來人形機器人端側算力芯片是否會繼續用英偉達新推出的芯片,還是會出現更好的國產芯片,我們拭目以待。

曹巍:我給大家一點信心,在2016年、2017年時,藍馳創投投資的一款商業清潔機器人“高仙機器人”,最初售價在五十萬元左右,現在,這款機器人的平均售價已經比那時下降了90%。所以,機器人的價格一定會隨着傳感器成本的下降而下降,中國的製造業非常強大。

季超:研發機器人的目的是替代人,或者幫助人類做事情。機器人可以幫助降低商業運營的成本、提升效能,比如機器人可以7*24小時無休。未來,機器人在工業場景裡有大的戰略意義。中國有非常雄厚的工業基礎和健全的產業鏈,國內的企業也非常善於把成本降下來。

但我們也要清楚地認識到技術發展的侷限性。比如,在六十分的技術基礎上,如何通過產品的場景去設計出八十五分甚至水平更高的產品,這才能真正意義上推動人形機器人實現正向循環。

人形機器人當前正處於萌芽期

澎湃科技:李開復此前曾在公開場合提到,他一家人形機器人都沒投,他認爲沒有必要做人形機器人,你們怎麼看這種觀點?人形機器人的必要性到底在哪裡?

曹巍:現在有一派觀點較爲激進,認爲人形機器人萬能;另有一派聲音比較理性,站在中間,即追求實現通用人形機器人;還有一派比較保守,認爲人形機器人沒用。我自己保持客觀中間的狀態。

垂直場景的機器人有些可以成爲爆款產品,它們也將參與到市場競爭中。但我們不能因爲人形機器人在某些場景中難以應用,就認爲它們沒有競爭力。王鶴老師提到,人形機器人以其超強的通用能力和場景適應性,滿足了人類生活場景的需求。未來,我們可能會看到人形機器人操作工程器械或使用尚未智能化的工具,這將是一個令人興奮的發展。

同時,我們也必須認識到,人形機器人的發展速度可能並不像我們期望的那樣快。因此,希望大家能夠客觀地、基於需求特點和機器人技術發展的路徑與節奏來看待這個問題,不應過於保守,也不應過於激進。

王鶴:我的看法是永遠不要對短期科技的爆炸產生過高的期待,但也不要忽略遠期科技的成長將會帶來的鉅變。人形機器人在今天還處於萌芽期,在未來三到五年時間內,可能會在一系列需要柔性操作的場景裡看到它。

季超:不要對當前的技術爆炸的現象產生過高的期望,這樣會產生泡沫,但泡沫也有好有壞。

技術的發展是一個螺旋式往上發展的過程,近期,我也正在參與關於人形機器人和具身智能結合關於標準的界定。從另外一個視角來看,首先大家對於人形機器人的通用技術規範概念的界定還不夠清晰。還有,具身智能的概念到底是什麼?在這方面,大家的認知還沒有統一。

從產業的視角來看,我們比較明確的衡量標準,是能否以客戶爲中心的目標場景下,能夠完成當下技術顛覆。

另外,我們一直崇尚的是,從研究中實時追蹤最先進的技術,去產業中探索顛覆式的技術。

現在機器人的硬件成本售價在不斷降低,前幾年大家看到先進技術願意爲其買單,這種買的其實是“智商稅”,買的是價值認知。現在,真正的技術應用落地正在發生,產業界對此也非常興奮。長期來看,一定會有更加顛覆性的技術產生,也會出現顛覆性的產品。