所有耳機都應該被AI重做一遍?硬件公司已經邁出了第一步

“所有的產品都值得用AI重做一遍。”微軟CEO薩提亞·納德拉一句展望時代的話,成爲了AI硬件行業的創業聖經。一羣消費電子行業的創業者正試圖用AI闖出一條新路。

耳機成爲首選賽道之一,越來越多植入AI功能的耳機在市場涌現。蘋果剛剛推送的Apple Intelligence中就首次加入了通話錄音功能,小米近期發佈的Xiaomi Buds5也同樣支持通話錄音,這被視爲語音智能交互的第一步。

初創公司中,未來智能推出的iFLYBUDS系列、時空壺翻譯耳機,WISHEE強調聊天陪伴功能的Ai Ear,以及主打“AI+音頻”的塞那,都在近幾年連續推出新品。

今年5月,字節跳動收購開放式耳機品牌Oladance,也被認爲是佈局AI硬件賽道的一種準備。錘子科技創始人羅永浩以及前魅族CMO李楠成立的怒喵科技,同樣將推出智能耳機產品。

在AI耳機領域,未來智能是很難繞過的一家廠商。2023年,科大訊飛耳機團隊獨立,成立主攻AI硬件賽道的未來智能。這家公司主要瞄準會議及辦公場景,陸續推出iFLYBUDS Pro、iFLYBUDS Air、iFLYBUDS Nano+等多款會議,支持錄音轉寫、智能轉譯、會議整理等功能。

未來智能CTO王鬆在接受界面新聞專訪時表示,所有佈局AI耳機或智能硬件賽道的公司,本質上還是在押注下一代人機交互變革的機會。一種觀點是,語音是未來人機交互的入口,而耳機則是天然與語音掛鉤的設備,它並不容易被手機完全替代掉。

但耳機值得被AI重做一遍嗎?王鬆的答案是兩面的。在他看來,如果加上時間維度,的確所有的產品都值得被AI重做一遍,但現階段這句話並不適用。

原因在於,由於耳機本身算力有限,大部分AI能力也只能寄居在手機上,依賴於手機的算力和網絡能力。以現有的芯片與電池續航水平來看,耳機還很難成爲一個獨立的計算產品。

IDC曾預測,2024年,中國市場上搭載AI功能的終端設備將超70%,AI終端佔比將達55%。但僅搭載生成式AI功能,與AI真正成爲核心驅動力,仍然是兩件完全不同的事。

媒體曝光的OpenAI AGI路線圖顯示,OpenAI將AI劃分爲5個等級。其中,L1爲聊天機器人,是具有對話能力的AI;L2爲推理者,像人類一樣能夠解決問題的AI;L3爲智能體,指不僅能思考,還可以採取行動的AI系統;L4爲創新者,能夠協助發明創造的AI;L5爲組織者,可以完成組織工作的AI。

OpenAI認爲其AI模型正處於L1,但很快就會達到L2(推理者)。而根據該公司前研究員預測,L5級AGI最快將在2027年實現。

王鬆預計,要等到L3,也就是智能體階段落地後,才能談真正的AI耳機。目前包括未來智能在內,所有耳機廠商的探索都還處於非常原始的雛形階段。

“真正的智能耳機有一個重要的先決條件,它必須是一個可獨立聯網、獨立運算的設備,即便脫離了手機也能夠使用。”王鬆指出,有了這兩項能力,耳機就能不依賴屏幕,獨立執行一些操作,例如叫外賣、打車,打電話、聽音樂等等,大約可以佔日常手機操作的10%。

即便如此,也需要技術的突破。相比其它硬件設備,耳機的體積偏小,這就限制了芯片和電池的體積,進而限制了算力與續航。事實上,這也是當前所有可穿戴設備面臨的挑戰。最典型的例子是,算力強大如Vision Pro也仍離不開外掛電池。

軟件同樣需要革新。手機和PC的交互遵循菜單層級結構,但耳機無法遵循這套交互邏輯,因爲它無法像手機那樣,一層一層地去用語音打開新的菜單。它需要把所有的功能平鋪開來,通過語音一步直達,這則需要軟件的改造和產品設計的更新。

未來智能在耳機獨立運算層面進行了一些探索。例如,iFLYBUDS主打的錄音功能可以做到單獨運行,而不依賴手機。但想要實現更復雜的功能並不容易。

一個行業共識是,在電池和芯片出現突破性進展之前,手機仍然會是最重要的計算平臺。但手機也有無法實現的功能,這是留給AI硬件的機會。

據王鬆透露,公司內部在做一些研究,例如能夠實時偵測周圍環境的功能,包括處於什麼地方、周圍有哪些人。如果用手機只能通過舉起攝像頭來實現,但這很怪異的,也無法每時每刻都舉着攝像頭。但一副耳機或者眼鏡,就能夠利用傳感器來監測。

未來智能內部有許多類似的探索,但由於目前大模型能力有限,很難做到100%的準確率,也無法把類似功能快速推上線。他們擔心當有偏差或幻覺時,會對用戶造成非常大的影響。倘若大模型的能力達到某種閾值,則可以馬上上線類似的功能。

自從蘋果在2016年推動TWS (True Wireless Stereo,真無線)耳機爆發之後,耳機行業已經許久未現突破性的技術革新。在AIGC行業苦於尋找落地場景的當下,耳機廠商試圖證明耳機承載的音頻創新是最理想的應用之一。他們正在摸索,等待智能硬件迎來一場新的爆發。