智能音箱將死,大模型燒紙

9月15日,有媒體報道稱阿里巴巴旗下“天貓精靈”將更名,並且已有XGENIE品牌字樣的新品在部分渠道露出。阿里方面相關負責人的迴應是,“確實計劃推出全新品牌,強化精靈屬於用戶的個性化特徵”。

“換號重練”的動作背後,是生成式大模型浪潮給已經沉寂的智能音箱行業刮來的一縷新風。

去年國內智能音箱的出貨量僅有2600萬臺,市場結構呈現出高度的集中化,小度、小愛和天貓精靈三家合計份額超過了90%。不過頭部這幾家整體的市場份額差距不大,百度是35%、小米是31%、天貓精靈則是27%,三分天下的結果意味着沒有一家邁過1000萬臺出貨量的門檻。

這個成績放在曾經被視爲下一代互聯網關鍵入口的智能音箱賽道上,即便不能說泡沫完全破裂,也是實實在在退了潮。站在今天回頭看,阿里2020年投入100億圍繞天貓精靈的戰略佈局,性價比大概還趕不上李彥宏當年拿200億做糯米。

不過在大模型涌現出更高水平的智能後,智能音箱這個行業似乎有了東山再起的可能。

先是在2月9日,小度宣佈將融合文心一言,打造針對智能設備場景的AI模型“小度靈機”,並會將其應用到小度全系產品中。

隨後4月11日的阿里雲峰會上,天貓精靈也宣佈將結合通義千問。兼任阿里雲CEO的張勇表示,未來天貓精靈希望能成爲“個性化的智能助手”,並推出了模仿脫口秀演員鳥鳥聲音和性格的“鳥鳥分鳥”。

小米這邊雖然本身在大模型方面的進度比互聯網大廠慢一些,但在上個月也已經開啓了小愛同學的AI大模型版本測試。

只是大模型雖然一片熾熱,但智能音箱的前景並沒有看起來那麼光明。

01、智能音箱是入口,先要智能家居管夠

當2014年Echo亮相時,其實賣得並不好,起碼在銷量上是如此,最初亞馬遜也只允許Prime會員或者受邀用戶使用該產品。但在Echo推出後不久,包括谷歌和蘋果在內的大廠就決定要做一款類似的產品,因爲它們認爲智能音箱會成爲用戶家庭生活的中心,尤其是作爲各類智能家居的接口。

這個邏輯後來得到了國內衆多企業的認可,他們相繼推出了自己的智能音箱產品,一時間消費者眼花繚亂。後來劇情走向跟互聯網科技行業的其他細分領域一樣,百度、小米和阿里依靠雄厚的資金實力完成了對其他玩家的圍剿,並把“三足鼎立”的市場格局保持到了今天。

只不過遺憾的是,突出重圍的玩家並沒有勝利果實可分。根據洛圖科技的數據,2022年國內智能音箱的全渠道銷量只有2631萬臺,同比下降了28%。今年上半年,行業萎靡的趨勢得到了保持,同口徑的統計數據是全渠道銷量1148萬臺,同比下降了19%;對應的銷售額爲33.7億元,同比下降了20%。

對於智能音箱市場的頹勢,一個可能的解釋是它所希望服務的對象羣體沒預想的多,消費者對智能家居產品的熱情沒那麼高。

從國內互聯網的發展歷史看,消費互聯網的步伐要比產業互聯網快得多。

當前用戶手機上所能看到的所有國民級軟件,在C端的用戶普及過程都是一條極其陡峭的增長曲線,微信和抖音都是典型的例子。比如,微信是2011年上線,到2016底的時候其月活就已經接近9億,基本等價於全面覆蓋了對應時點中國移動互聯網網民羣體。

而相較之下,產業互聯網的節奏要慢得多,即便是動靜最大的雲計算行業也是如此。在最初一批泛互聯網企業實現數字化上雲過後,後續傳統行業的拓客只能靠各大雲廠商龐大的銷售隊伍去艱難推進,以至於所有云廠商不得不把重心放到G端,因爲後者是目前最穩定的業務來源。

但在某一個細分領域,消費互聯網跟產業互聯網的位次卻恰恰相反,那就是智能設備或者說物聯網(IoT)。

有工廠的企業一般都有着較爲強勁的動力在車間裡裝上各式各樣的傳感器和機器人,這背後的原因既包括減少人工成本,也是因爲這樣做能在生產效率和安全性等方面有大幅提升。

例如,特斯拉成功的一個關鍵支點,就是使用大量自動化設備和軟件系統的超級工廠,馬斯克甚至將自動駕駛理念引入流水線。今天,國內汽車製造行業智能設備的滲透率已經達到了36.5%。

相較之下,C端的智能設備,也就是我們通常說的智能家居,在推廣應用上明顯落後。方正證券四月的一份研報裡,引用了Statista的數據,給出的當下中國智能家居滲透率僅爲13%。考慮到有衆多的所謂智能家居處於吃灰狀態,實際的利用水平可能比這個數據更低。

之所以呈現出這樣的分化,最根本的原因是工廠裡的智能設備是“剛需”,而家裡的智能設備可能連“雞肋”都算不上。

以本文關注的智能音箱爲例,大部分消費者把這個東西買回家,都是抹掉“智能”當作“音箱”在用,比如講講故事聽聽歌之類的。Rakuten Insight的調查結果就顯示,高達79%的擁有智能音箱的國內受訪者表示,他們使用智能音箱主要是爲了搜索音樂和播放歌曲。

由於各家此前採用的競爭戰略太激進,智能音箱的價格普遍難以覆蓋各個環節的成本。在“星辰大海”的夢想破滅過後,不得不祭出一些騷操作回血。像天貓精靈前幾年聽一些APP的會員歌曲是不用付費的,而如今即便你開通了音樂APP的會員,還需要進一步開通天貓精靈的會員才能聽歌。

其他的智能家居設備往往跟智能音箱差別不大,其實也沒有智能到足以在消費者羣體裡創造剛需價值。考慮到家用產品普遍經久耐用,如果沒有必要性,消費者採納新產品的時間會拖得比較長。IDC給的估計是,2022年全球智能家居設備出貨量將下降2.6%。(注意不要把這樣的降幅跟智能手機對比,智能手機已經滲透到頂了,但大量的傳統家居設備還沒被替代。)

另一個需要考慮的問題是,智能音箱跟不同品牌的各類智能家居設備的兼容性。阿里拿出100億元人民幣,重點就是圍繞天貓精靈打造生態上面。不過由於家電廠商往往傾向於不跟某家科技公司綁定,所以很多產品都支持接入不同品牌的智能音箱,基本的適配一般沒有問題。

02、大模型是革命,革智能音箱的命

當然,智能音箱過去幾年的命運轉折,顯然不能都歸咎到智能家居市場的整體狀況不夠給力。更主要的原因,仍然是智能音箱本身不夠智能。很多時候跟其他的人工智能產品一樣,智能音響表現出的行爲更偏向“人工智障”。

通常用戶只能給它下達極其簡單的指令,比如聽歌、看天氣、控制燈光或者給小孩講睡前故事。而一旦語音指令的結構略微複雜,或者涉及多輪交流互動的場景,智能音箱的表現就成了災難現場。

智能音箱的工作涉及三個流程,把用戶的語音轉換成文字指令,理解指令的意思並進行處理,然後是將處理的結果轉換成文本輸出。上述三個流程分別對應三種技術,自動語音識別(ASR),自然語言處理(NLP)和文本轉語音(TTS)。

其中,頭尾兩個語音和文本之間相互轉換的環節已經非常成熟,智能音箱的“智障”根源在中間的自然語言處理。而生成式大模型的出現,使計算機的自然語言處理能力發生了躍進。在一般的場景裡,GPT表現出來的溝通對話能力已經令一些人開始討論通用人工智能(AGI)跟我們的距離。

所以,毫無疑問生產式大模型確實能夠大大補足現有智能音箱不夠“智能”的缺陷。因此如《新立場》在本文開頭提到的,現有的頭部智能音箱大廠都在這方面有動作。而且從時間節點上看,大家都異常興奮和着急。比如百度2月9號說要在小度裡面集成文心一言的時候,文心一言還不知道在哪呢。

大模型或將給智能音箱帶來變革,這看起來的確是個成立的邏輯。除了各家智能音箱的廠家摩拳擦掌,行業內關注這個方向的媒體也充斥着類似的看法。

然而在《新立場》看來,大模型雖然解決了傳統智能音箱面臨的最大問題,但同時也徹底解構了智能音箱曾經設想的應用場景。

智能音箱從誕生以來,身上貼的最鮮豔的標籤就是“入口”,另一個同樣貼有這個標籤的東西是智能手機。如果大模型最終真的足夠智能,那麼決定智能音箱命運的關鍵,就是在“入口”這個角色上,它能不能競爭得過智能手機。

答案顯而易見,除了外放功率這個指標,所有智能音箱能幹的事,智能手機都能幹。而反過來,智能手機能完成的任務和跟用戶的緊密聯繫是智能音箱遠遠不及的。筆者瞭解到的一個場景是,有些用戶的家裡會有多個智能音箱,客廳臥室不同區域各放一個。如果你需要以一種優雅的方式,在家裡的各個地方對智能音箱發出指令,那這就是必須的。

所以,智能音箱跟智能手機相比基本沒有任何差異化優勢。

而在大模型面世後,由於大模型在通用智能上的驚豔,人們顯然會傾向於把大模型當作真正的個人助手或者夥伴,然後再通過它來解決儘可能多的問題。這種情況下,智能音箱的角色會被加速歸併到智能手機的個人助手,因爲那纔是真正不可替代的入口。

歸根結底,如果大家都是“人工智障”,用戶的使用需求不大,那我還不會那麼快取代你;而如果有了真正的人工智能,用戶的需求上來了,那他既會用這個人工智能助手幫忙寫PPT、查資料,也會跟他做溝通交流尋求情感安慰,當然也會用它控制家裡的冰箱、空調、電燈泡,而不是單單侷限於某個具體的場景。

03、寫在最後

一個有趣的事實是,在推出Echo之前,其實亞馬遜有個優先級更高的智能手機項目Fire Phone。如果不是智能手機項目的失敗,亞馬遜後來會不會推出Echo這個產品都需要打個問號。

在差不多十年時間過去後,智能音箱這個行業已經經歷了一輪完整的興衰。在生產式大模型爆發前,這個行業仍然存在的最大原因並不是用戶需要,因爲如果用戶需要的東西,他們會願意花公允價錢去買,而不是得廠家半賣半送。

在智能音箱這個行業眼看着要隨着慣性逐漸湮沒的時候,大模型來了。 但它不是強心劑,而是催命符。 智能音箱一開始就多餘,大模型來了就更多餘。

*題圖及文中配圖來源於網絡。