字節跳動全量開放豆包即時語音大模型
綜合港媒報導,字節跳動豆包大模型團隊表示,新發布的豆包即時語音大模型是語音理解和生成一體化的模型,相比傳統級聯模式,在語音表現力、控制力、情緒承接方面表現驚豔,並具備低時延、對話中可隨時打斷等特性。
豆包團隊稱,該模型的推出具備里程碑式意義,不僅貼閤中國用戶實際需求,且發佈即上線,有能力直接服務億萬用戶,而非停留在演示Demo層面;端到端語音能力加持下,豆包不僅是春節探親歡聚的神隊友,還是獻唱恭喜發財的高情商歌手。
豆包引述一些外部用戶的反饋稱,該模型整體滿意度較GPT-4o有明顯優勢,特別是語音語氣自然度和情緒飽滿度遠高於後者。
字節跳動公佈的數據顯示,豆包大模型上月日均tokens使用量超過4兆,較去年5月發佈時期增長超過33倍。這表明其AI產品受廣泛歡迎,並正迅速獲取用戶。
報導稱,對互聯網公司來說,春節假期意味更高的用戶活躍度和更大的流量,是推廣新產品或服務的好時機。字節跳動在農曆春節前夕發佈該產品,目標或是藉助傳統節日進一步快速獲客。