火山引擎首發“會表演”的有聲內容創作平臺

(原標題:火山引擎首發“會表演”的有聲內容創作平臺)

近日,火山引擎正式推出有聲內容創作平臺。該平臺歷經2年研發,相較傳統平臺,其具備多情感演繹和自動化預測兩大優勢。

據瞭解,多情感演繹上,有聲內容創作平臺的“聲音超市”不僅提供70餘款適配不同題材的精品音色,還可通過豐富的情感實現更精彩的演繹;自動化預測層面,平臺的AI自動區分文本中的對話和旁白、識別對話的情感,整體合理率高達90%以上。

目前,火山引擎也針對新用戶開展了5折限時特惠活動,感興趣的用戶可前往火山引擎官網獲取優惠。

70餘款精品音色,情感更豐富的聽覺體驗

火山引擎的AI配音家族已擁有70餘款精品音色,覆蓋各年齡段不同風格的精品音色,可適配各類題材,滿足不同企業和用戶的有聲創作需求。

火山引擎精品“聲音超市”

“副語言”也稱“類語言”,是指伴隨話語出現的某些聲音現象,例如停頓、重音、語速、語調等,以及言語的功能性發聲,例如笑聲、哭腔、咳嗽等。在有聲內容創作過程中,僅有音色數量上的積累並不夠,爲了讓AI主播像專業配音演員一樣演繹出更深層次的“人類情感”,火山引擎爲AI音色賦予了多樣的聲音情緒和“副語言”。

自動化預測工具,爲業務降本增效

在精品AI有聲內容製作中,需要人工對文本進行標註製作,尤其是長文本中,需要區分人物角色的臺詞以及對應情感。這一過程耗時耗力,是造成精品AI有聲內容很難大規模批量生產的原因。

針對這一痛點,火山引擎自研「AI 文本理解」模型 ,自動預測人物和情感,包括提取文本中對話人物、自動判定情感等能力。

在整體聽感與純人工標註的效果齊平的前提下,AI文本理解模型可以解放大部分的標註人力,大幅縮減標註的時間和成本,爲企業降本增效。

「AI 文本理解」模型

在火山引擎「AI有聲內容創作平臺」中,

● 用戶只需將目標文本導入,由平臺自動完成人物的抽取、並判定對話所屬的人物和情感;

● 在配音環節,用戶可以自主選擇配置AI音色來匹配人物,也可選擇簡單標定角色人設,依據平臺內置策略一鍵配音;

● 配音完成後,平臺會根據自動預測的信息完成音頻的自動合成和拼接。

AI有聲內容創作平臺

未來,火山引擎會持續投入有聲內容創作平臺的建設與創新,在底層技術和實際應用層面不斷探索從“文本”到“有聲作品”全流程的一體化智能創作方式,爲用戶打造更好的使用體驗。