火山引擎首發(fā)“會表演”的有聲內(nèi)容創(chuàng)作平臺
2023-08-09 21:33:39 | 來源:互聯(lián)網(wǎng) |
2023-08-09 21:33:39 | 來源:互聯(lián)網(wǎng) |
近日,火山引擎正式推出有聲內(nèi)容創(chuàng)作平臺。該平臺歷經(jīng)2年研發(fā),相較傳統(tǒng)平臺,其具備多情感演繹和自動化預(yù)測兩大優(yōu)勢。
據(jù)了解,多情感演繹上,有聲內(nèi)容創(chuàng)作平臺的“聲音超市”不僅提供70余款適配不同題材的精品音色,還可通過豐富的情感實現(xiàn)更精彩的演繹;自動化預(yù)測層面,平臺的AI自動區(qū)分文本中的對話和旁白、識別對話的情感,整體合理率高達90%以上。
(資料圖片僅供參考)
目前,火山引擎也針對新用戶開展了5折限時特惠活動,感興趣的用戶可前往火山引擎官網(wǎng)獲取優(yōu)惠。
70余款精品音色,情感更豐富的聽覺體驗
火山引擎的AI配音家族已擁有70余款精品音色,覆蓋各年齡段不同風格的精品音色,可適配各類題材,滿足不同企業(yè)和用戶的有聲創(chuàng)作需求。
火山引擎精品“聲音超市”
“副語言”也稱“類語言”,是指伴隨話語出現(xiàn)的某些聲音現(xiàn)象,例如停頓、重音、語速、語調(diào)等,以及言語的功能性發(fā)聲,例如笑聲、哭腔、咳嗽等。在有聲內(nèi)容創(chuàng)作過程中,僅有音色數(shù)量上的積累并不夠,為了讓AI主播像專業(yè)配音演員一樣演繹出更深層次的“人類情感”,火山引擎為AI音色賦予了多樣的聲音情緒和“副語言”。
自動化預(yù)測工具,為業(yè)務(wù)降本增效
在精品AI有聲內(nèi)容制作中,需要人工對文本進行標注制作,尤其是長文本中,需要區(qū)分人物角色的臺詞以及對應(yīng)情感。這一過程耗時耗力,是造成精品AI有聲內(nèi)容很難大規(guī)模批量生產(chǎn)的原因。
針對這一痛點,火山引擎自研「AI 文本理解」模型 ,自動預(yù)測人物和情感,包括提取文本中對話人物、自動判定情感等能力。
在整體聽感與純?nèi)斯俗⒌男ЧR平的前提下,AI文本理解模型可以解放大部分的標注人力,大幅縮減標注的時間和成本,為企業(yè)降本增效。
「AI 文本理解」模型
在火山引擎「AI有聲內(nèi)容創(chuàng)作平臺」中,
● 用戶只需將目標文本導(dǎo)入,由平臺自動完成人物的抽取、并判定對話所屬的人物和情感;
● 在配音環(huán)節(jié),用戶可以自主選擇配置AI音色來匹配人物,也可選擇簡單標定角色人設(shè),依據(jù)平臺內(nèi)置策略一鍵配音;
● 配音完成后,平臺會根據(jù)自動預(yù)測的信息完成音頻的自動合成和拼接。
AI有聲內(nèi)容創(chuàng)作平臺
未來,火山引擎會持續(xù)投入有聲內(nèi)容創(chuàng)作平臺的建設(shè)與創(chuàng)新,在底層技術(shù)和實際應(yīng)用層面不斷探索從“文本”到“有聲作品”全流程的一體化智能創(chuàng)作方式,為用戶打造更好的使用體驗。