如今,標(biāo)準(zhǔn)、清晰的AI合成語(yǔ)音已經(jīng)深入日常生活,被廣泛應(yīng)用在語(yǔ)音助手、智能客服等領(lǐng)域。但如果你想在小說(shuō)閱讀或者影視配音場(chǎng)景下,使用同樣「平鋪直敘」的合成音色來(lái)演繹表達(dá)角色的性格特點(diǎn)、情緒起伏,那效果可能就要大打折扣了。不僅難以增強(qiáng)文本生動(dòng)性和感染力,也難以為用戶(hù)營(yíng)造身臨其境的沉浸感。
那有人就會(huì)問(wèn)了:
AI合成聲音能不能做到情感化配音,通過(guò)不同情緒來(lái)真實(shí)自然的展現(xiàn)人物的情感變化?
在不同的段落情節(jié)里,AI合成聲音能不能做到角色需要的例如哭泣、大笑、害怕等極具表現(xiàn)力的情緒需求?

為了讓AI合成聲音也能「哭」會(huì)「笑」,像真人一樣在語(yǔ)氣、語(yǔ)調(diào)、情感等方面表現(xiàn)自己,增強(qiáng)與之交流的用戶(hù)的融入感,標(biāo)貝科技通過(guò)對(duì)聲音感情的定義,推出情感合成方案,提供喜怒哀樂(lè)四個(gè)維度六種不同的情感表達(dá),讓聲音更富有表現(xiàn)力,提升更多場(chǎng)景下的語(yǔ)音交互體驗(yàn)。
自標(biāo)貝情感合成推出以來(lái),受到了廣大用戶(hù)的喜愛(ài),成為名副其實(shí)的配音神器,特別是在有聲閱讀場(chǎng)景,每個(gè)故事、小說(shuō)里都有大量的人物和情節(jié),用戶(hù)可以根據(jù)情節(jié)發(fā)展需要,搭配不同的情感聲音,推動(dòng)故事的轉(zhuǎn)承起伏,讓有聲讀物更有"人情味"。
近年來(lái),"虛擬偶像"和"元宇宙"爆火,為了滿(mǎn)足更多細(xì)分場(chǎng)景應(yīng)用,標(biāo)貝科技再次推出二次元情感合成發(fā)音人--未眠小姐姐,打破虛擬偶像發(fā)音機(jī)械感強(qiáng)、無(wú)法場(chǎng)景化、需要人工反復(fù)調(diào)節(jié)聲音參數(shù)導(dǎo)致不穩(wěn)定等難題,讓虛擬偶像的形象更為鮮活。

[高興]
[生氣]
[驚奇]
[悲傷]
[恐懼]
[厭惡]
未眠小姐姐發(fā)出的喜、怒、哀、懼配音都是由標(biāo)貝情感合成技術(shù)完成。用戶(hù)可以明顯感受到人物每一句聲音情感的變化,當(dāng)想要表達(dá)高興的情緒時(shí),合成聲音會(huì)展現(xiàn)歡快喜悅的聲音;表達(dá)悲傷的情緒時(shí),則顯現(xiàn)憂愁凄涼的聲音;表達(dá)憤怒的情緒時(shí),則是郁悶生氣的聲音;表達(dá)害怕的情緒時(shí),則是慌張?bào)@恐的聲音。

據(jù)標(biāo)貝科技相關(guān)語(yǔ)音負(fù)責(zé)人介紹,如何讓聲音富有情感和表現(xiàn)力一直是語(yǔ)音合成技術(shù)的一大難點(diǎn)。為了保證合成語(yǔ)音的真實(shí)、自然,標(biāo)貝情感合成依托于成熟的深度學(xué)習(xí)技術(shù),通過(guò)強(qiáng)大的情感數(shù)據(jù)庫(kù),不斷對(duì)合成模型進(jìn)行優(yōu)化訓(xùn)練,最終實(shí)現(xiàn)高音質(zhì)、高自然度與多情感的聲音表現(xiàn),在韻律表現(xiàn)、聲音層次感、情感表達(dá)等方面均接近真人表達(dá),充分滿(mǎn)足用戶(hù)的個(gè)性化需求。
標(biāo)貝科技情感合成技術(shù)特色
●多情緒自然切換
告別只會(huì)一個(gè)音調(diào)的 "機(jī)械音",標(biāo)貝情感合成提供真實(shí)自然的開(kāi)心、憤怒、悲傷、驚訝、恐懼、厭惡六種情緒下的聲音,讓AI機(jī)器和人一樣能"哭"會(huì)"笑",以聲傳情,適用于不同情境下的不同語(yǔ)意表達(dá)。
●音色效果真實(shí)飽滿(mǎn)
標(biāo)貝情感合成基于成熟的深度神經(jīng)網(wǎng)絡(luò)技術(shù),并結(jié)合TTS3.0新一代高音質(zhì)合成系統(tǒng),使音色達(dá)到自然的抑揚(yáng)頓挫、情感起伏,帶給用戶(hù)幾近真人,流暢舒適的聽(tīng)覺(jué)體驗(yàn)。
●場(chǎng)景音色定制化
標(biāo)貝情感合成方案可以充分滿(mǎn)足有聲閱讀、兒童教育、車(chē)載、泛娛樂(lè)等多場(chǎng)景應(yīng)用需求。例如,針對(duì)有聲閱讀場(chǎng)景,標(biāo)貝情感合成可以針對(duì)風(fēng)格適配度、情感連續(xù)性、段落疲勞度進(jìn)行更加契合的語(yǔ)速和語(yǔ)氣,保證合成的效果足夠接近真人且具有沉浸感;在泛娛樂(lè)虛擬偶像應(yīng)用里,讓虛擬人具備和真人一樣的情感表現(xiàn)力,互動(dòng)更加生動(dòng)有趣。
情感合成有效改變了傳統(tǒng)的人機(jī)交互模式,實(shí)現(xiàn)人與機(jī)器人的情感交流。未來(lái),隨著AI技術(shù)對(duì)聲音應(yīng)用領(lǐng)域賦能進(jìn)一步落地,更多智能化的娛樂(lè)生活場(chǎng)景必將到來(lái)。標(biāo)貝科技將持續(xù)加大技術(shù)創(chuàng)新投入,不斷優(yōu)化完善情感合成方案,打造更有溫度的情感聲音,助力場(chǎng)景化應(yīng)用升級(jí)。