用戶:對(duì)的,請(qǐng)問(wèn)有什么事嗎?(糟糕,這低沉且磁性的聲音是我喜歡的)
客服:哈~看到您修改了地址,那按照最新地址給您派送可以嗎?
用戶:好的······可以要一下您的私人聯(lián)系方式嗎?(害羞······)
客服:非常抱歉,我是智能客服哦~快遞將會(huì)按照新的地址給您派送,再見(jiàn)。
用戶:額,好的,再見(jiàn)。(震驚!智能客服的聲音都這么驚艷了嗎?)
不得不說(shuō),在科技飛速發(fā)展的今天,智能語(yǔ)音無(wú)處不在,他們或溫柔、或磁性、或俏皮,用富含各種情感色彩的語(yǔ)音服務(wù)著我們的生活。
語(yǔ)音合成技術(shù)為機(jī)器人裝上了嘴巴,而音色合成則豐富了機(jī)器的情感表達(dá)。那么,在時(shí)間就是成本的情況下,如何簡(jiǎn)單、快速、低成本打造適合自己業(yè)務(wù)的專屬音色?
思必馳推出的發(fā)音人音色定制平臺(tái),助力用戶快速、高效、自主完成語(yǔ)音合成音色模型定制,降低語(yǔ)音合成定制門檻。用戶只需要根據(jù)自身場(chǎng)景需要,上傳一定量符合規(guī)定標(biāo)準(zhǔn)的有效音頻,即可一站式完成自動(dòng)標(biāo)注、模型定制、質(zhì)量評(píng)測(cè)等流程,高度模擬發(fā)音人的音色、韻律和停頓習(xí)慣,獲得所需音色。
1、音色合成,讓人機(jī)溝通更有溫度
智能語(yǔ)音作為人類與機(jī)器溝通的途徑之一,廣泛應(yīng)用于生活和工作場(chǎng)景。而不同情感的音色,為人機(jī)交互賦予了情感溫度。
思必馳發(fā)音人音色定制平臺(tái)支持定制中英文、成人男女、兒童以及幽默、嚴(yán)肅、甜美、中性等各種情感風(fēng)格的音色,可滿足客戶在消費(fèi)電子產(chǎn)品、明星動(dòng)漫熱門IP、虛擬數(shù)字人、智能客服、有聲讀物、新聞播報(bào)等多個(gè)領(lǐng)域的應(yīng)用需求。
智能管家定制男音
故事機(jī)定制女音
繪本閱讀定制童音
2、低門檻,大制作,快速定制音色
用戶使用思必馳發(fā)音人音色定制平臺(tái),最快數(shù)小時(shí)即可獲得專屬音色,那么,思必馳是如何做到這一點(diǎn)的呢?
- 在數(shù)據(jù)采集方面,用戶可按照思必馳錄音規(guī)范進(jìn)行數(shù)據(jù)采集,保證數(shù)據(jù)質(zhì)量;
- 在數(shù)據(jù)標(biāo)注方面,可選擇思必馳“自動(dòng)標(biāo)注”技術(shù),一小時(shí)音頻標(biāo)注時(shí)間可壓縮至數(shù)分鐘,且不會(huì)對(duì)合成效果產(chǎn)生明顯影響,自然度MOS損失在0~0.2內(nèi);
- 在模型訓(xùn)練方面,思必馳構(gòu)建了快速高質(zhì)量的模型自訓(xùn)練流程,可自動(dòng)進(jìn)行數(shù)據(jù)特征提取和模型訓(xùn)練,結(jié)合大數(shù)據(jù)預(yù)訓(xùn)練和遷移學(xué)習(xí)技術(shù),最快數(shù)小時(shí)即可完成一個(gè)音色的模型訓(xùn)練流程。
豐富而具有差異化的平臺(tái)服務(wù),讓思必馳發(fā)音人音色定制平臺(tái)具有簡(jiǎn)單快捷、交付能力強(qiáng)、數(shù)據(jù)門檻低、定制成本低四大優(yōu)勢(shì):

- 簡(jiǎn)單快捷
將之前繁瑣的流程通過(guò)平臺(tái)化的方式實(shí)現(xiàn),僅需要進(jìn)行基礎(chǔ)的配置,其它標(biāo)注、訓(xùn)練等流程即可一站式完成,效率大大提高。
- 交付能力強(qiáng)
不再受限于研發(fā)人力,沒(méi)有技術(shù)背景的用戶也可快速使用平臺(tái),僅需數(shù)小時(shí)即可完成音色定制。
- 數(shù)據(jù)門檻低
只需要少量的音頻即可訓(xùn)練出自然、情感豐富、還原度高的音色。
- 定制成本低
減少了標(biāo)注、工程化等成本,定制成本大大降低。
思必馳支持公有云、混合云、私有化、終端離線等多種部署方式,讓用戶的數(shù)據(jù)更安全。
此外,思必馳DUI開(kāi)放平臺(tái)音色庫(kù)還擁有男聲、女聲、童聲等百余種音色,可以直接滿足客戶在智能車載、智能家居、智能客服等多個(gè)領(lǐng)域的應(yīng)用需求,已服務(wù)于央視網(wǎng)、騰訊、美的、海爾等多家客戶。
3、技術(shù)沉淀,鑄就AI實(shí)力
作為國(guó)內(nèi)專業(yè)的對(duì)話式人工智能平臺(tái)公司,思必馳曾先后參與國(guó)家標(biāo)準(zhǔn)《中文語(yǔ)音合成互聯(lián)網(wǎng)服務(wù)接口規(guī)范》與行業(yè)標(biāo)準(zhǔn)《中文語(yǔ)音合成服務(wù)系統(tǒng)評(píng)估規(guī)范》的制定,并成為全國(guó)首批通過(guò)評(píng)估測(cè)評(píng)的公司之一。
思必馳的語(yǔ)音合成技術(shù)涵蓋了大數(shù)據(jù)語(yǔ)音定制、小數(shù)據(jù)快速定制、歌聲合成、小語(yǔ)種合成、方言合成、情感合成。語(yǔ)音合成技術(shù)得到業(yè)內(nèi)肯定,思必馳智能中文語(yǔ)音合成系統(tǒng)通過(guò)了AIIA組織的中文語(yǔ)音合成水平測(cè)試。


近年,基于深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的語(yǔ)音合成成為主流,語(yǔ)音合成質(zhì)量有了巨大提升。路漫漫其修遠(yuǎn)兮,思必馳將持續(xù)加大技術(shù)研究,為大家?guī)?lái)更自然、更真實(shí)、更個(gè)性、更低成本的語(yǔ)音合成服務(wù)。