1、系統(tǒng)現(xiàn)狀
隨著人工智能技術(shù)的不斷進(jìn)步,及近年來(lái)保險(xiǎn)、證券等行業(yè)的飛速發(fā)展,傳統(tǒng)金融服務(wù)模式已經(jīng)難以全方位滿足用戶需求。為更好的滿足用戶多樣化的金融服務(wù)需求,提升用戶體驗(yàn),實(shí)現(xiàn)降本增效,引入智能語(yǔ)音交互技術(shù)已成為行業(yè)趨勢(shì)。用戶可以使用語(yǔ)音進(jìn)行交互,并獲得其所需的服務(wù)結(jié)果。
為打造智能語(yǔ)音交互新功能,實(shí)現(xiàn)機(jī)器“聽(tīng)懂”人類(lèi)語(yǔ)言,將語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)文本,需引入智能語(yǔ)音技術(shù)與自身業(yè)務(wù)及智能服務(wù)相結(jié)合,建立智能語(yǔ)音平臺(tái)。
2、建設(shè)目標(biāo)
本次項(xiàng)目建設(shè)內(nèi)容整體包括AI+語(yǔ)音平臺(tái)軟件的搭建部署,平臺(tái)能支撐客戶系統(tǒng)在ASR語(yǔ)音識(shí)別和TTS語(yǔ)音合成等方面的需要。
構(gòu)建AI+語(yǔ)音平臺(tái),提供語(yǔ)音識(shí)別、語(yǔ)音合成等實(shí)現(xiàn)與多種人工智能能力的靈活組合與掛接,并提供豐富的接口與客戶系統(tǒng)進(jìn)行平滑對(duì)接,實(shí)現(xiàn)量身定制的語(yǔ)音交互平臺(tái)級(jí)系統(tǒng)服務(wù),方便各渠道前端敏捷迭代開(kāi)發(fā)調(diào)用。
AI+語(yǔ)音平臺(tái)通過(guò)語(yǔ)音識(shí)別、語(yǔ)音合成等能力,實(shí)現(xiàn)對(duì)接客戶系統(tǒng)實(shí)現(xiàn)高頻業(yè)務(wù)改造,支持客戶以語(yǔ)音方式進(jìn)行交互,實(shí)現(xiàn)各種智能化業(yè)務(wù)應(yīng)用。
AI+語(yǔ)音平臺(tái)將語(yǔ)音合成、語(yǔ)音識(shí)別和聲紋識(shí)別等無(wú)縫的集成在同一個(gè)系統(tǒng)架構(gòu)中,降低運(yùn)維成本,提高利用率。
總體方案

1、方案概述
圖片AI+語(yǔ)音平臺(tái)整體分為平臺(tái)接入層、平臺(tái)能力層和平臺(tái)服務(wù)層,其中平臺(tái)接入層和平臺(tái)服務(wù)層面向客戶提供能力和服務(wù)的整體集成解決方案。AI+語(yǔ)音平臺(tái)可提供統(tǒng)一的AI能力,實(shí)現(xiàn)共享和按需配置,以及產(chǎn)品應(yīng)用和能力的解耦,方便部署和靈活對(duì)接。同時(shí),智能語(yǔ)音技術(shù)平臺(tái)統(tǒng)一建設(shè)和規(guī)劃,可以起到統(tǒng)一優(yōu)化資源、統(tǒng)一發(fā)布服務(wù)、統(tǒng)一進(jìn)行業(yè)務(wù)接入的益處,做到一次建設(shè),多處受益,構(gòu)建新型的服務(wù)能力平臺(tái)。結(jié)合實(shí)際業(yè)務(wù)狀況,重點(diǎn)提供語(yǔ)音識(shí)別、語(yǔ)音合成核心能力。
以云服務(wù)的方式為應(yīng)用終端提供語(yǔ)音服務(wù),通過(guò)集成標(biāo)準(zhǔn)的SDK控件,為最終用戶提供語(yǔ)音、自然語(yǔ)言理解、圖像等人工智能應(yīng)用。
2、組網(wǎng)說(shuō)明

從上述圖中可以看到,用戶的請(qǐng)求進(jìn)入AI+語(yǔ)音平臺(tái)時(shí),首先防火墻要對(duì)其進(jìn)行安全性檢查,以保證系統(tǒng)的正常穩(wěn)定運(yùn)行。之后用戶的請(qǐng)求將送至接入服務(wù)器,接入服務(wù)器會(huì)根據(jù)用戶請(qǐng)求的業(yè)務(wù)類(lèi)型,如語(yǔ)音合成、語(yǔ)音識(shí)別等,并結(jié)合系統(tǒng)負(fù)載均衡策略,將請(qǐng)求分發(fā)至業(yè)務(wù)服務(wù)器。業(yè)務(wù)服務(wù)器先解析用戶請(qǐng)求,將用戶請(qǐng)求和業(yè)務(wù)相關(guān)的信息存儲(chǔ)至數(shù)據(jù)庫(kù),加載業(yè)務(wù)資源,調(diào)用相應(yīng)的語(yǔ)音引擎服務(wù)器,將請(qǐng)求響應(yīng)結(jié)果返回給接入服務(wù)器,接入服務(wù)器進(jìn)一步返回給用戶。在此架構(gòu)中,系統(tǒng)運(yùn)行管理服務(wù)器會(huì)實(shí)時(shí)監(jiān)測(cè)到所有服務(wù)器節(jié)點(diǎn)的運(yùn)行狀態(tài)。
運(yùn)營(yíng)優(yōu)化方案
核心效果優(yōu)化主要包含對(duì)智能語(yǔ)音平臺(tái)語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)義和聲紋效果優(yōu)化等幾個(gè)方面。
- 合成效果優(yōu)化:通過(guò)對(duì)發(fā)言參數(shù)的調(diào)整,可以對(duì)語(yǔ)速、流程性等一系列關(guān)鍵參數(shù)進(jìn)行調(diào)整,結(jié)合預(yù)錄音等方式,使語(yǔ)音合成播報(bào)效果更加流暢飽滿,貼合滿足業(yè)務(wù)應(yīng)用要求;
- 語(yǔ)音識(shí)別優(yōu)化:主要是對(duì)實(shí)測(cè)數(shù)據(jù)進(jìn)行詳盡分析,擴(kuò)展測(cè)試集、訓(xùn)練集,擴(kuò)充說(shuō)法、提升語(yǔ)料覆蓋度等方法,重點(diǎn)解決反饋的一些單點(diǎn)問(wèn)題,分析影響識(shí)別效果的原因,若是聲學(xué)層面導(dǎo)致的,則補(bǔ)充進(jìn)行音頻數(shù)據(jù)標(biāo)注和優(yōu)化訓(xùn)練,若是語(yǔ)言層面,則通過(guò)擴(kuò)充覆蓋度、增大句式概率等進(jìn)行效果調(diào)優(yōu)。

為了實(shí)現(xiàn)AI+語(yǔ)音平臺(tái)項(xiàng)目要求,云翌結(jié)合目前項(xiàng)目的現(xiàn)狀,準(zhǔn)備通過(guò)持續(xù)的運(yùn)營(yíng)優(yōu)化不斷提升服務(wù)應(yīng)用效果與定制化配合。主要通過(guò)業(yè)務(wù)應(yīng)用保障和能力效果優(yōu)化等手段對(duì)該系統(tǒng)進(jìn)行優(yōu)化,持續(xù)迭代以保證語(yǔ)音能力效果的穩(wěn)定性、可靠性及優(yōu)良性。根據(jù)應(yīng)用場(chǎng)景的不同,差異化保障和支撐各業(yè)務(wù)效果指標(biāo)。
關(guān)于云翌
上海云翌通信科技有限公司總部位于上海市浦東軟件園世博分園,致力于向社會(huì)企事業(yè)單位提供自主研發(fā)的VoIP全系列通信產(chǎn)品。包括統(tǒng)一通信、智能呼叫中心、IP指揮調(diào)度、云平臺(tái)等產(chǎn)品及方案。
公司是上海市雙軟認(rèn)定企業(yè)、重點(diǎn)高新技術(shù)企業(yè)。公司核心管理與研發(fā)團(tuán)隊(duì)均為通信行業(yè)內(nèi)從業(yè)十年以上的資深人士,在IP融合通信、行業(yè)應(yīng)用、云平臺(tái)等領(lǐng)域有著豐富的專(zhuān)業(yè)經(jīng)驗(yàn)。公司產(chǎn)品充分利用Internet和全球IP互聯(lián)的環(huán)境,提供比傳統(tǒng)業(yè)務(wù)更全面、更專(zhuān)業(yè)的服務(wù)解決方案。
公司成立以來(lái),已經(jīng)成功為上萬(wàn)家企事業(yè)單位提供通信解決方案,超高的性價(jià)比以及全面的定制服務(wù)贏得了用戶的一致認(rèn)可。