東進(jìn)中文語(yǔ)音識(shí)別 ASR 簡(jiǎn)介
概論:
東進(jìn)中文語(yǔ)音系列產(chǎn)品,是采用了美國(guó)IBM公司的ViaVoice for Telephony技術(shù)合作開(kāi)發(fā)的。產(chǎn)品系列覆蓋語(yǔ)音識(shí)別、語(yǔ)音合成兩大領(lǐng)域,支持中文(簡(jiǎn)體漢字、繁體漢字)、英語(yǔ)等語(yǔ)言。
中文語(yǔ)音識(shí)別(ASR—Automatic Speech Recognization),是CTI中的一項(xiàng)核心技術(shù),能夠?yàn)檎Z(yǔ)音門戶、電子商務(wù)、呼叫中心、電話通訊系統(tǒng)提供中文語(yǔ)音交互界面。
中文語(yǔ)音識(shí)別技術(shù)
東進(jìn)中文語(yǔ)音技術(shù),針對(duì)電話應(yīng)用進(jìn)行特殊優(yōu)化,系統(tǒng)開(kāi)發(fā)人員可以方便地在電話通訊系統(tǒng)及網(wǎng)絡(luò)平臺(tái)上集成中文語(yǔ)音功能。東進(jìn)中文語(yǔ)音識(shí)別引擎的特點(diǎn)是:
與說(shuō)話人無(wú)關(guān):任何人都可以使用。
高識(shí)別率:內(nèi)部的語(yǔ)音識(shí)別引擎是使用真實(shí)的電話信道語(yǔ)音數(shù)據(jù)訓(xùn)練得到的,在正常的電話信道(包括手機(jī)或普通電話)的噪音下有很高的識(shí)別率。
無(wú)限詞匯量:由于語(yǔ)音識(shí)別內(nèi)核是比基本音節(jié)還要小的單元,所以開(kāi)發(fā)人員定義的任何詞表,它都可以很好的辨識(shí)。
連續(xù)發(fā)音:使用者不需要在詞匯間有任何停頓,就可以同系統(tǒng)連續(xù)交談。
多語(yǔ)種支持:在中文普通話和粵語(yǔ)之外,同時(shí)支持美國(guó)英語(yǔ)、英國(guó)英語(yǔ)、法語(yǔ)、德語(yǔ)。
多候選集的輸出:能夠輸出不同的候選結(jié)果相似度得分。
支持聲學(xué)加詞:說(shuō)話人只需要輸入語(yǔ)音信號(hào)即可完成加詞。
支持語(yǔ)音合成:能夠從文字直接生成高自然度、高清晰度、高可懂度的語(yǔ)音。
信道自適應(yīng):可以自動(dòng)適應(yīng)不同信噪比的電話信道。
自然語(yǔ)言理解模塊:提供更加人性化的人-機(jī)對(duì)話接口。
出色的可伸縮性:提供從小型辦公室到企業(yè)級(jí)電話語(yǔ)音系統(tǒng)解決方案,小到單機(jī)系統(tǒng),大到可靈活組合的客戶服務(wù)器模式,更提供全自動(dòng)的動(dòng)態(tài)負(fù)載平衡,讓您有限的投入能夠獲得更高的效能。