首頁>>廠商>>語音識別與合成>> 捷通華聲

捷通華聲語音合成(jTTS)技術(shù)介紹及解決方案

2002/09/01

一、 捷通華聲TTS(jTTS)介紹

1. 捷通華聲TTS技術(shù)文語轉(zhuǎn)換的基本原理

捷通TTS技術(shù)文語轉(zhuǎn)換的基本結(jié)構(gòu):

  語言學(xué)處理在文語轉(zhuǎn)換系統(tǒng)中起著重要的作用,他主要是模擬人對自然語言的理解過程--文本規(guī)整、詞的切分、語法分析和語義分析,使計算機對輸入的文本能完全理解,并給出后兩部分所需要的各種發(fā)音提示。

  韻律處理的目的是為合成語音規(guī)劃出音段特征,如音高、音長和音強等,使合成語音能正確表達語意,聽起來更加自然悅耳。

  聲學(xué)處理的主要功能是根據(jù)前兩部分處理結(jié)果的要求輸出語音,即合成語音。

2. 捷通華聲TTS的特點

  捷通華聲公司在2001年7月完成了最新版本的捷通華聲TTS核心。新版本基于大規(guī)模真實錄音的語音庫,音庫提供的樣本多,選音范圍大,可選擇到更匹配的發(fā)音,另外,在選音和拼接時將超越了音節(jié)的層次,能夠進行詞甚至短句層次的拼接。因此,在自然度、可懂度方面捷通華聲新TTS具有較大的提高。再加上英文單詞的音色與中文保持一致,可支持GBK字庫中的所有字符的發(fā)音,新的捷通華聲TTS技術(shù)的合成的語音幾乎達到自然說話的效果。

3. 捷通華聲TTS的進一步發(fā)展方向

  捷通華聲TTS將在下面幾個方向發(fā)展:

二、 捷通華聲TTS技術(shù)(jTTS)在CTI領(lǐng)域中的應(yīng)用

  捷通華聲TTS技術(shù)在CTI行業(yè)中的應(yīng)用提供三種解決方案:本地接口調(diào)用方案、語音服務(wù)器方案、離線合成方案。

1. 捷通華聲TTS本地接口調(diào)用方案(jTTS SDK)

方案概論:

  本地接口調(diào)用方案提供捷通華聲TTS開發(fā)工具包(jTTS-SDK)可使用戶在其開發(fā)的系統(tǒng)中加入語音合成的功能。jTTS-SDK是基于Win32(32位Windows環(huán)境,包括Windows95/98/2000/NT)平臺下的開發(fā)工具包,因此這種方案要求使用方的聲訊服務(wù)系統(tǒng)所運行的是32 位Windows環(huán)境的服務(wù)器,并且需要對使用方系統(tǒng)進行部分程序的改造。該方案適用于要求使用方具有二次開發(fā)能力的集成和應(yīng)用商。


本地接口調(diào)用方案架構(gòu)圖

2. 捷通華聲TTS語音服務(wù)器方案 (jTTS Service )

方案概論:

  語音服務(wù)器方案直接提供裝載有捷通華聲TTS語音服務(wù)系統(tǒng)的高性能的服務(wù)器,它與現(xiàn)有的聲訊服務(wù)相平行,接受其指令和文字數(shù)據(jù)流,合成產(chǎn)生語音數(shù)據(jù)流返給原系統(tǒng),適用于電信、大型企業(yè)CTI系統(tǒng)及聲訊臺改造、升級。


語音服務(wù)器方案架構(gòu)圖

技術(shù)優(yōu)勢:

1. 降低了客戶端機器的配置需求。
2. 通過TCP/IP協(xié)議實現(xiàn)了跨操作系統(tǒng)的語音合成服務(wù)功能,可以滿足非Win32平臺的需求。
3. 對于服務(wù)規(guī)模較大的系統(tǒng)可實現(xiàn)語音服務(wù)器的分布式工作方式,對客戶端的請求自動調(diào)度,平衡負載,以達到更高的性能。

應(yīng)用領(lǐng)域:

  采用語音服務(wù)器方案可在不改變現(xiàn)有服務(wù)系統(tǒng)的條件下,平行地建立捷通華聲TTS語音服務(wù)器,安全、高效率地將原來的文本服務(wù)擴大為文本-語音同時服務(wù),是大型、專業(yè)級的語音服務(wù)解決方案,并可跨平臺實現(xiàn)。捷通華聲TTS語音服務(wù)器方案可服務(wù)于160、168等聲訊臺、UMS統(tǒng)一信息服務(wù)系統(tǒng)、呼叫中心、語音郵件商、WAP網(wǎng)站、進行網(wǎng)上播音的.com公司等。

3. 捷通華聲TTS離線合成方案(jTTS Builder)

方案概論:

  捷通華聲TTS離線合成方案提供離線合成工具,這是基于Microsoft Windows 95/98/NT/2000的獨立應(yīng)用程序,可提供離線的語音合成服務(wù),批量地將文字轉(zhuǎn)換為語音數(shù)據(jù)文件,適用于海量信息、相對穩(wěn)定或不要求實時轉(zhuǎn)化的聲訊服務(wù)場合,可以直接替代傳統(tǒng)的錄音方法,對原有系統(tǒng)完全無需改造,節(jié)省人力,提高效率。


離線合成方案系統(tǒng)架構(gòu)圖

三、 捷通華聲TTS(jTTS)在嵌入式操作系統(tǒng)下的應(yīng)用

  捷通華聲公司的TTS技術(shù)與其他文語轉(zhuǎn)換系統(tǒng)相比具有獨特的音庫壓縮特點,使捷通華聲TTS技術(shù)向嵌入式操作系統(tǒng)的移植(尤其是向PDA上的移植)具備先決條件。據(jù)市場調(diào)研及考證:捷通華聲公司是目前最早掌握該技術(shù),及最先提出在掌上電腦應(yīng)用該技術(shù)的公司。該系統(tǒng)在2001年中關(guān)村電腦節(jié)上榮獲十大"IT創(chuàng)新產(chǎn)品"。

  捷通華聲TTS技術(shù),以大規(guī)模真實錄音的語音庫為基礎(chǔ),增加音庫壓縮算法和音色變換算法形成核心技術(shù)。此核心技術(shù)與國內(nèi)其他文語轉(zhuǎn)換技術(shù)相比較,具有如下特點:

· 系統(tǒng)輸出語音清晰度高。
· 系統(tǒng)輸出可懂度高。
· 輸出自然度基本與人正常說話持平。
· 音庫大小可縮擴,小音庫僅為1MB。

  正是因為捷通華聲TTS具有以上的特點,使得捷通華聲公司的TTS技術(shù)可以向嵌入式操作系統(tǒng)移植。特別是小音庫的特點,使得在嵌入式操作系統(tǒng)下不會占用太大的資源。

  詳細方案請參照捷通TTS在掌上電腦、信息家電等領(lǐng)域的解決方案

四、 捷通華聲TTS(jTTS)在語音網(wǎng)站中的應(yīng)用

  公司將捷通華聲TTS技術(shù)和流媒體(Streaming Media)技術(shù)相結(jié)合,開發(fā)設(shè)計了專門針對語音網(wǎng)站的全面技術(shù)解決方案,并在國內(nèi)率先推出了首家有聲網(wǎng)站,為網(wǎng)站的"有聲化"開創(chuàng)了先河。語音網(wǎng)站技術(shù)的推出,將使網(wǎng)站變得更加有聲有色,吸引更多網(wǎng)絡(luò)愛好者,使網(wǎng)絡(luò)更加貼近廣大用戶的生活。捷通華聲TTS技術(shù)在網(wǎng)站有聲化方面,具有極廣泛的應(yīng)用前景,特別適合用于為網(wǎng)民提供新聞、財經(jīng)、生活、文藝、 體育等各類有聲的信息服務(wù)。

  詳細方案請參照捷通華聲語音網(wǎng)站解決方案

五、 捷通華聲TTS(jTTS)在桌面產(chǎn)品中的應(yīng)用

  利用捷通華聲TTS技術(shù)可開發(fā)辦公、教學(xué)、娛樂等智能多媒體應(yīng)用軟件,使這些軟件增加了"說"的功能,豐富軟件的內(nèi)涵。目前公司利用TTS開發(fā)應(yīng)用軟件產(chǎn)品有:"錄易漢語智能輸入輸出系統(tǒng)"、"捷通聽霸"。在"錄易漢語智能輸入輸出系統(tǒng)"中利用TTS做為智能輸入后的語音校對,是國內(nèi)第一家將TTS技術(shù)與智能輸入技術(shù)相結(jié)合的廠商。在"捷通聽霸"軟件中利用語音合成技術(shù)實現(xiàn)了閱讀電子文檔、鍵盤輸入時的即時語音校對、語音鬧鐘、卡通角色說話的功能。

  應(yīng)用案例請參考《捷通聽霸TB 3000》產(chǎn)品介紹

六、 成功案例

  捷通華聲TTS技術(shù)自推出以來,已成功地在電信、證券等行業(yè)中得到了廣泛的應(yīng)用,并已進入臺灣市場,其中典型的案例包括:

· 鐵通-中鐵綜合信息服務(wù)網(wǎng)(CRIS-China Railway Information System)
· 賽迪呼叫中心
· 博時基金客戶服務(wù)中心
· 臺灣中華電信呼叫中心
· 天津移動呼叫中心
· 大連國泰君安證券平臺系統(tǒng)
· 大連大開信證券平臺系統(tǒng)
· 深圳市政府紀委電話咨詢系統(tǒng)
· 福建省179平臺
· 美國奧維平臺系統(tǒng)