亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

 首頁 > 技術 > 解決方案 > 聲訊TTS應用解決方案

聲訊TTS應用解決方案

2001-08-29 00:00:00   作者:   來源:   評論:0 點擊:


一、語音合成技術及其在聲訊臺中的應用

1 語音合成簡介

語音合成(Text To Speech),簡稱TTS技術,它涉及聲學、語言學、數(shù)字信號處理技術、多媒體技術等多個學科技術,是中文信息處理領域的一項前沿技術。解決的主要問題就是如何將文本狀態(tài)的文字信息轉化為可聽的聲音信息。使以往只能用眼睛看的文字信息,也可以用耳朵來聽。通俗地說,就是讓電腦開口說話的技術。這項技術在以語音信息服務為主要方式的聲訊業(yè)務中尤其有應用意義。

2 語音合成技術的優(yōu)點

語音是信息傳播的一大媒介,隨著多媒體信息需求的增大,語音服務系統(tǒng)近年來發(fā)展較為迅速。下表是語音合成技術和傳統(tǒng)錄音回放技術在語音服務中相比較的情況。

 

TTS

錄音制作

存儲空間的要求

較低

較高

節(jié)目開發(fā)周期

出錯可能

信息的更新速度

即時

信息庫建立和維護的工作量

  • 就工作量而言,錄音需要大量的人力,在信息量以級數(shù)增長的今天,錄音往往無法滿足信息的供給,而語音合成將絕大多數(shù)工作由機器代替,人們只需提供現(xiàn)成的文本信息即可輸出聲音信息。
  • 對于動態(tài)的信息,尤其是對實時性要求很高的信息如:股票行情等,如果讓錄音員錄音則至少在半小時后才能對外提供,而語音合成可以實現(xiàn)實時的轉換,每分鐘可刷新一次。
  • 由于信息的高速增長,錄音數(shù)據(jù)存放和查詢也存在問題。將信息以文本形式存儲在計算機中可節(jié)約大量系統(tǒng)資源再結合計算機技術對數(shù)據(jù)庫中的信息進行搜索和整理將輸出的結果用語音合成轉換成聲音,這樣就可以解決信息服務中海量信息的存儲和查詢的問題。
  • 錄音的信息維護、修改的工作量比較大。而文本信息的維護和修改相對要容易的多,通過語音合成技術只需對文本信息進行修改就可以完成信息內容的更改和維護工作。

二、全省節(jié)目文本內容聯(lián)網方案

在聲訊臺使用TTS技術能實現(xiàn)一種全新的節(jié)目聯(lián)網方式。在實現(xiàn)數(shù)據(jù)聯(lián)網情況下,節(jié)點聲訊臺中的一個或者多個制作的節(jié)目內容能通過文本的方式在網絡上共享;其他的節(jié)點聲訊臺取得這些文本內容,在本地進行語音合成,進而開通相應的節(jié)目。從而可以使用少量的帶寬來輕松實現(xiàn)信息共享,為各地的用戶提供全面的語音服務。

1 集中制作、聯(lián)網下傳方式

單一的節(jié)目制作中心一般放置在省中心。在節(jié)目制作中心,節(jié)目數(shù)據(jù)以數(shù)據(jù)庫或者文本文件的方式存放于節(jié)目數(shù)據(jù)倉庫中。在節(jié)目制作中心運行文本訪問服務代理,接受各地市臺的數(shù)據(jù)請求并發(fā)送相應的數(shù)據(jù)。各個地市臺通過文本請求、接收代理向中心請求或者接收文本數(shù)據(jù),存放于本地數(shù)據(jù)倉庫,等待語音合成服務器合成成語音文件,地市臺使用合成后的語音文件迅速開通相應的節(jié)目。

節(jié)目文本數(shù)據(jù)的共享和消息通知,可以通過兩種方式實現(xiàn),即地市臺定時(或人為)向中心請求數(shù)據(jù),或者中心數(shù)據(jù)服務代理向地市臺廣播數(shù)據(jù)增加消息,并發(fā)送增加的數(shù)據(jù)。

三、TTS技術應用方案

通過節(jié)目文本內容聯(lián)網,實現(xiàn)節(jié)目文本內容的共享,從文本到語音的轉換,開通相應的節(jié)目則需要語音合成來完成。

科大訊飛針對各地聲訊平臺不同的建設狀況,提出實時合成和離線合成兩種解決方案,實現(xiàn)在現(xiàn)有平臺上嵌入語音合成功能。

1.離線合成

在用戶電話呼入之前生成相應語音文件,每個語音文件可供多個用戶重復聽取。特點是資源消耗少(普通PC即可實現(xiàn)),硬件要求低,能較好的替代人工錄音的語音制作方式。

離線合成可以與省級甚至全國聲訊網絡結合,開發(fā)出靈活的聯(lián)網業(yè)務。即文本訪問代理從廣域網上取得節(jié)目文本數(shù)據(jù)存放于本地的文本數(shù)據(jù)共享目錄,語音合成服務器通過訪問該目錄獲取節(jié)目文本合成為語音文件存放與服務器的語音文件共享目錄中。局域網內其他設備(IVR、MSI等等)訪問語音文件共享目錄,向用戶播放最新生成的語音信息。

2.在線合成嵌入方案

在線合成是在用戶電話呼入的同時實時生成語音文件,并在該用戶呼入的通道播放,每個語音文件僅供該用戶聽取。

在線合成包含離線合成的一切功能,且實時性好,業(yè)務靈活,可以開展出各種個性化信息服務,主要適用于對語音合成的實時性要求高的場合。

聲訊平臺的TTS升級是在現(xiàn)有平臺上增加TTS語音合成服務器,語音節(jié)點通過語音合成網關調用TTS資源。語音合成服務器支持多路的實時語音合成,根據(jù)系統(tǒng)業(yè)務量可以方便地擴容。

由于不涉及到話務接入處理層的內容,聲訊臺采用前置交換方式還是后置交換方式不對嵌入改造工作的造成影響。

如圖所示,一個包含TTS服務的電話訪問流程大致可分為七步:

(1)用戶電話撥入,系統(tǒng)IVR響應,獲得用戶按鍵等信息。

(2)IVR根據(jù)用戶輸入,向數(shù)據(jù)庫或文件等信息源申請數(shù)據(jù)。

(3)信息源返回文本數(shù)據(jù)給IVR。

(4)IVR通過其TCP通訊接口將需要合成的文本信息發(fā)送給TTS Server。

(5)TTS Server將用戶文本合成為語音文件放置在一個共享目錄中。

(6)TTS Server通過其TCP通訊接口通知IVR合成完畢,并返回文件名。

(7)IVR播放相應的語音文件給電話用戶。

四、TTS技術在聲訊臺的應用意義

新業(yè)務的開發(fā)對現(xiàn)有聲訊平臺提出了更高的技術要求,目前全省聲訊平臺基本上沒有文字語音合成能力,數(shù)字合成也停留在單音報讀階段,播放出來的聲音生硬、不連續(xù)、不自然;而使用語音合成技術合成的語音自然、連續(xù),接近人的發(fā)音,用戶感覺較親切,易聽懂,可以大幅度提高服務質量和用戶滿意度?梢哉f,TTS技術的應用是聲訊平臺技術升級的當務之急。

TTS技術在聲訊臺應用后可以直接開發(fā)許多新業(yè)務,如:

1.海量信息查詢類業(yè)務

大部分海量信息如考試查分、征婚啟事、人才信息、電話廣告等,由于其內容龐大,往往無法在短期內完成錄音,即使可以事先錄音,也需要很長的制作周期,而且在量大的時候肯定會出現(xiàn)人為錯誤;采用語音合成技術可以節(jié)約大量人力,縮短開發(fā)周期,而且能夠完全保證了所有信息100%正確。

2.動態(tài)信息查詢類業(yè)務

聲訊節(jié)目逐漸地由現(xiàn)在娛樂型節(jié)目為主的節(jié)目構成轉向以應用型的節(jié)目為主,而多數(shù)的應用類節(jié)目對實時性要求比較高,如證券行情、訂票、訂房等,上述應用中動態(tài)信息不可能事先錄音,需要實時地從數(shù)據(jù)庫中讀取,動態(tài)進行語音合成,保證信息的實時性。

此外,在聲訊服務領域內,使用TTS技術不但對技術開發(fā)工作來說很重要,而且對于業(yè)務運營方面也同樣如此。傳統(tǒng)的聲訊服務領域,信息的組織和維護都是由人工來完成的,需要人工錄音、文件拷貝等一系列步驟,工作煩瑣,維護不便,很難做到信息的實時更新,影響了服務質量,而且占用存儲資源多。

由此可見,TTS技術作為一個新興技術,可以解決動態(tài)信息和海量信息的查詢問題,把它應用于聲訊領域,對于開展增值業(yè)務,改變傳統(tǒng)業(yè)務的實現(xiàn)方式,提高服務質量都是很必要的。

科大訊飛供稿 CTI論壇編輯

相關閱讀:

分享到: 收藏

專題