東進技術IBM VVT(Via Voice For Telephony)
2010/02/23

內容簡介:
針對電話應用進行特殊優(yōu)化,采用美國IBM公司的ViaVoice Telephony技術,IBM VVT中文語音產(chǎn)品提供語音識別、語音合成功能,支持中文
。ê嗴w漢字)、英語等語言,使系統(tǒng)開發(fā)人員可以方便地在電話通訊系統(tǒng)及網(wǎng)絡平臺上集成中文語音功能。中文語音識別(ASR-Automatic Speech Recognization),是CTI中的一項核心技術,能夠為語音門戶、電子商務、呼叫中心、電話通訊系統(tǒng)
提供中文語音交互界面。IBM VVT提供開放式的語音識別引擎和一系列應用工具,使語音識別功能可以被方便地集成到CTI系統(tǒng)中.
中文語音識別 ASR的性能特點:
與說話人無關:任何人都可以使用。
高識別率:內部的語音識別引擎是使用真實的電話信道語音數(shù)據(jù)訓練得到的,在正常的電話信道(包括手機或普通電話)的噪音下有很高的識別率。
無限詞匯量:由于語音識別內核是比基本音節(jié)還要小的單元,所以開發(fā)人員定義的任何詞表,它都可以很好的辨識。
連續(xù)發(fā)音:使用者不需要在詞匯間有任何停頓,就可以同系統(tǒng)連續(xù)交談。
多語種支持:在中文普通話和粵語之外,同時支持美國英語、英國英語、法語、德語。
多候選集的輸出:能夠輸出不同的候選結果相似度得分。
支持聲學加詞:說話人只需要輸入語音信號即可完成加詞。
支持語音合成:能夠從文字直接生成高自然度、高清晰度、高可懂度的語音。
信道自適應:可以自動適應不同信噪比的電話信道。
自然語言理解模塊:提供更加人性化的人-機對話接口。
出色的可伸縮性:提供從小型辦公室到企業(yè)級電話語音系統(tǒng)解決方案,小到單機系統(tǒng),大到可靈活組合的客戶服務器模式,更提供全自動的動態(tài)負載平衡,讓您有限的投入能夠獲得更高的效能。
語音識別技術在CTI系統(tǒng)中的應用優(yōu)勢
拓展了輸入信息的廣泛性,使用語音命令替代DTMF按鍵操作。
極大減少語音菜單的層次:傳統(tǒng)的電話語音應用,使用多層次的菜單,使用起來非常不方便。采用語音識別技術,可以捕捉用戶說話中的關鍵字,自動導向合適的功能,整個系統(tǒng)的菜單深度就可以大大降低。
增加了語音流程的靈活性,可以非常靈活的在各個子菜單之間切換。
方便用戶使用,比如在證券電話應用中,用戶可以直接說出股票名字,而不再需要記憶股票代碼。
取代人工操作,降低服務成本。
體系結構與部署
IBM ViaVoice For Telephony是一套工作于客戶/服務器/集群模式下的軟件系統(tǒng)。
可以同時為多個電話通道提供服務。
支持多路并發(fā)工作同時為多條電話線路提供語音識別服務。
支持客戶服務器模式:可以將執(zhí)行傳統(tǒng)的電話語音流程的應用系統(tǒng)作為客戶機,使用專門的服務器提供語音識別的計算。
支持基于局域網(wǎng)的自動負載平衡:允許在網(wǎng)絡上同時分布多臺語音識別服務器,系統(tǒng)自動尋找負載最輕的服務器,向它提交服務,保證系統(tǒng)工作效率達到最優(yōu)。
支持自動故障恢復冗余:在網(wǎng)絡上存在多臺服務器時,如果有一臺服務器癱瘓,系統(tǒng)能夠自動跳過不可用的服務器,系統(tǒng)可能會因此變得反應速度比較慢,但是不會癱瘓。
支持單機模式:對于小型系統(tǒng),可以采用簡單的單機模式進行工作,從編程方面來說,單機模式與客戶/服務器或者集群方式?jīng)]有區(qū)別。
系統(tǒng)運行硬件環(huán)境
IBM兼容PC,Intel PII 300MHz或更高,128M內存或更高
D系列語音卡
支持的操作系統(tǒng)
Windows NT4.0
Windows 2000
開發(fā)接口
Visual Basic
C (Visual C++, Borland C++ ……)
Delphi
Visual FoxPro
Power builder
其它支持COM接口的開發(fā)平臺
軟件工具
豐富的范例程序源代碼
產(chǎn)品應用
語音門戶(Voice Portal Platform)
電信與互聯(lián)網(wǎng)服務提供商
交互式語音應答系統(tǒng)(IVR)
呼叫中心(Call Center)
旅游、交通、民航查詢系統(tǒng)
銀行、金融、保險、證券電話委托系統(tǒng)
信息臺/傳呼臺
企業(yè)114(機器人話務員)
CTI論壇報道
相關閱讀: