中科信利在電信級語音識別產(chǎn)業(yè)化方面取得突破性進展
2004/12/16
電信級語音識別引擎產(chǎn)品由于其技術起點高,在面向應用時需要解決的技術難點比較多,國內(nèi)的語音識別廠商一直難以實現(xiàn)真正產(chǎn)業(yè)化的突破,該領域一直被國外廠商所壟斷。2004年,通過對自身技術的不斷完善,以及與電信級系統(tǒng)集成商和運營商的通力合作,中科信利具有自主知識產(chǎn)權的分布式電話語音識別引擎已在國內(nèi)多個電信級項目中取得成功應用,從而打破了國外廠商對該技術的壟斷局面, 實現(xiàn)了國內(nèi)語音識別廠商在產(chǎn)業(yè)化方面質(zhì)的突破。中科信利也正在迅速成為中文領域內(nèi)領先的語音識別軟件供應商。
這些成功應用的項目包括:北京移動的個人秘書系統(tǒng),成都移動的企業(yè)秘書系統(tǒng)、個人秘書系統(tǒng),重慶聯(lián)通的個人秘書系統(tǒng),河北聯(lián)通的個人秘書系統(tǒng),江蘇電信的個人秘書系統(tǒng),等等。
中科信利分布式語音識別引擎,其核心技術來源于中科院聲學研究所中科信利語音實驗室,該實驗室具有國際語音識別專家顏永紅研究員領銜的國際一流的研究團隊,具備雄厚的研發(fā)實力,目前在中文語音識別領域業(yè)界領先,贏得了自2003年以來政府組織的各次語音識別技術比賽。
中科信利公司以實驗室技術為基礎,致力于開發(fā)實用的語音引擎產(chǎn)品。同時針對中文特點、應用環(huán)境和客戶需求進行特別優(yōu)化,可以廣泛適用于有線、無線和VoIP語音環(huán)境,即使在有噪音、背景聲或語音質(zhì)量較差的情況下也能保持較高的識別準確率。中科信利公司能夠提供業(yè)界獨樹一幟的方言處理技術、語音標記技術和個人口音自適應技術。
中科信利公司自主開發(fā)的分布式語音識別引擎,能夠提供語音識別服務器集群功能,提供具有高識別率、高可靠性、高度靈活的擴展性及容錯能力。它使電話用戶通過語音來訪問數(shù)字信息成為可能。電信應用增值服務商和互聯(lián)網(wǎng)應用服務商可以利用中科信利先進的語音識別技術來為其客戶提供更為快捷有效的服務。
具體來說,中科信利分布式語音識別引擎(TSRE3.0)在市場上的成功應用得益于其如下特點:
- 高可靠性和穩(wěn)定性
通過精心設計的客戶端/服務器架構,能夠支持成百上千路的語音識別應用。資源管理服務器能夠均勻調(diào)度識別服務器,達到負載均衡,提高系統(tǒng)整體工作效率。當識別服務器發(fā)生故障時,系統(tǒng)能夠自動判別,并將識別任務轉(zhuǎn)移到其他服務器。當識別任務量增加時,可以動態(tài)增加服務器而無須停止原有的識別系統(tǒng)服務。因而系統(tǒng)具有強大的穩(wěn)定性、容錯能力和可伸縮性,能夠滿足電信級應用的需要。
- 具有穩(wěn)健的識別性能
語音模型是基于大量的不同場合,不同人群和不同口音的電話語音數(shù)據(jù)訓練出來的,具有較好的環(huán)境適應性。通過采用領先的算法模型,TSR3.0識別引擎具有較強的抗噪性能。同時系統(tǒng)還具有較好的拒識功能,能夠拒絕掉大多數(shù)的非語音(如: 敲門聲,咳嗽聲,機器噪音等等)。
- 具有優(yōu)秀的系統(tǒng)性能
識別引擎占用較小的系統(tǒng)資源,識別速度很快。單臺雙cpu PC服務器能夠支持90路并發(fā)語音識別,從而可以大大節(jié)省用戶在硬件設備方面的投資。
- 支持方便快捷的人機交互
TSR3.0具有BargeIn功能,支持說話者隨時打斷系統(tǒng)提示,從而支持方便快捷的人機交互。通過對于語音檢測等模塊的精心優(yōu)化,TSR3.0保證了BargeIn條件下仍然保持原有的高識別率。
- 提供說話人自適應功能
當用戶多次使用同一識別系統(tǒng)時,TSR3.0識別引擎能夠逐步適應其口音,使該使用者的識別性能逐步提高。同時,如果預先給定特定說話人的數(shù)據(jù),系統(tǒng)可以針對特定說話人進行自適應訓練以獲得更加適合其發(fā)音特征的語音模型,從而使得該說話人在使用系統(tǒng)時,性能更好。
同時,這也是國內(nèi)外分布式語音識別引擎產(chǎn)品中唯一提供這項功能的。
- 提供語音注冊功能
TSR3.0允許用戶通過本人語音來向動態(tài)語法增加命令或詞表。這種方式不但能夠有效利用用戶個性化的語音,提高系統(tǒng)的識別準確率;而且能夠提高用戶輸入詞表的方便性和靈活性。
電話語音識別技術可以廣泛應用于呼叫中心、無線增值服務、目錄服務、客服系統(tǒng)、信息查詢系統(tǒng)等各種應用領域,可以應用于政府、電信、銀行、證券、保險、電力、交通、航空、教育等各個行業(yè)。通過采用基于自然語音交互的模式替代傳統(tǒng)的基于按鍵的交互式語音應答(IVR)模式,可以顯著提高客戶使用的方便性、靈活性,為客戶提高更好的服務。語音識別技術與門戶網(wǎng)站相結合,可以開發(fā)出語音門戶,使通過語音方式獲取互聯(lián)網(wǎng)信息成為可能,
從而進一步提高應用系統(tǒng)的增值性能。
中科信利公司愿與廣大客戶精誠合作,致力于語音識別技術的推廣和普及,共同創(chuàng)造語音應用的美好明天。
中科信利公司供稿 CTI論壇編輯
相關鏈接: