語音門戶是由語音驅(qū)動網(wǎng)站,它運行高速語音識別和文本/語音軟件,使用戶能夠通過電話更容易地瀏覽網(wǎng)絡(luò)或檢查郵件,或者從金融服務(wù)中心、航空公司和電話號碼查詢服務(wù)臺獲取信息。
語音門戶(Voice Portal)是溝通電信用戶、互聯(lián)網(wǎng)及其他信息系統(tǒng)的橋梁,它是一種產(chǎn)品,而不是一種技術(shù)。語音門戶的主要特點包括:
為固定和移動通信用戶和運營商提供服務(wù);
一個號碼接入: 用戶撥入一個特服號碼,享受全部服務(wù);
以自動語音識別(ASR)提供導(dǎo)航和服務(wù);
提供個性化和人性化綜合服務(wù)和統(tǒng)一消息服務(wù)。
具體地說,語音門戶應(yīng)該是建立在電信運營商的電信網(wǎng)絡(luò)上,為客戶提供個性化和人性化的客戶服務(wù)、信息服務(wù)、轉(zhuǎn)接服務(wù)和個人定制服務(wù)的平臺。在這個平臺上,用戶通過語音界面,可以更快捷、更方便地獲得比傳統(tǒng)IVR系統(tǒng)更豐富的信息和更完善的服務(wù)。
隨著個人電話的普及,尤其是手機的普及全球現(xiàn)在已超過有8.5億部的電話用戶和4.5億部的手機用戶,相比之下,全球只有大約2億個網(wǎng)絡(luò)用戶。而隨著手機服務(wù)商的快速增加,手機的用戶數(shù)也將隨之增加。預(yù)計到2003年全球?qū)惺畠|個手機用戶。這些數(shù)字表明未來通過電話來訪問互聯(lián)網(wǎng)無疑是最普遍的一種工具,既然人類的自然語音通過電話能夠被識別何理解的話,那么電話將無疑是最適合的一種工具用來提供關(guān)于大多數(shù)用戶所需求的市場和服務(wù)
從20世紀(jì)90年代末以來,隨著語音技術(shù)的成熟和逐步實用化,由于計算機硬件性能的飛速提高,語音門戶開始在世界發(fā)達國家出現(xiàn)。特別是在歐洲和美洲,較高的用戶消費水平能夠消化吸收較昂貴的新技術(shù),語音技術(shù)開始進入客戶服務(wù)和信息服務(wù)領(lǐng)域,并逐漸與互聯(lián)網(wǎng)融合在一起,為客戶提供個性化和人性化的服務(wù)。
炎黃新星基于中國電信交換系統(tǒng)接口,提供基于IP的新一代語音門戶的解決方案,提供了通過電信網(wǎng)和互技術(shù)實現(xiàn)
服務(wù)內(nèi)容:
商旅人士可隨時隨地輕松獲取各種信息。例如,用戶只需撥打語音門戶網(wǎng)的號碼,就可在引導(dǎo)之下便捷瀏覽所需信息。在這個過程中,無須鍵入菜單選擇,僅需簡單的語音應(yīng)答即可完成操作。所以,語音門戶簡單易用--無論是通過PC機、手機、還是固定電話,也無論是在辦公室、家中、還是在路上、車上,“瀏覽”網(wǎng)絡(luò)的過程變得輕松無比!
下述的例子中對于商旅人士而言可以在不同時間和不同地點是有幫助的:
- 收聽新聞或了解當(dāng)?shù)亟煌ㄇ闆r
- 隨時得到企業(yè)新信息服務(wù)
- 查閱電子郵箱或語音信箱中的內(nèi)容,并回復(fù)日常的電子郵件,傳真和語音郵件
- 尋找和預(yù)訂當(dāng)?shù)氐娘埖?/li>
- 尋找行車路線
- 了解當(dāng)?shù)赜霸旱碾娪、關(guān)于電影評論的觀點以及可以在線購買演出當(dāng)日的電影票
- 得到股票的最新指數(shù)及個股報價,包括當(dāng)日開盤價/收盤價、最高價/最低價、當(dāng)前買入價,成交量等詳細信息呈現(xiàn)出來
- 查詢到各大航空公司的航班時刻,包括航班號,起飛時間,到達時間等信息。然后可直接接通機票預(yù)訂中心
- 訂一份美味的工作餐
- 使用個人信息服務(wù)。個人信息服務(wù)可以包括個人日歷、通訊錄、語音郵箱和個人理財?shù)鹊取?/li>
核心技術(shù):
- 文語轉(zhuǎn)換
文語轉(zhuǎn)換采用了炎黃新星與清華合作的華意語音計算機研究中心的第二代漢語文語轉(zhuǎn)換技術(shù),支持多語言的語音合成,音速、音質(zhì)及韻律均可靈活調(diào)整,合成質(zhì)量貼近自然話務(wù)播音員。
- 自動語音識別
語音識別采用了最新的語音技術(shù),包含先進的識別引擎及大型的數(shù)據(jù)庫支持系統(tǒng),支持多語言語音識別。系統(tǒng)接收其他系統(tǒng)模塊的語音信息,通過ASR轉(zhuǎn)換成相應(yīng)的文字信息,將文字信息以文本方式發(fā)送回相應(yīng)的系統(tǒng),或通過命令分析,將分析出的命令送回相應(yīng)的系統(tǒng)模塊。
- 語音轉(zhuǎn)換
目前調(diào)用清華TTS合成后的只支持WAV和VOX這兩種語音格式, WAV和VOX都不適合在INTERNET上傳輸,所以TTS SERVER就必須對TTS合成好語音格式進行轉(zhuǎn)換。
支持的語音格式有以下幾種:
NMS ADPCM
G..726-compliant ADPCM
OKI ADPCM (6 and 8 kHz)
ASF,WMA(Active Stream Format)
- 監(jiān)控服務(wù)
定時輪詢監(jiān)查各個SERVER的工作狀態(tài),如果發(fā)生異常,監(jiān)控系統(tǒng)不再分配任務(wù)給該SERVER。并且會自動報警,呼叫系統(tǒng)管理員或EMAIL錯誤信息給管理員。
- 可靠過濾
當(dāng)發(fā)送請求包出現(xiàn)錯誤的時候,不管是命令還是內(nèi)容,系統(tǒng)都會向客戶端發(fā)送從新請求發(fā)送命令
- 負載平衡
可控制多臺主機擴展運行,并通過任務(wù)分析、任務(wù)調(diào)度,達到負載平衡。
- 二次開發(fā)接口
提供IVR業(yè)務(wù)流程的二次開發(fā)接口,無須復(fù)雜的C、C++等編程語言,UI(圖形用戶界面)自動生成,方便簡單。
- 提供客戶端API接口
提供此客戶端API對每一個登陸系統(tǒng)的客戶標(biāo)識(客戶端IP+TCP端口+Serial)分配一個獨立的數(shù)據(jù)結(jié)構(gòu),因此支持客戶端編寫多線程程序,以提高系統(tǒng)的運行效率。這套接口最多支持5個客戶標(biāo)識同時登陸系統(tǒng)。
當(dāng)多個客戶標(biāo)識登陸系統(tǒng)時,本客戶端接口既支持多線程開發(fā),也支持單線程開發(fā)。
語音門戶將使更多的用戶能夠快速接入互聯(lián)網(wǎng)的海量信息庫,帶來新的業(yè)務(wù)增長點。電信系統(tǒng)是以大用戶量、大數(shù)據(jù)量、大工作負荷為特點的,要求系統(tǒng)響應(yīng)迅速、工作穩(wěn)定、維護簡便,并能夠自動處理故障。而炎黃新星的語音門戶提供的語音識別引擎和TTS都是電信級的產(chǎn)品,在技術(shù)設(shè)計時考慮了與電信網(wǎng)絡(luò)的集成,可以廣泛的運用到CTI的各個技術(shù)領(lǐng)域。
炎黃新星公司供稿 CTI論壇編輯