語音門戶的革命
英特爾公司Dialogic分部語音部技術營銷經(jīng)理GeneEagle先生
電子商務是當今世界最熱門的商業(yè)趨勢,而語音門戶正在迅速成為電子商務中的熱點;谡Z音的互聯(lián)網(wǎng)門戶,也就是語音門戶,代表著計算機語音與互聯(lián)網(wǎng)融合的新趨勢。
語音門戶讓用戶可隨時隨地輕松獲取各種信息。例如,用戶只需撥打語音門戶網(wǎng)的800號碼,就可在引導之下便捷瀏覽所需信息。在這個過程中,無須鍵入菜單選擇,僅需簡單的語音應答即可完成操作。所以,語音門戶簡單易用--無論是通過PC機、手機、還是固定電話,也無論是在辦公室、家中、還是在路上、車上,“瀏覽”網(wǎng)絡的過程變得輕松無比!
由于語音技術的發(fā)展,語音門戶將電話交互過程從以廠商為中心轉向以用戶為中心。這一轉變在為用戶提高效率和降低業(yè)務成本的同時,還將提高用戶的滿意度。
未來數(shù)年,語音門戶將大大改變?nèi)藗兪褂秒娫挼姆绞揭约皬S商與主叫用戶溝通的方式。在當今以廠商為中心的模式中,主叫用戶只能以掛斷電話的方式來“擺脫”某一企業(yè)的交互式語音應答(IVR)系統(tǒng)。而在未來以用戶為中心的模式中,主叫用戶可與語音門戶展開交互式對話,可以象“網(wǎng)上沖浪”般快捷、方便地從一家企業(yè)自由地“跳”到另外一家企業(yè)。
語音技術炙手可熱
語音技術是當今迅猛發(fā)展的電子商務經(jīng)濟最重要的“推進器”之一。語音技術市場正在迅速成長,且發(fā)展勢頭良好。分析家預測,從1999年到2004年,語音技術市場將以每年31%的速度持續(xù)增長。語音技術市場的迅速擴展意味著我們正面臨大量部署語音應用的轉折期。
語音技術如此“火爆”有幾方面的原因,這既與語音技術本身有關,同時也因為語音技術能夠讓開發(fā)商不斷創(chuàng)建出真正滿足現(xiàn)實用戶需求的應用。比如,90年代早期,簡單的語音應用只支持詞匯較少的(20到30個單詞)命令和控制指令,且只能識別不連續(xù)的數(shù)字,F(xiàn)在,在我們的眼前卻出現(xiàn)了諸如虛擬個人助理、股票交易代理、企業(yè)內(nèi)自動值守、旅游訂票系統(tǒng)和許多其他可實現(xiàn)語音功能的復雜應用。在不遠的未來,在公網(wǎng)中更將出現(xiàn)象由大型詞匯表(一百萬字條)支持的自動目錄幫助、企業(yè)應用托管,如語音門戶這樣的應用。
技術使然
未來語音應用的關鍵在于語音技術的發(fā)展。在過去幾年里,ASR引擎的精確度和詞匯量已經(jīng)大大提升。精確的算法、顯著增強的處理能力、更低的成本和實現(xiàn)自助溝通、連續(xù)語音的更強大技術推動了這些進步。Barging技術也已完善,可使主叫用戶根據(jù)提示進行應答,并且可識別用戶的應答。自然語言功能的推出也對語音應用的用途產(chǎn)生了極大影響。
服務提供商扮演的角色增多
除了新型技術的出現(xiàn)和原有技術的發(fā)展外,在當今具有強大影響力的語音應用發(fā)展大潮中,另外一個關鍵因素是技術供應商變換了自己的角色。當今的服務提供商(主要是過去的算法供應商)已經(jīng)發(fā)展成為全方位的提供者,擁有大批人文因素設計、應用分析、系統(tǒng)分析、語言學和電話應用開發(fā)方面的專家,他們推出了廣泛的專業(yè)服務,支持創(chuàng)建、部署和維護高級語音應用的功能。
新型測試工具大大縮短了開發(fā)時間
應用測試已經(jīng)大大改進,使技術供應商開發(fā)可快速、持續(xù)部署的應用成為可能。
現(xiàn)在,從一種新型應用的基本研究設計開始,開發(fā)商就可謹慎地、小規(guī)模地進行測試,然后將測試的結果不斷反饋運用到開發(fā)過程中,直到可部署實際應用為止。一旦一個應用實際部署之后,開發(fā)商可將這一技能應用到其他類似的應用中,這樣,大規(guī)?焖俨渴鹦滦蛻米兊酶唵屋p松。
同時,技術開發(fā)商也投入了很多精力來開發(fā)可方便快速部署應用的強力工具。對話應用組件(DAC)便是這樣一種高級程序工具,它溶聚了大量從應用對話設計和與經(jīng)常性用戶交互中獲得的大量寶貴經(jīng)驗和知識。例如,DAC可包含小程序,這些小程序允許用戶從目錄中選擇項目、讓應用程序收集信用卡號碼、接收“是”或“不是”這樣的回答、獲取旅行出發(fā)點和目的地的信息、或查看股票價格等。通過提供可再利用目標程序中的專門技術,DAC可大大縮短開發(fā)新型應用的時間。過去需30人、數(shù)年才能開發(fā)出的應用,現(xiàn)在利用更少的人員、在數(shù)月甚或數(shù)周之內(nèi)即可開發(fā)出來。
文本轉語音已經(jīng)實現(xiàn)
除了語音識別技術之外,文字轉換為語音(TTS)的技術也大大提高,成為促進語音門戶發(fā)展的另一塊重要因素。過去由于語音轉換質(zhì)量差,阻礙了TTS的廣泛應用,而最新一代的TTS技術顯著地提高了語音轉換的質(zhì)量。語言支持也得到很大的提高。此外,TTS現(xiàn)實應用中至關重要的組件——處理“臟(不正規(guī))”數(shù)據(jù)的預處理器已經(jīng)開發(fā)出來?尚拚⑻幚碇T如首字母縮寫詞、縮略詞和聲調(diào)的電子郵件預處理器,也使通過電話閱讀電子郵件信息的應用成為可能。
互聯(lián)網(wǎng)的發(fā)展
互聯(lián)網(wǎng)電子交易革命使人們對即時信息接入和強大的交易處理功能寄予厚望。為了滿足這種期望,業(yè)界在開發(fā)以HTML等腳本語言為基礎的基礎設施方面已經(jīng)開展了大量的工作。
新型具有語音功能的語言,諸如VoiceXML,正在將互聯(lián)網(wǎng)的功能擴展到電話上,F(xiàn)在,具有語音功能的語言不僅可以利用現(xiàn)有的基礎設施,并可對支持互聯(lián)網(wǎng)的整個基礎設施進行補充,將互聯(lián)網(wǎng)的基礎設施擴展到客戶機/服務器架構中,其結果是產(chǎn)生了可由基于互聯(lián)網(wǎng)的遠程應用來控制的、具有強大功能的語音服務器平臺。
具有語音功能的IVR的發(fā)展
可實現(xiàn)語音功能的交互式語音應答系統(tǒng)(IVR)的發(fā)展速度非常迅猛。比如,您可考察一下利用800號碼提供主叫用戶接入服務的企業(yè)。最初的情況是用戶撥打800號碼,然后接到提供服務的人員處。但企業(yè)很快認識到人員配備成本昂貴,許多工作可采用自動處理方式,從而節(jié)約成本開支。IVR系統(tǒng)即可實現(xiàn)這種自動處理。企業(yè)下一步就是將IVR系統(tǒng)與數(shù)據(jù)庫集成在一起,以便IVR系統(tǒng)可動態(tài)地處理信息。這樣,主叫用戶利用計算機語音集成(CTI)技術接入企業(yè)的IVR系統(tǒng),之后,這一呼叫被IVR系統(tǒng)實時轉移到相關人員處,同時,個性化的主叫用戶信息(比如未完成的訂貨情況)可通過彈出的屏幕傳遞給這一處理人員,這為企業(yè)提供最好的服務建立了堅實的基礎。另外,通過使IVR系統(tǒng)前端具有語音功能,強大的ASR功能可使企業(yè)節(jié)省更多成本。
對主叫用戶而言,語音意味著更自然和更舒適的界面。可實現(xiàn)語音功能的IVR應用也比雙音多頻(DTMF)、或按鈕應用更方變。這將帶來更好的投資回報。
語音門戶網(wǎng)革命
到2001年,全球將有10億多部電話投入使用,任何企業(yè)都不應該置身于這些用戶視線之外,否則后果不堪設想。企業(yè)非常需要借助語音門戶網(wǎng),向用戶提供接入服務。在服務提供商的基礎設施中添加的語音門戶網(wǎng),將從根本上改變企業(yè)與用戶“溝通”的方式,以及用戶與企業(yè)互動的方式。