曾幾何時,人們對XML已耳熟能詳,并將它用于描述圖像和結構復雜的其他數據。Web技術發(fā)展之快令人驚嘆!現在,業(yè)界又正在展開一項XML的新的應用:VoiceXML(話音可擴展標記語言),其主要特點是通過語音輸入和音頻輸出支持人機對話。
VoiceXML的基本功能
VoiceXML是萬維網集團(W3C)定義的可擴展標記語言(XML)的一種新的應用。或者說它是一種域專用語言,根據所播放的音頻文件、要口述的文本、要記錄和識別的語言以及所收集的按鍵音輸入,定義人和計算機之間的對話。VoiceXML可以描述傳統的語音響應業(yè)務以及新的混合主動式業(yè)務。
VoiceXML的主要特性
VoiceXML 1.0版的主要特性可以分為4個方面:對話、電話、平臺和性能。
VoiceXML分布式模型
Web為每個用戶提供全球范圍的信息,同時給每個信息和服務提供商提供全球范圍的用戶。因此,分布式應用模型是Web的基本模型;VoiceXML建立在與基于Web的相同的模型上。圖1表示通過電話訪問的VoiceXML業(yè)務使用的基于Web的分布式應用模型。
青出于藍而勝于藍
盡管VoiceXML重用許多HTML的概念和設計,但由于可視和語音交互之間的區(qū)別,它在幾個方面具有不同的特點。例如,HTML文件是從統一資源識別符確定的網絡資源中讀出的單個元素,并同時將所有的元素提供給用戶。VoiceXML則不同,它包含若干對話元素(選單、表格),依次順序地將這些元素提供給用戶。這種區(qū)別歸因于可視媒介能夠同時顯示若干選項,而話音媒介本來就具有連續(xù)性特點。
話音媒介連續(xù)性的再一個不同特點是要求標記包含應用邏輯,以用于在對話元素之間排列程序。這一要求反映在順序邏輯元素的集成方面,VoiceXML比HTML更緊湊。例如,VoiceXML包含順序控制元素,而在HTML中,這種控制只能通過更麻煩的編寫腳本的方法才能實現。
W3C語音瀏覽器工作組已將VoiceXML 1.0版確定為對話標記語言的基礎。VoiceXML客戶程序和VoiceXML應用業(yè)務,目前已在許多公司中開始實用。