首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識(shí)別(ASR)  語音識(shí)別產(chǎn)品

電話語音識(shí)別系統(tǒng)流程設(shè)計(jì)

李宏 2003/11/20

  電話語音識(shí)別系統(tǒng)為用戶提供了一個(gè)人性化的界面,人們通過電話-這個(gè)最普及的通訊工具,就可以與計(jì)算機(jī)系統(tǒng)進(jìn)行交談,從而能夠查詢信息、發(fā)出控制命令和進(jìn)行電子商務(wù)交易。

1 語音識(shí)別系統(tǒng)的特點(diǎn)

  語音識(shí)別系統(tǒng)與傳統(tǒng)的IVR最根本的區(qū)別是:語音識(shí)別系統(tǒng)擺脫了電話12個(gè)按鍵的束縛,既簡(jiǎn)捷方便,又可節(jié)省通話時(shí)間。

  同時(shí),由于不需記憶編碼,語音服務(wù)系統(tǒng)可以通過一個(gè)特服號(hào)提供全部服務(wù),即建立語音門戶。不象聲訊臺(tái),一個(gè)節(jié)目就要一個(gè)號(hào)碼,既占用了寶貴的號(hào)碼資源,也很難讓用戶記住。

  語音識(shí)別系統(tǒng)可以提供強(qiáng)大的導(dǎo)航能力,語音識(shí)別系統(tǒng)的用戶不須在聽完冗長(zhǎng)的提示語后逐層進(jìn)入,而是可以直接進(jìn)入最底層服務(wù),且各欄目之間可以任意進(jìn)行跳轉(zhuǎn)。尤其是對(duì)于老客戶,直接進(jìn)入所需的服務(wù)將極大地提高效率并降低通話費(fèi)用。對(duì)于新用戶,系統(tǒng)的語音導(dǎo)航會(huì)逐步引導(dǎo)用戶達(dá)到目標(biāo)。

  一個(gè)用戶滿意的語音識(shí)別系統(tǒng),取決于這個(gè)系統(tǒng)是否擁有優(yōu)良的識(shí)別引擎、穩(wěn)定高效的應(yīng)用程序、與電信交換網(wǎng)絡(luò)的完美集成、和人性化的流程控制。流程控制是直接面向用戶的界面,它是能否滿足用戶需求的關(guān)鍵。就像一個(gè)網(wǎng)站,讓用戶迷茫的主頁肯定影響訪問量。

  合理和友好的流程,才能充分發(fā)揮語音識(shí)別的優(yōu)勢(shì),為用戶提供人性化和個(gè)性化的服務(wù)。反之,無論技術(shù)上多么出色,系統(tǒng)集成如何完美,只要沒有向用戶提供友好的界面,語音識(shí)別系統(tǒng)只會(huì)失敗。

2 流程設(shè)計(jì)原則

  語音識(shí)別技術(shù)的優(yōu)點(diǎn)和缺點(diǎn)都很突出技術(shù),在應(yīng)用中必須揚(yáng)長(zhǎng)避短。
  優(yōu)點(diǎn):無論何時(shí)何地都能使用,操作簡(jiǎn)便,適用于各層次的用戶……
  缺點(diǎn):識(shí)別率不可能達(dá)到100%,對(duì)沒有經(jīng)驗(yàn)的用戶識(shí)別率更低……
  即使有更先進(jìn)的技術(shù),上述缺點(diǎn)也不可能克服,這是因?yàn)檎Z音識(shí)別率受到各種因素的影響,例如:環(huán)境噪聲、電信干擾、回聲、話路質(zhì)量、用戶講話習(xí)慣等。但是,通過流程設(shè)計(jì),就能在最大限度上提高識(shí)別率,令絕大多數(shù)用戶滿意。

  簡(jiǎn)單機(jī)械地照搬IVR流程,就會(huì)令語音識(shí)別系統(tǒng)失去特色,暴露缺點(diǎn)。

原則一:分層合理
  正如IVR系統(tǒng),語音識(shí)別系統(tǒng)同樣要分層。分層的目的在于:用戶并不容易記住各個(gè)欄目名稱,所以每層的欄目不要太多,以5、6個(gè)為宜。很難想象用戶能夠記住并說出10個(gè)欄目。特別是第一層主目錄,絕對(duì)不可超過這個(gè)限度,否則用戶將沒有信心使用系統(tǒng)。

  對(duì)于語音門戶,內(nèi)容會(huì)很多,每層只有幾個(gè)欄目會(huì)使整個(gè)系統(tǒng)結(jié)構(gòu)過于復(fù)雜,在一些用戶比較熟悉的層次里,可以放寬這一約束,進(jìn)行綜合平衡。

原則二:標(biāo)準(zhǔn)和明確的提示語
  用戶通過提示語了解系統(tǒng)的服務(wù)和功能。提示語必須簡(jiǎn)明,并且不能引起用戶的歧義。過于廣告化和文學(xué)化的詞語只會(huì)誤導(dǎo)用戶,例如:"投石問路"就不如"位置服務(wù)"更容易讓用戶理解。

  同時(shí),提示語的字?jǐn)?shù)要限制在3-4個(gè)字。太長(zhǎng),用戶容易說錯(cuò);太短,系統(tǒng)不容易識(shí)別。

原則三:跨層和跳轉(zhuǎn)
  跨層:用戶不必逐層進(jìn)入欄目,只要說出最底層欄目,就能跨層進(jìn)入。
  跳轉(zhuǎn):各欄目之間可以任意跳轉(zhuǎn),不必逐層返回。
  回主目錄:用戶在系統(tǒng)中一旦"迷路",一句"回主目錄"就會(huì)被帶到系統(tǒng)入口。

原則四:用戶幫助
  每一層,都必須有這一層的"幫助"。"幫助"中將更詳細(xì)地向用戶介紹內(nèi)容和使用方法,這樣各層的提示語才能簡(jiǎn)明扼要。"幫助"和提示語是互相補(bǔ)充的。

原則五:完美地完成會(huì)話
  語音識(shí)別受各種因素影響,識(shí)別率不會(huì)達(dá)到100%,用戶也可能不知道該說什么,而放棄使用。因此,在流程設(shè)計(jì)上必須幫助用戶完成整個(gè)會(huì)話流程。

  首先,通過幫助和簡(jiǎn)潔的提示,引導(dǎo)用戶正確說出詞匯。

  還要提供按鍵選擇,在語音識(shí)別不能工作時(shí),幫助用戶完成整個(gè)會(huì)話流程。按鍵作為備份方案是語音識(shí)別系統(tǒng)中絕對(duì)不能缺少的。

原則六:柔性的系統(tǒng)
  用戶可能不會(huì)說出系統(tǒng)規(guī)定的關(guān)鍵詞。因此,語音識(shí)別系統(tǒng)必須有彈性,只要意思相近,系統(tǒng)都應(yīng)該能夠識(shí)別。

原則七:標(biāo)準(zhǔn)化引導(dǎo)設(shè)計(jì)
  為保證整個(gè)系統(tǒng)的一致性,引導(dǎo)提示語必須標(biāo)準(zhǔn)化,例如:返回、主目錄、上一層……,同時(shí),特殊功能鍵(#,*)也必須統(tǒng)一定義。

  從本質(zhì)上講,流程設(shè)計(jì)是一個(gè)心理學(xué)問題,合理的流程要在設(shè)計(jì)和實(shí)踐中不斷的優(yōu)化。應(yīng)該專門設(shè)立流程設(shè)計(jì)小組,設(shè)計(jì)流程和監(jiān)督流程的正確性。流程設(shè)計(jì)和管理是語音識(shí)別系統(tǒng)質(zhì)量管理的關(guān)鍵。這個(gè)隊(duì)伍不一定需要軟件工程師,他們應(yīng)該跳出工程師的思維方式,從用戶角度出發(fā)考慮問題。

3 基本流程設(shè)計(jì)

  當(dāng)用戶說出需求后,語音識(shí)別系統(tǒng)將處理以下情況:

3.1 系統(tǒng)"聽懂",繼續(xù)流程。這是最好的情況,用戶正在享受系統(tǒng)的服務(wù)。

3.2 系統(tǒng)沒有"聽懂",遇到這種情況,要區(qū)別處理:

3.2.1 系統(tǒng)沒有記錄到用戶的講話,沒有錄音?赡苁怯脩舨恢涝撝v什么,也可能是用戶講話聲音太小。此時(shí),系統(tǒng)應(yīng)該引導(dǎo)用戶正確講出關(guān)鍵詞,例如提示用戶"請(qǐng)您說……"。如果系統(tǒng)仍然沒有錄到音,系統(tǒng)就應(yīng)該提示用戶大聲說出需求。如果還不能錄音,則應(yīng)該提醒用戶按鍵輸入選擇了,例如:"XXX請(qǐng)按1,XXX請(qǐng)按2,……幫助請(qǐng)按*,返回主目錄請(qǐng)按#"。

3.2.2 系統(tǒng)錄音無法同規(guī)定的關(guān)鍵詞匹配。用戶講錯(cuò),或者不會(huì)使用系統(tǒng)。此時(shí),系統(tǒng)也應(yīng)該引導(dǎo)用戶使出正確關(guān)鍵詞。如果用戶還不能講對(duì),系統(tǒng)仍然要在提示一次。第三次則要提醒用戶按鍵了。
3.2.3 系統(tǒng)錄音與某個(gè)關(guān)鍵詞相似,但是沒有完全匹配。系統(tǒng)則應(yīng)該提示用戶"您是說XXX嗎?",讓用戶確認(rèn)。從而提高識(shí)別率、體現(xiàn)出系統(tǒng)的友好和人性化。

  好的流程和導(dǎo)航才能能夠幫助用戶盡快熟悉語音識(shí)別系統(tǒng),讓用戶喜愛和使用。

4 自然語言對(duì)話流程

  自然語言對(duì)話是指:用戶完全用平常講話的方式說出需求,語音識(shí)別系統(tǒng)則需要根據(jù)用戶提供的信息理解用戶需求,并且滿足其需求。在流程設(shè)計(jì)上,要解決以下問題:

4.1 不考慮用戶語序。
4.2 過濾多余的、沒有意義的詞匯。例如:"我想","那個(gè)"……
4.3 提示用戶提供完整信息,用戶不必重新說出整個(gè)長(zhǎng)句。

  例如一個(gè)航班查詢系統(tǒng)中,用戶用自然語言查詢信息,他要提供的信息有:日期、大約時(shí)間、起點(diǎn)、終點(diǎn)、或者航班號(hào)。

  用戶可以說:"我要查詢明天中午從北京到上海的航班",也可以說:"4月10日,12點(diǎn)左右,由北京起飛到上海"。系統(tǒng)應(yīng)該對(duì)詞序沒有約束,也應(yīng)該能夠處理一些模糊的概念(早上/上午/中午/……),還必須過濾"我要查詢"、"的航班"等詞匯。

  但是,如果用戶說:"北京到上海"。系統(tǒng)則應(yīng)該詢問用戶:"請(qǐng)問您要查詢哪一天從北京到上海的航班?",用戶直接說出:"明天"就可以了。

  系統(tǒng)必須能夠提示用戶,協(xié)助其簡(jiǎn)便地完成查詢條件的設(shè)定。

5 其他注意事項(xiàng)

5.1 不同系統(tǒng)的不同風(fēng)格
  商業(yè)系統(tǒng)和娛樂系統(tǒng)的提示語風(fēng)格是截然不同的。前者要求嚴(yán)肅和簡(jiǎn)潔,或者則要求輕松和活潑。

  值得注意的是:所有的系統(tǒng)提示語速都應(yīng)該快一些,要相信用戶能夠聽清提示。冗長(zhǎng)和緩慢的提示,會(huì)令用戶煩躁和失去耐心。

  重復(fù)提示用戶也會(huì)浪費(fèi)時(shí)間,如果沒有必要,應(yīng)該盡量減少反復(fù)提示和用戶確認(rèn)。

5.2 提示語
  提示語要簡(jiǎn)潔,錄音音量要大一些。專業(yè)的配音人員和錄音設(shè)備會(huì)給用戶耳目一新的感受,堅(jiān)定用戶的信心。如果配有背景音樂,效果會(huì)出乎你的意料。

  在娛樂系統(tǒng)中,隨機(jī)切換同一內(nèi)容不同的提示語,會(huì)刺激用戶的參與熱情。

5.3 幫助
  "幫助"實(shí)質(zhì)上是系統(tǒng)的操作說明,既是系統(tǒng)介紹和使用手冊(cè),也是對(duì)簡(jiǎn)潔的提示語的補(bǔ)充。用戶通過"幫助",可以更好地理解系統(tǒng)內(nèi)容和操作方法。

5.4 用戶確認(rèn)
  在一些敏感的場(chǎng)合,如電子交易、電子支付等,必須讓用戶通過按鍵進(jìn)行確認(rèn),僅僅通過語音確認(rèn)是不可靠的!當(dāng)然,會(huì)話也要全程錄音。

5.5 同義詞的處理
  根據(jù)前面提到的柔性設(shè)計(jì)原則,系統(tǒng)設(shè)計(jì)時(shí)要考慮到同義詞、多音字的處理。關(guān)鍵詞標(biāo)準(zhǔn)和規(guī)范也需要同時(shí)建立起來,從而保證系統(tǒng)的識(shí)別率。

6 流程管理文檔

  語音識(shí)別系統(tǒng)要通過質(zhì)量管理來保證其性能,必須制訂嚴(yán)格的管理規(guī)范。流程管理的規(guī)范化和標(biāo)準(zhǔn)化就更重要。規(guī)范化和標(biāo)準(zhǔn)化具體體現(xiàn)在管理文檔上,它不僅僅是系統(tǒng)設(shè)計(jì)和編程的基礎(chǔ),也是系統(tǒng)測(cè)試和驗(yàn)收的依據(jù)。

  以下流程管理文檔是必不可少的:

6.1 系統(tǒng)結(jié)構(gòu)圖
  整個(gè)系統(tǒng)的流程結(jié)構(gòu)圖,包括:分層設(shè)計(jì)、欄目設(shè)計(jì)等。

6.2 流程圖
  每個(gè)模塊的詳細(xì)流程,包括:分支、轉(zhuǎn)點(diǎn)、入口、出口等。


6.3 流程控制圖
  流程中每個(gè)轉(zhuǎn)點(diǎn)的詳細(xì)流程處理,包括:錯(cuò)誤處理、提示語等。

6.4 關(guān)鍵詞表
  整個(gè)系統(tǒng)所有的關(guān)鍵詞表,包括:通用關(guān)鍵詞,各層/各欄目關(guān)鍵詞等。

6.5 提示語列表
  整個(gè)系統(tǒng)每個(gè)提示語的編碼,文本,錄音文件名等。

  流程設(shè)計(jì)后,系統(tǒng)的開發(fā)、調(diào)試、測(cè)試、驗(yàn)收都要嚴(yán)格按照以上文檔要求進(jìn)行。系統(tǒng)測(cè)試時(shí),要向測(cè)試人員提供標(biāo)準(zhǔn)的測(cè)試報(bào)告和詳細(xì)測(cè)試程序,測(cè)試人員應(yīng)該認(rèn)真填寫測(cè)試報(bào)告,并將問題及時(shí)反饋。

  質(zhì)量管理流程和測(cè)試標(biāo)準(zhǔn)、測(cè)試報(bào)告不在本文的范圍內(nèi),不再贅述。


作者聯(lián)系方式

李宏:glpglp@sina.com

作者供稿 CTI論壇編輯



相關(guān)鏈接:
企業(yè)無形的代言人---宇高語音撥號(hào)系統(tǒng) 2003-11-20
語音識(shí)別醞釀第二次浪潮 2003-09-15
《華爾街日?qǐng)?bào)》:讓語音識(shí)別軟件解放你的手 2003-09-07
綜述:得意音通到底是什么企業(yè) 2003-08-27
語音應(yīng)用客戶滿意度調(diào)研 2003-07-29

分類信息:     文摘   技術(shù)_語音識(shí)別_文摘