在面對(duì)電話這個(gè)工具的時(shí)候,人們習(xí)慣于使用語(yǔ)音來(lái)進(jìn)行操作,而0-9的數(shù)字鍵和*鍵、#鍵已經(jīng)難以表達(dá)現(xiàn)在越來(lái)越多的信息內(nèi)容了。因此,在日常生活中,各種復(fù)雜的電話菜單不是讓我們感到迷茫就是急不可耐,真想給電話接上鼠標(biāo)鍵盤。語(yǔ)音識(shí)別技術(shù)則能使整個(gè)電話菜單扁平化,進(jìn)入系統(tǒng)以后,用戶可以說(shuō)出他的指令,進(jìn)入其中任何一級(jí)菜單。1999年,Evans Group Research對(duì)使用各種語(yǔ)音系統(tǒng)的250個(gè)用戶進(jìn)行調(diào)查,發(fā)現(xiàn)對(duì)于語(yǔ)音界面和按鍵式系統(tǒng),有83%的用戶更傾向于前者。
語(yǔ)音合成(Text To Speech),簡(jiǎn)稱TTS技術(shù),是將任意文本實(shí)時(shí)的轉(zhuǎn)換為自然語(yǔ)音的一項(xiàng)技術(shù),它涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理技術(shù)、多媒體技術(shù)等多個(gè)學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項(xiàng)前沿技術(shù)。解決的主要問(wèn)題就是如何將文本狀態(tài)的文字信息轉(zhuǎn)化為可聽(tīng)的聲音信息。使以往只能用眼睛看的文字信息,也可以用耳朵來(lái)聽(tīng)。