捷通華聲TTS在掌上電腦、信息家電等領(lǐng)域的解決方案
2002/09/01
1. 掌上電腦
1.1 捷通華聲TTS在掌上電腦上的應(yīng)用
由于掌上電腦的屏幕太小,閱讀信息很不方便,這形成了信息獲取的一個(gè)瓶頸。人們對掌上電腦追求是越來越小巧,但是越小,這個(gè)瓶頸就越發(fā)突出。雖然各個(gè)廠家都在大力發(fā)展掌上電腦的應(yīng)用軟件,尤其是互聯(lián)網(wǎng)應(yīng)用的軟件,使其能夠收發(fā)郵件,瀏覽網(wǎng)頁,但是面對互聯(lián)網(wǎng)上的大量信息,如果都通過一個(gè)比手掌還小的屏幕去閱讀,其難度可想而知。不僅眼睛容易疲勞,不停滾屏也需要很大的耐心。因此,如果我們能夠在掌上電腦上應(yīng)用語音合成技術(shù),通過"聽"而不是"看"來讀取大量的信息,就可以打破瓶頸的束縛,為掌上電腦的進(jìn)一步普及提供一個(gè)很有力的基礎(chǔ)。
掌上電腦的內(nèi)存存儲容量十分小,而且沒有硬盤一類的外部存儲設(shè)備,這些因素導(dǎo)致了很多在臺式微機(jī)上得到很好應(yīng)用的軟件無法在嵌入式操作系統(tǒng)環(huán)境下運(yùn)行,TTS系統(tǒng)也是如此。普通的TTS技術(shù)需要20M以上的音庫才能完成男女聲的語音合成,顯然不能完成在掌上電腦的應(yīng)用,而捷通華聲公司的TTS具有音庫壓縮技術(shù)和音色轉(zhuǎn)化技術(shù),從而使捷通華聲TTS技術(shù)在掌上電腦上的應(yīng)用成為可能。
1.2 捷通華聲TTS在嵌入式操作系統(tǒng)應(yīng)用歷程
三年來,捷通華聲公司積累了將TTS技術(shù)與其他應(yīng)用軟件相結(jié)合的豐富經(jīng)驗(yàn)("錄易"漢語智能輸入輸出系統(tǒng)),TTS技術(shù)向其他硬件系統(tǒng)上移植的核心技術(shù)(TTS在電話語音卡上的開發(fā)),為我們實(shí)現(xiàn)TTS技術(shù)向嵌入式操作系統(tǒng)的移植打下了堅(jiān)實(shí)的技術(shù)基礎(chǔ),并保持業(yè)已形成的領(lǐng)先優(yōu)勢。
我們成功實(shí)現(xiàn)了捷通華聲TTS在"天權(quán)2000+"上的移植。在"天權(quán)2000+"上移植實(shí)驗(yàn)的成功表明捷通華聲公司已經(jīng)具備了向嵌入式操作系統(tǒng)移植中文語音技術(shù)的能力,為全面進(jìn)入產(chǎn)品化階段打下了基礎(chǔ)。
2000年10月,捷通華聲公司成功推出國內(nèi)第一套應(yīng)用于掌上電腦的語音軟件--語音伴侶-CE版。該軟件成功實(shí)現(xiàn)掌上電腦"開口說話",為解決嵌入式設(shè)備獲取信息的"瓶頸"難題提供了一套嶄新的方案。掌上電腦等嵌入式設(shè)備的軟件應(yīng)用已成為現(xiàn)實(shí)。
2001年7月,捷通華聲公司推出了目前世界領(lǐng)先的嵌入式TTS漢語語音合成技術(shù),推動了語音技術(shù)在嵌入式中應(yīng)用的發(fā)展。
1.3 捷通華聲TTS在掌上電腦的解決方案案
捷通華聲公司的TTS技術(shù)與其他文語轉(zhuǎn)換系統(tǒng)相比具有獨(dú)特的音庫壓縮等特點(diǎn),使捷通華聲TTS技術(shù)向嵌入式操作系統(tǒng)的移植(尤其是向PDA上的移植)具備先決條件。據(jù)市場調(diào)研及考證:捷通華聲公司是最早掌握該技術(shù),及最先提出在掌上電腦應(yīng)用該技術(shù)的公司。該系統(tǒng)在2001年中關(guān)村電腦節(jié)上榮獲"十大IT創(chuàng)新產(chǎn)品"。
捷通華聲公司的TTS技術(shù)(jTTS),是具有自我版權(quán)的TTS技術(shù),以大規(guī)模真實(shí)錄音的語音庫為基礎(chǔ),增加音庫壓縮算法和音色變換算法形成核心技術(shù)。此核心技術(shù)與國內(nèi)其他文語轉(zhuǎn)換技術(shù)相比較,具有如下特點(diǎn):
· 系統(tǒng)輸出語音清晰度高。
· 系統(tǒng)輸出具有非常好的自然度。
· 音庫大小可縮擴(kuò),小音庫僅為1MB。
· 合成速度快。
正是因?yàn)榻萃ㄈA聲TTS具有以上的特點(diǎn),使得捷通華聲公司的TTS技術(shù)可以向嵌入式操作系統(tǒng)移植。特別是小音庫和音色轉(zhuǎn)換的特點(diǎn),使得在嵌入式操作系統(tǒng)下不會占用太大的資源。
捷通華聲公司語音合成技術(shù)向WinCE操作系統(tǒng)環(huán)境下移植的技術(shù)已經(jīng)成熟,進(jìn)入到應(yīng)用階段。庫大小為1M,運(yùn)行空間在2M左右,完全可以滿足掌上電腦應(yīng)用的需要。
捷通華聲公司提供最新的WinCE環(huán)境下的語音合成開發(fā)工具包(jTTS-ce SDK),掌上電腦應(yīng)用程序的開發(fā)廠商可以利用此SDK在其自己的應(yīng)用中加入語音合成的功能。另外,捷通華聲公司還可提供WinCE版本下的"語音伴侶",提供閱讀電子文檔和有聲鬧鐘的功能,以供掌上電腦的生產(chǎn)廠家選用。
目前捷通華聲公司已經(jīng)在不同的操作系統(tǒng)和硬件環(huán)境中進(jìn)行了移植,操作系統(tǒng)包括:Hopen、Linux、Nucleus、WinCE 2.11
(Palm PC)、WinCE 3.0 (Pocket PC, Pocket PC 2002), WinCE .NET、Penbex等;CUP包括:MIPS、DragonBall,、StrongARM、ARM7、X86等。
2.1 TTS在信息家電中的應(yīng)用
應(yīng)該說,無論從商業(yè)角度還是從促進(jìn)用戶接觸互聯(lián)網(wǎng)的社會意義上來說機(jī)頂盒都是很好的概念。然而我們發(fā)現(xiàn)機(jī)頂盒的銷售并不理想。據(jù)我們的分析,有聲的電視機(jī)變成了無聲的網(wǎng)絡(luò)瀏覽器是用戶并不習(xí)慣使用的一個(gè)很大的原因。我們注意到,多年以來,人們已經(jīng)習(xí)慣將電視機(jī)作為家庭生活的一個(gè)娛樂中心,圖像和聲音必不可少,而在目前的機(jī)頂盒系統(tǒng)中,人們在電視前默默無聲地閱讀網(wǎng)頁信息。從開始對商品的認(rèn)織習(xí)慣來說,人們對"熱鬧慣了"的電視機(jī)變成了一個(gè)"啞口無言"的顯示器,可能會很不習(xí)慣。因此,引入語音合成技術(shù)會對機(jī)頂盒的推廣有很大地促進(jìn)作用。
語音一直是人們生活中最重要的交流手段,在一些新式的信息家電中,也采用了語音的方式來通知用戶狀態(tài)或信息,但一般都是采用錄音回放的方式,無法實(shí)現(xiàn)對任意文本的閱讀。對于需要上網(wǎng)的信息家電來說,所閱讀的信息肯定是任意的而非事先固定的。這也正是語音合成技術(shù)的用武之地。
在信息家電中使用語音合成技術(shù)的難點(diǎn)和掌上電腦的情況是一樣的,需要較小的庫和運(yùn)行內(nèi)存。
2.2 捷通華聲TTS在信息家電中的解決方案
類似于掌上電腦,在WinCE操作系統(tǒng)下,捷通華聲公司已經(jīng)推出了實(shí)用的語音合成技術(shù)。捷通華聲公司可以向其它廠商提供捷通華聲TTS開發(fā)工具包(jTTS-ce
SDK)。捷通華聲公司也將根據(jù)不同用戶的需求將語音合成技術(shù)移植到HOPEN等不同的操作系統(tǒng)中。
另外,捷通華聲公司將會投入精力在語音合成技術(shù)的硬件實(shí)現(xiàn)上,例如用DSP(數(shù)字信號處理)芯片來實(shí)現(xiàn),以便使語音合成技術(shù)更好地為信息家電服務(wù)。
3. 其它
我們所列舉的嵌入式應(yīng)用只是幾個(gè)最具有代表性的領(lǐng)域,類似的嵌入式應(yīng)用還有很多,如WAP手機(jī)、可以講故事的玩具等。在這些領(lǐng)域中,由于沒有操作系統(tǒng),語音合成主要的實(shí)現(xiàn)手段將是芯片技術(shù),這也正是捷通華聲公司今后研究的目標(biāo)之一。
值得關(guān)注的是,捷通華聲還同時(shí)提供嵌入式手寫識別技術(shù)和嵌入式語音識別技術(shù),并將它們有機(jī)的結(jié)合起來,實(shí)現(xiàn)一個(gè)完整的嵌入式整體解決方案。相信該方案能為今后各類手持設(shè)備、信息家電設(shè)備提供必不可少的實(shí)用功能。
捷通華聲公司供稿 CTI論壇編輯
捷通華聲發(fā)布jASR5.5 ASR價(jià)格面前將無怯步 2008-04-16 |
捷通華聲TTS成功登陸中國郵政儲蓄銀行 2008-04-03 |
捷通華聲 jTTS 5.5 全面支持 MRCPv2標(biāo)準(zhǔn) 2008-03-31 |
捷通華聲移動導(dǎo)航HCI解決方案廣受青睞 2008-03-26 |
身邊的“智能”生活 2007-12-28 |