首頁>>廠商>>語音識別與合成>>科大訊飛

吳曉如:語音技術在銀行信息化的應用

2005/11/11

  11月11日,中國中小銀行信息化發(fā)展高層論壇在北京隆重召開,本次會議將以其主題的獨家性成為本年度最具操作指導意義的中小銀行信息化盛會。騰訊財經(jīng)獨家圖文直播本次會議。

  以下為科大訊飛吳曉如博士發(fā)言實錄:

  吳曉如:銀行系統(tǒng)的各位領導各位來賓大家下午好,首先我代表這一次會議的合作方之一科大訊飛向銀行系統(tǒng)的朋友參加銀行信息化高層論壇表示熱烈歡迎。

  今天介紹的主要是語音技術,以及語音技術在銀行信息化的應用,首先簡單介紹一下語音技術,同時簡單介紹一下科大訊飛技術公司。語音技術在銀行系統(tǒng)最主要的應用就是呼叫中心的應用。呼叫中心又稱為客戶服務中心,他是把計算機和電信集成技術整合在一起,形成以電話與用戶溝通的手段,第一代呼叫中心是電話熱線,如果撥打電話越來越多就需要呼叫中心,首先是簡單的把多個線路分配到不同的專家那里去為不同的客戶提供解答。第二代呼叫中心發(fā)現(xiàn)很多用戶提的共性問題可以通過同樣的方式解答,也就是自動把答案錄在系統(tǒng)里面,用戶提供操作可以知道答案。另外如果用戶問的信息是動態(tài)和個性化的,需要得到答案都不一樣,這些信息很難通過實時錄音實現(xiàn),就催生智能語音技術在呼叫中心的應用。

  語音技術研究目標是使各種智能設備向人一樣能聽會說,主要包含兩個重要的技術,一個是話音合成,是把任意文本信息或者數(shù)據(jù)信息自動的實時轉化為標準流的語音,這樣給智能設備提供一個人工的嘴巴,同時還有一個語音識別技術,可以把語音變成語音命令也可以變成聽寫機。語音識別在呼叫中心主要有什么應用,隨著銀行上面業(yè)務擴展越來越多,通過按鍵式操作很難滿足用戶的需求,用戶要完成一個請求要做很多次按鍵,而且按鍵很復雜,語音識別即使有一千個5千個命令,只要把希望的請求說過系統(tǒng)聽,系統(tǒng)就理解這個請求,使呼叫中心完成這樣的應答。因此語音技術可以用在社會生活方方面面。

  下面舉例說明語音在社會生活的應用。第一個應用是銀行業(yè)來說在電信系統(tǒng)的應用,2004年7月份中國工商銀行總行在全國同時布點新的電話銀行,統(tǒng)一使用科大訊飛TTS技術,應用銀證通,外匯買賣,原來很難提供,現(xiàn)在可以通過交互式語音技術來提供了,語音合成就是自動把文本轉化成語音,所以叫TTS。TTS可以滿足信息海量動態(tài)信息,通過電話的查詢,這里面有一個當時從工商銀行總行現(xiàn)場錄音的演示樣例。(示例)這完成由計算機生成的語音,所以現(xiàn)在計算機合成的語音這是2004年的技術,現(xiàn)在技術已經(jīng)有所提升,這已經(jīng)標準流暢滿足需求。語音在其他方面也有很多需求,剛才也交流了一下,比如智能終端上的應用,比如把我們語音合成做到手機里,以前可以聲控撥號,另外可以聽短信,另外可以連接電子圖書館,可以聽電子圖書,可以把語音技術封裝成芯片,在海南馬自達可以用語音導航。另外車載設備,有一款這種手上拿的裝置,可以改變原來傳統(tǒng)的音響,可以聽文本,在回家路上一邊開車一邊聽相關信息。

  在電信增值交互系統(tǒng)有廣泛應用,比如炫鈴,要記音樂對應的代碼,現(xiàn)在有了語音技術,就不再需要了,只要撥通一個聯(lián)通或電信的統(tǒng)一客服號,你說出希望下載的鈴聲就可以自動幫你完成,大大提高了產(chǎn)品的易用性?拼笥嶏w和微軟成立合肥微軟技術中心,以.NET為平臺,推進語音技術在政府信息化中的推廣。

  下面簡單介紹一下科大訊飛是1999面在中國科大人機語音實驗室基礎上組建的,創(chuàng)業(yè)員工18人注冊資金300萬,現(xiàn)在員工300多人,注冊資金近1億。股東單位除了當時的中國科技大學之外,有聯(lián)想投資,上海復星以及信息產(chǎn)業(yè)部?拼笥嶏w雖然公司成立六年,但是當時科技大學一直得到國家重點科學攻關項目的支持,我們在國內(nèi)國際評比都是大幅度領先,2003年得到杰出青年獎和國家科學二等獎。很多用戶剛剛接觸語音技術的時候,聽上去概念很好但是是不是有可用性,98年之前產(chǎn)生的語音很難被人聽懂,現(xiàn)在產(chǎn)生的語音已經(jīng)標準流暢了,現(xiàn)在聽一下98年之前的語音效果和現(xiàn)在的語音效果。大家聽著比較難,現(xiàn)在經(jīng)過幾年以后有比較大的改善。這其實就是最新的語音合成的語音,這是國家八六三標準文本,去年又邀請日本、歐美的單位進行技術評準,科大訊飛在自然度上面,這次是兩兩相比,大家可以從上面看到,科大訊飛系統(tǒng)自然度大幅度領先其他的參賽單位,在去年八六三項目評選做了有趣的測試,選了三個國家播音員和三個自然人,經(jīng)過這一次評測之后,平均得分播音員4.7,一般自然人3.7,這個系統(tǒng)還達到4分更加標準一些,這評測以信息發(fā)布的內(nèi)容,如果涉及感情,疑問感嘆,人更強一些。

  科大訊飛除了現(xiàn)在在中文上做的語音合成做的工作,現(xiàn)在也有英文合成系統(tǒng),所以現(xiàn)在銀行信息化過程中對國際化的需求也可以逐漸滿足,包含也有粵語的合成系統(tǒng),F(xiàn)在多語種的合成科大訊飛還在不斷往前推進研發(fā)工作,科大訊飛從發(fā)展過程中得到國家各方面支持,在2000年5月份的時候,科技部將科大訊飛認定為國家語音技術成果唯一產(chǎn)業(yè)化的基地,在02年8月份國家發(fā)改委確認科大訊飛作為國家語音的示范研究中心,03年10月份信息產(chǎn)業(yè)部正式確認科大訊飛和國內(nèi)其他十幾家單位一起組建中文語音標準交互組,來制定中文語音的標準,科大訊飛作為中間的標準。希望將國內(nèi)語音研究的優(yōu)勢和結果,和企業(yè)的標準逐漸形成國家的標準,通過這個標準保護民族語音產(chǎn)業(yè)的發(fā)展。在03、04年科大訊飛被發(fā)改委信息產(chǎn)業(yè)部聯(lián)合確定國家語音產(chǎn)業(yè)唯一的國家規(guī)劃布局的重點軟件企業(yè)。這圖是當時標準工作組成立的情況,今年第二次標準工作組已經(jīng)有了語音傳輸輸入輸出的標準。現(xiàn)在語音技術除了剛才介紹的幾個典型應用,已經(jīng)滲透很多領域,比如中國保險業(yè)第一個總部級呼叫中心,比如中國首批建設的大銀行,比如工商銀行全國布點,招商銀行光大,以及省級電話銀行,包含電信第一個上海語音門戶,全國14多個省份開通 電力自助式自序,這次十運會語音是由科大訊飛和華為共同承擔的,現(xiàn)在科大訊飛語音技術已經(jīng)滲透到社會生活各個方方面面。

  下面介紹一下TTS技術在銀行業(yè)的典型應用和怎么應用的,除了剛才介紹的工行應用,在2004年5月份,廣大銀行在全國23個城市超過1千線呼叫中心采用TTS,廣大所有語音播報都是通過TTS技術實現(xiàn)的,此外在2003年的7月份深發(fā)展在全國14個城市呼叫中心統(tǒng)一使用了語音合成技術,因為使用情況非常好,已經(jīng)應用對公,信貸消費等很多業(yè)務中,所以先后擴容過兩次。此外招商銀行在今年4月份經(jīng)過比較細致的考察已經(jīng)開始在全國電話銀行中通過語音合成技術提供自助式語音播報技術。現(xiàn)在沒有進行國家大集中建設的各個省分行,比如建設銀行山東、福建、云南。包括工商銀行的江蘇、山東,以及剛剛建設完北京交行,上海交行,都把TTS融入呼叫中心。此外金融系統(tǒng)其他的應用就是證券,證券的應用和銀行有不可分割的關系。比如動態(tài)的股評信息,基金電話信息都可以提供呼叫中心提供服務。

  為什么要把語音技術用到銀行呼叫中心去,首先可以豐富電話銀行服務的范圍,原來通過錄音的形式,有很多信息很難通過比較好的效果推送禮用戶,現(xiàn)在有了語音技術就可以,另外可以針對用戶個性化的服務,比如用戶自己交易的信息,現(xiàn)在也可以方便播報給用戶,此外可以降低運營的成本,原來需要通過銀行專家提供的服務,大家經(jīng)常問的問題也可以通過語音的形式提供服務。

  下面簡單介紹一下TT S技術在銀行中可以有哪些實實在在的應用,當時以招商銀行的應用,比如帳戶查詢,轉帳查詢等應用,呼叫中心在沒有應用TTS之前這效果可能很難接受,另外在轉帳服務,原來效果也是比較難接受的。經(jīng)過改造以后。其他包含自助交費,提供費用的查詢提供更加豐富的內(nèi)容,包含提供交費的結果進行確認,比如電話號碼手機號碼身份證再次的確認,此外提供銀證轉行的信息,銀證通可以讓股民適時查詢動態(tài)股評信息。另外國債買賣,外匯買賣,自助貸款都可以使用語音技術提高服務的效果和品質,另外一些公共信息服務系統(tǒng),比如業(yè)務咨詢服務,存貸款利率,營業(yè)網(wǎng)點ATM機分布信息都可以通過電話查詢,而且動態(tài)變化的時候,不像以前用戶非常麻煩得錄音,因為數(shù)據(jù)庫關聯(lián)了語音,就可以動態(tài)實時把變化以后的結果傳遞給用戶。

  另外銀行跟我們探討各類存貸業(yè)務,以及公告通知,銀行很多營銷類的服務都可以通過外播式的手段實現(xiàn),因此語音技術可以顯著增強電話銀行業(yè)務的主動營銷和差異化營銷的能力,之前有很多不能做的事情,比如要通過網(wǎng)絡查詢現(xiàn)在可以通過語音形式來實現(xiàn)。

  綜上認為TTS可以拓寬服務范圍,可以提供豐富的信息和內(nèi)容,可以顯著提升語音的效果,之前通過一個字拼起來效果用戶聽了很難受,可能不愿意接受銀行電話的服務,現(xiàn)在有了這服務可以覆蓋更多的領域,原來更多的人工服務可以交給電話銀行來做,這樣可以降低人工的成本和勞動強度,此外除了和CRM結合可以通過外播服務可以增強銀行的營銷能力,今天介紹以語音合成技術為介紹,下一步語音與視頻的合成技術,未來語音也會找一些視頻用上去,總體來講智能化專業(yè)服務,貫穿電話銀行整個項目,可以顯著提高電話銀行服務的品質。

  今天我介紹就到這兒,謝謝大家!

騰訊財經(jīng)



相關鏈接:
訊飛暢言語音教具系統(tǒng)榮獲“創(chuàng)新軟件產(chǎn)品” 2009-09-08
科大訊飛嵌入式語音新產(chǎn)品發(fā)布會在深圳舉行 2009-09-07
“會說話”的顯示屏提升居民小區(qū)信息服務水平 2009-09-07
訊飛語音助力太平人壽客服中心 2009-08-28
訊飛語音助力CDMA手機競爭終端市場 2009-08-14

相關頻道:  銀行_與_語音合成TTS           文摘   行業(yè)_銀行_新聞   技術_語音合成_文摘