隨著計算機技術的飛速發(fā)展,語音技術的應用日益普及。在呼叫中心領域,語音技術的應用從最初的語音播報、語音自動應答,到800、400語音導航,再發(fā)展到目前移動終端的智能語音交互,伴隨著呼叫中心整體技術的發(fā)展而發(fā)展。
語音技術主要包括語音合成和語音識別兩項關鍵技術,近年來在移動互聯(lián)技術的推動下其發(fā)展已進入智能時代,越來越多地補充了人工服務,在幫助企業(yè)提升服務效率、降低服務成本的同時,持續(xù)不斷地創(chuàng)新了客戶體驗。
安徽科大訊飛信息科技股份有限公司作為中國最大的智能語音技術提供商,在語音技術領域有著長期的研究積累,并在語音合成、語音識別、口語評測、自然語言處理等多項技術上擁有國際領先的成果。近期《客戶世界》雜志對科大訊飛網(wǎng)絡語音業(yè)務總監(jiān)黃達志先生進行了采訪,請他詳細介紹了語音技術在客戶互動接觸領域的最新發(fā)展。
《客戶世界》 :科大訊飛作為語音技術發(fā)展的風向標,以其高品質、高市場占有率的語音產品,影響了現(xiàn)代生活的方方面面,請您總體介紹一下當前語音技術的發(fā)展狀況?
黃達志:我們所說的語音技術通常包括語音識別技術和語音合成技術,分別構成了人機語音交互的“聽”和“說”這兩個方面。語音合成,即TTS,可以將任意的文字實時轉換為語音播放出來,效果已經可以達到甚至超過普通人說話水平,能夠支持比較豐富的語言和提供各種類型的音色。語音識別(ASR),近幾年獲得快速的發(fā)展,目前的連續(xù)語音識別技術可以將用戶實時說話的語音轉換為文字,準確率已經達到較高的程度。以訊飛語音輸入法為例,在誕生至今三年的時間內,已經突破了一億用戶的規(guī)模,得到用戶很高的評價,證明了語音識別技術已經獲得了廣泛的認可。語音技術正走向成熟,大規(guī)模語音應用的時代已經到來。
《客戶世界》 :語音技術目前在呼叫中心領域應用最多最廣的技術有哪些?
黃達志:首先是語音合成技術。從九十年代中期語音合成技術開始達到可用程度以來,就開始逐步應用到呼叫中心系統(tǒng)當中,F(xiàn)在,語音合成已經進入各行各業(yè)的呼叫中心,實現(xiàn)海量、動態(tài)和個性化信息的語音播報。我們已經在一些運營商的客戶服務中心系統(tǒng)中開始全面應用語音合成技術,所有需要播報的內容都可以通過語音合成的方式實時、自動的提供服務。
最近今年,語音識別也越來越多的應用到呼叫中心的自動語音服務當中。一些運營商、銀行的IVR應用語音識別來替代以前的按鍵式菜單,用戶可以直接說出自己的需求,比如“我想查一下手機上還有多少錢”,系統(tǒng)能夠自動識別和理解用戶的意圖,提供效率更高、體驗更好的自助服務。
語音和語言處理技術的結合,還可以面向越來越普及的電子渠道提供更加智能化、人性化的服務。用戶在通過短信、網(wǎng)站、IM或者手機客戶端和系統(tǒng)進行交互的時候,可以用自然語言的方式進行語音或者文本的溝通,后臺的智能客服機器人系統(tǒng)能夠實現(xiàn)自動化的服務。
《客戶世界》 :隨著語音技術在呼叫中心的成熟應用,語音的主體價值是如何逐步體現(xiàn)的?
黃達志:我覺得可以從三個方面來看:第一,是降低呼叫中心運營成本。應用語音技術,可以提高呼叫中心的自助服務水平,把寶貴的人力資源從簡單重復的勞動當中解放出來,從事更有價值的工作,提高呼叫中心的運營效率。舉個真實的例子來說,電話銀行系統(tǒng)應用語音識別實現(xiàn)菜單扁平化,在某個城市,之前用戶每天使用按鍵式菜單來查詢開戶行信息的通話數(shù)屈指可數(shù),而現(xiàn)在使用語音識別的方式查詢開戶行的有幾百個,這些原來求助人工服務的通話現(xiàn)在基本都已轉由自動服務來提供。第二是提升用戶體驗。用戶可以更加高效、更加自然的獲得他們所要的信息或者服務,比如安徽移動10086客服全面應用了語音合成之后,可以看到用戶對于語音服務的感知相比以前有明顯提高。第三是提升業(yè)務擴展的能力。應用語音技術,呼叫中心所提供的服務和信息內容可以靈活實現(xiàn)隨需應變。比如,用戶在自助服務流程中可以很方便的說出幣種名稱、城市名稱、商戶名稱、地理位置等等,而不再受到傳統(tǒng)電話按鍵的限制,業(yè)務范圍的拓展也變得更加簡便和高效。
《客戶世界》 :在移動互聯(lián)時代,呼叫中心正在演變成多渠道,多媒體服務方式的客戶接觸中心,需要對來自各個渠道的不同載體的海量客戶信息進行記錄,標識,作為客戶分析、客戶管理的基礎。語音技術在針對大數(shù)據(jù)的處理上有什么具體的方案和表現(xiàn)?
黃達志:越來越多的企業(yè)都認識到大數(shù)據(jù)正在成為核心競爭力,而語音技術和大數(shù)據(jù)也有很多的結合。呼叫中心每天都有大量的通話錄音產生,對于這些錄音,目前通常只是因為質檢的需要而抽取非常少量的數(shù)據(jù)由人工進行聽取,利用非常有限。運用語音技術,我們可以把非結構化的語音轉換成文本信息,同時根據(jù)業(yè)務需求去打上各種各樣的標簽,這樣我們會對它進行更加深入的挖掘與分析,為營銷與服務提供支撐,我們稱之為語音分析。目前,語音分析在很多行業(yè)已經受到積極關注,我們正在全國十幾個省份的運營商,還有金融行業(yè)的陽光保險、平安保險、建設銀行等開展相關的應用,已經在全面質量管理、精細化運營分析和產品、營銷優(yōu)化等方面取得了明顯的應用成效。
《客戶世界》 :目前智能語音交互技術在移動終端上已有不少應用,像移動的“靈犀”、蘋果的siri在開展相關的應用,您如何看待自然語言的理解?
黃達志:語音技術和語義理解密不可分,自然語言理解對于實現(xiàn)更加智能化、更加人性化的應用非常關鍵,一直是我們重點研究投入的方向。
經過長期積累和發(fā)展,自然語言理解技術在一些具體的應用領域已經達到較好的準確程度。比如“靈犀”這樣一個語音助手應用,通過自然語言的交互可以很方便的查詢天氣、股票、航班、美食等等。在我們實施的運營商等行業(yè)電子渠道系統(tǒng)中,也都有自然語言理解技術提供支撐,使用戶可以很自然的查詢信息或辦理業(yè)務,具有很好的應用成效。但在開放式的應用場景下,以及在面對相對復雜的咨詢類服務請求時,自然語言理解技術還面臨很大的挑戰(zhàn),這是我們下一步需要突破的重點。
《客戶世界》 :您認為在客戶互動接觸領域,目前的語音技術在多大程度上可以實現(xiàn)比較高級的智能化服務,未來智能語音交互技術發(fā)展會是一個什么樣的趨勢?
黃達志:目前在客戶互動接觸領域,運營商、金融等行業(yè)已經有眾多應用語音技術實現(xiàn)的智能化服務。在這些系統(tǒng)當中,大部分的業(yè)務都已經可以被自動化的語音服務所承擔,有些系統(tǒng)可以達到80%以上的一次呼叫解決率,這已經比較接近人工服務的水平。當然對于一些相對復雜的任務,比如多交互環(huán)節(jié)的咨詢問題、需要豐富技能和經驗的營銷引導等,還并不適合。但即使是這樣,在呼叫中心中仍有很大意義,畢竟呼叫中心服務中大量工作都是可以被標準化、流程化的,在這些方面,語音技術可以發(fā)揮很好的作用。
我想未來語音交互技術以及在客戶互動接觸領域的應用,將始終圍繞提供更高效、更自然、更人性化的目標發(fā)展,使用戶在任何時間、任何地點都可以獲得很好的體驗,實現(xiàn)人機交互乃至人際交互無障礙,這也是我們一直以來的目標。