亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

您當(dāng)前的位置是:  首頁(yè) > 新聞 > 專(zhuān)家觀點(diǎn) >
 首頁(yè) > 新聞 > 專(zhuān)家觀點(diǎn) >

東進(jìn)技術(shù)產(chǎn)品總監(jiān)劉駿:聲紋識(shí)別技術(shù)及其應(yīng)用

2017-03-27 15:59:00   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  由中國(guó)領(lǐng)先的信息與通信技術(shù)行業(yè)網(wǎng)站CTI論壇主辦的2017中國(guó)呼叫中心及企業(yè)通信大會(huì)[http://www.suckhoeday.com/expo/2017/ccec2017spring/index.html]于3月23日-24日在中國(guó)北京隆重召開(kāi),本次會(huì)議以"塑造未來(lái)技術(shù)改善溝通體驗(yàn)"為主題。深圳市東進(jìn)技術(shù)股份有限公司產(chǎn)品總監(jiān)劉駿應(yīng)邀出席此次會(huì)議并發(fā)表主題演講《聲紋識(shí)別技術(shù)及其應(yīng)用》。

圖:深圳市東進(jìn)技術(shù)股份有限公司產(chǎn)品總監(jiān)劉駿
演講PPT下載,pdf格式
【演講視頻】東進(jìn)技術(shù)劉駿:聲紋識(shí)別技術(shù)及其應(yīng)用
  劉駿:大家好,我是東進(jìn)公司產(chǎn)品經(jīng)理劉駿,今天很高興能和大家一起共同探討新技術(shù)在行業(yè)中的應(yīng)用,今天我講的是"聲紋識(shí)別技術(shù)及其應(yīng)用"。
  為什么會(huì)講這個(gè)主題呢,一是東進(jìn)技術(shù)與清華大學(xué)合作,將聲紋識(shí)別技術(shù)應(yīng)用在了中國(guó)建設(shè)銀行的手機(jī)銀行業(yè)務(wù)中,這是將東進(jìn)技術(shù)硬件設(shè)備上的研發(fā)優(yōu)勢(shì)和清華大學(xué)在底層算法上的科研優(yōu)勢(shì)相結(jié)合的一個(gè)有益嘗試。二是以聲紋識(shí)別、人臉識(shí)別為代表的生物特征識(shí)別在近幾年特別火,不談其他的,就我們這個(gè)行業(yè)而言,可以看到,無(wú)論是呼叫中心行業(yè)還是通信企業(yè),人工智能應(yīng)用越來(lái)越多了,如我們可以看到智能機(jī)器人、語(yǔ)音識(shí)別(ASR)等,因此,東進(jìn)想在生物特征識(shí)別技術(shù)的應(yīng)用領(lǐng)域做一些探索。
  為什么生物特征識(shí)別技術(shù)近幾年特別火呢,我認(rèn)為有三個(gè)原因,第一是技術(shù)的進(jìn)步所帶來(lái)的發(fā)展,第二是應(yīng)用有強(qiáng)勁的需求,第三是大佬們的推波助瀾以及資本的熱捧。業(yè)內(nèi)對(duì)生物特征識(shí)別也普遍持樂(lè)觀態(tài)度,這是權(quán)威的國(guó)際生物識(shí)別集團(tuán)(International Biometric Group,IBG)在2014年做的《2007-2020全球生物識(shí)別技術(shù)行業(yè)市場(chǎng)規(guī)模與預(yù)測(cè)》,IBG預(yù)測(cè),在2020年,全球生物識(shí)別技術(shù)行業(yè)的市場(chǎng)規(guī)模將達(dá)到250億美元。
  生物特征識(shí)別技術(shù)涵蓋指紋、人臉、聲紋、瞳孔、掌紋以及靜脈紋,每種生物特征識(shí)別都有著不一樣的技術(shù)特性和應(yīng)用場(chǎng)景,在此我們可以簡(jiǎn)單比較一下聲紋和人臉之間的區(qū)別,人臉識(shí)別是基于人的生理特征,而聲紋識(shí)別不僅基于人的生理特征,也是基于人的行為特征。人臉在人的一生中是相對(duì)有規(guī)律的自然變化,而聲音不僅有相對(duì)規(guī)律的自然變化,也與人后天的生活環(huán)境、文化環(huán)境相關(guān),具有極強(qiáng)的自然屬性和文化屬性,不易被仿冒,或者說(shuō)仿冒的難度比較高。因此,相對(duì)人臉識(shí)別,聲紋識(shí)識(shí)別更能夠應(yīng)用到遠(yuǎn)程身份認(rèn)證領(lǐng)域,聲紋識(shí)別如果能和現(xiàn)有的基于互聯(lián)網(wǎng)的客戶(hù)服務(wù)結(jié)合,會(huì)有更好的應(yīng)用前景和市場(chǎng)前景。
  因此,國(guó)際生物識(shí)別集團(tuán)在《2007-2020全球生物識(shí)別技術(shù)行業(yè)細(xì)分市場(chǎng)規(guī)模與預(yù)測(cè)》中預(yù)測(cè),在2020年的250億美元市場(chǎng)中,指紋排第一,130億美元,聲紋排第二,為56億美元,人臉排第三,為24億美元,顯然,相比人臉,IBG對(duì)聲紋識(shí)別更樂(lè)觀一些。
  需要講清楚的一點(diǎn)是,聲紋識(shí)別和語(yǔ)音識(shí)別是不一樣的,聲紋識(shí)別是基于發(fā)音特征,關(guān)注的是你是誰(shuí),語(yǔ)音識(shí)別基于語(yǔ)義特征,關(guān)注的是你說(shuō)了什么,還有一點(diǎn)是聲紋識(shí)別有兩類(lèi),一類(lèi)是確認(rèn),即要證明你是你,一類(lèi)是是辨認(rèn),就是在一堆人中找出你。
  面向確認(rèn)的聲紋識(shí)別應(yīng)用已經(jīng)達(dá)到了實(shí)際商用水平,如司法行業(yè)的司法矯正中就用到聲紋識(shí)別,大家可能不知道,聲紋識(shí)別早在2010年前后就開(kāi)始在司法行業(yè)中得到應(yīng)用了。基本流程是這樣的,假釋人員首先在司法部門(mén)進(jìn)行司法宣告,留下語(yǔ)音,然后給他一個(gè)具有LBS功能的手機(jī),在監(jiān)外服刑期間,司法矯正系統(tǒng)會(huì)定期對(duì)矯正對(duì)象所持手機(jī)進(jìn)行定位,以判斷對(duì)象是否在規(guī)定的地理位置,同時(shí),利用東進(jìn)Keygoe多媒體交換機(jī)對(duì)手機(jī)進(jìn)行外呼,通過(guò)IVR引導(dǎo)矯正對(duì)象進(jìn)行聲紋比對(duì),以判斷矯正對(duì)象和手機(jī)是否分離。目前,這種面向確認(rèn)的聲紋識(shí)別技術(shù)在司法行業(yè)已經(jīng)達(dá)到較高的商用成熟度。還有一個(gè)應(yīng)用就是手機(jī)的聲紋鎖,用聲紋來(lái)打開(kāi)你的手機(jī),這種的應(yīng)用的商用化程度也非常高。
  而面向辨認(rèn)的聲紋識(shí)別技術(shù),我個(gè)人認(rèn)為其商業(yè)化還有一段路要走,一個(gè)例子是汽車(chē)行業(yè)的用戶(hù)滿(mǎn)意度調(diào)查。汽車(chē)4S店將大量的客戶(hù)訪問(wèn)電話的錄音文件交到汽車(chē)廠商,為防止4S店作弊,汽車(chē)廠商需要將被仿冒的電話給找出來(lái),這就需要通過(guò)聲紋識(shí)別技術(shù)來(lái)進(jìn)行,但從目前反饋的情況來(lái)看,效果并不理想,這倒不是技術(shù)問(wèn)題,而是和應(yīng)用場(chǎng)景相關(guān),因?yàn)椴豢赡軐?duì)汽車(chē)廠商的客戶(hù)進(jìn)行語(yǔ)音預(yù)留。
  我們?nèi)祟?lèi)對(duì)語(yǔ)音的說(shuō)話人鑒別是我們?nèi)祟?lèi)在幾百萬(wàn)年的進(jìn)化過(guò)程中習(xí)得而來(lái),與生俱來(lái),而通過(guò)機(jī)器進(jìn)行說(shuō)話人識(shí)別跟人類(lèi)大腦的識(shí)別是不一樣的。在這個(gè)圖中,上面兩個(gè)是聲音的波形圖,即聲音振幅隨時(shí)間變化的曲線,下面兩個(gè)是語(yǔ)譜圖,即聲音在不同頻段的能量值大小隨時(shí)間的變化曲線,上世紀(jì)三四十年代,美國(guó)的Bell實(shí)驗(yàn)室的勞倫斯·科斯塔通過(guò)觀察語(yǔ)譜圖第一次提出了"聲紋"的概念;到四十年代至七十年代,同樣是Bell實(shí)驗(yàn)室的S.Pruzansky提出了基于統(tǒng)計(jì)學(xué)原理的聲紋識(shí)別理論,系統(tǒng)地發(fā)展了聲紋識(shí)別理論,理論體系得以初步建立,這一階段的研究主要集中在特征參數(shù)的選擇、提取上,相繼提出了線性預(yù)測(cè)倒譜系數(shù)、共振峰參數(shù)等特征參數(shù);在上世紀(jì)七十年代至九十年代,聲紋識(shí)別技術(shù)發(fā)展迅速,參數(shù)提取上提出了應(yīng)用較為成熟的梅爾頻率倒譜系數(shù)(MFCC)模式匹配,并相繼出現(xiàn)了矢量量化技術(shù)(VQ)、動(dòng)態(tài)時(shí)間規(guī)整(DTW)、隱馬爾科夫模型(HMM)等模式匹配模型;九十年代至今,開(kāi)始步入實(shí)際應(yīng)用階段,工作重點(diǎn)是提高聲紋識(shí)別系統(tǒng)的可靠性和實(shí)用性。
  衡量一個(gè)聲紋識(shí)別效果的重要參數(shù)是錯(cuò)誤接受率和錯(cuò)誤拒絕率,在這個(gè)曲線中,錯(cuò)誤接受率和錯(cuò)誤拒絕率是一個(gè)矛盾曲線,即兩者不可兼得,因此,業(yè)內(nèi)提出來(lái)等錯(cuò)率,目前的聲紋識(shí)別技術(shù)在理想的情況下等錯(cuò)率可以做到低于0.5%,即在1000個(gè)的聲紋比對(duì)中,僅有不到5個(gè)的錯(cuò)誤接受率和錯(cuò)誤拒絕率。
  聲紋識(shí)別就目前的應(yīng)用來(lái)說(shuō),主要有三個(gè)技術(shù)難點(diǎn)。
  一個(gè)技術(shù)難點(diǎn)就是跨信道。這是在聲紋識(shí)別中,學(xué)習(xí)訓(xùn)練通道和識(shí)別通道在相同和不同情況下,對(duì)等錯(cuò)率的影響,藍(lán)色曲線的同一信道曲線,紅色曲線是跨信道曲線,可以看到,跨信道的等錯(cuò)率幾乎到了20%,那么在實(shí)際應(yīng)用中,我們?cè)撛趺慈ソ鉀Q這問(wèn)題呢,特別是技術(shù)水平相對(duì)穩(wěn)定的情況下該怎么解決這個(gè)問(wèn)題?
  我們的做法是結(jié)合應(yīng)用場(chǎng)景,盡量使訓(xùn)練學(xué)習(xí)通道和識(shí)別通道都用同一個(gè)信道,盡量避免跨信道。這是一個(gè)駕校管理系統(tǒng)方案,為防止駕校侵占學(xué)員的學(xué)時(shí),需要對(duì)學(xué)員進(jìn)行身份認(rèn)證,現(xiàn)在的認(rèn)證方法是學(xué)員IC卡讀取和指紋識(shí)別,學(xué)員通過(guò)教練車(chē)載終端進(jìn)行登錄,現(xiàn)在將聲紋識(shí)別技術(shù)引入進(jìn)來(lái),如果學(xué)員報(bào)名時(shí)在報(bào)名處通過(guò)寬帶接入網(wǎng)進(jìn)行聲紋預(yù)留,在教練車(chē)上通過(guò)車(chē)載終端和3G網(wǎng)絡(luò)通道進(jìn)行識(shí)別時(shí),就會(huì)影響實(shí)際的識(shí)別效果,我們提出的解決方案是,在報(bào)名時(shí),學(xué)員下載APP后就通過(guò)移動(dòng)寬帶網(wǎng)絡(luò)進(jìn)行語(yǔ)音預(yù)留,在教練車(chē)上,車(chē)載終端僅下發(fā)動(dòng)態(tài)碼,學(xué)員仍然通過(guò)自己的手機(jī)利用移動(dòng)寬帶網(wǎng)絡(luò)通道進(jìn)行識(shí)別,這樣就能顯著提高識(shí)別率。
  第二個(gè)技術(shù)難點(diǎn)是錯(cuò)誤識(shí)別。做到百分之百的正確識(shí)別是不現(xiàn)實(shí)的,但我們可以利用等錯(cuò)率曲線,根據(jù)業(yè)務(wù)應(yīng)用場(chǎng)景,通過(guò)參數(shù)配置,有針對(duì)性地提高或降低錯(cuò)誤拒絕率或錯(cuò)誤接受率,使之符合實(shí)際的應(yīng)用場(chǎng)景。舉個(gè)例子,如果安全性較高的應(yīng)用場(chǎng)景,如大額轉(zhuǎn)賬,我就將參數(shù)配置在這個(gè)區(qū)域,即較低的錯(cuò)誤接受率和較高的錯(cuò)誤拒絕率,犧牲便利性突出安全性,相信客戶(hù)在進(jìn)行大額轉(zhuǎn)賬時(shí),應(yīng)該是能夠忍受一定的不方便而獲得較高的安全性。當(dāng)聲紋識(shí)別用于手機(jī)解鎖時(shí),我們可以調(diào)整參數(shù),使之工作低錯(cuò)誤拒絕率和高錯(cuò)誤接受率這個(gè)區(qū)域,提供較好的方便性,因?yàn)槭謾C(jī)在大多數(shù)情況下都在我們身邊,誰(shuí)也不會(huì)沒(méi)事就拿著手機(jī)找人家闖入。
  第三技術(shù)難點(diǎn)就是假體攻擊。就指紋的假體攻擊,據(jù)說(shuō)淘寶上賣(mài)一個(gè)指紋只需要十幾塊錢(qián),今年315晚會(huì)上,針對(duì)人臉識(shí)別的假體攻擊也讓人臉識(shí)別火了一把。就聲紋識(shí)別而言,常見(jiàn)的假體攻擊就是錄音以及錄音的拼接,從理論上講,通過(guò)錄音文件進(jìn)行闖入是存在可能性的。對(duì)錄音及錄音拼接,我們的解決方案是動(dòng)態(tài)碼,即下發(fā)一個(gè)隨機(jī)的8位數(shù)的數(shù)字,通過(guò)對(duì)這個(gè)動(dòng)態(tài)碼的識(shí)別來(lái)進(jìn)行身份驗(yàn)證,提高了系統(tǒng)識(shí)別率和安全率,這也是我們?yōu)橹袊?guó)建設(shè)銀行的手機(jī)銀行的遠(yuǎn)程身份認(rèn)證提供的解決方案。
  中國(guó)建設(shè)銀行的手機(jī)銀行業(yè)務(wù),其遠(yuǎn)程身份認(rèn)證的大致流程是這樣的,大家請(qǐng)看這個(gè)圖,首先是手機(jī)客戶(hù)端發(fā)起驗(yàn)證請(qǐng)求, 銀行業(yè)務(wù)系統(tǒng)調(diào)用東進(jìn)的聲紋驗(yàn)證機(jī)接口獲取ID和文本,以獲得隨機(jī)產(chǎn)生的ID和文本,然后將文本解碼并發(fā)送給手機(jī)銀行客戶(hù)端,手機(jī)銀行客戶(hù)端讀出文本,并將錄音發(fā)給銀行業(yè)務(wù)系統(tǒng),銀行業(yè)務(wù)系統(tǒng)收到錄音后調(diào)用聲紋驗(yàn)證機(jī)接口上傳用戶(hù)語(yǔ)音,聲紋驗(yàn)證機(jī)返回聲紋驗(yàn)證結(jié)果給銀行業(yè)務(wù)系統(tǒng),銀行業(yè)務(wù)系統(tǒng)將驗(yàn)證成功或失敗接口發(fā)給手機(jī)銀行客戶(hù)端。這就是我們現(xiàn)在向中國(guó)建設(shè)銀行提供的面向移動(dòng)互聯(lián)網(wǎng)的聲紋識(shí)別+動(dòng)態(tài)口令的遠(yuǎn)程身份認(rèn)證解決方案。
  面向金融和支付領(lǐng)域的聲紋識(shí)別技術(shù)應(yīng)用,目前一個(gè)行業(yè)問(wèn)題就是,能否將聲紋識(shí)別正式作為遠(yuǎn)程身份認(rèn)證的一個(gè)正式手段納入到相應(yīng)的業(yè)務(wù)環(huán)節(jié),不過(guò)有兩個(gè)動(dòng)向使我們對(duì)此很樂(lè)觀。一個(gè)是,去年中國(guó)人民銀行發(fā)布《關(guān)于推動(dòng)移動(dòng)金融技術(shù)創(chuàng)新健康發(fā)展的指導(dǎo)意見(jiàn)》中,要求銀行和清算機(jī)構(gòu)提供手機(jī)等移動(dòng)金融服務(wù)時(shí),應(yīng)使用可靠的多因素身份認(rèn)證方式,多因素身份認(rèn)證中就有聲紋、人臉等選項(xiàng);另外一個(gè)動(dòng)向是,中國(guó)人民銀行金融標(biāo)準(zhǔn)委員會(huì)正在組織起草《手機(jī)銀行中基于聲紋識(shí)別的增強(qiáng)安全應(yīng)用技術(shù)規(guī)范》,目前正在征求意見(jiàn)階段,預(yù)計(jì)不久的將來(lái),該規(guī)范將正式作為中國(guó)金融行業(yè)的一個(gè)正式標(biāo)準(zhǔn),指導(dǎo)金融行業(yè)在聲紋識(shí)別技術(shù)的規(guī)范應(yīng)用,相信能促進(jìn)聲紋識(shí)別市場(chǎng)的良性發(fā)展。
  最后做一個(gè)廣告,這是東進(jìn)FV-1000聲紋驗(yàn)證機(jī),是東進(jìn)硬件設(shè)備上的研發(fā)優(yōu)勢(shì)和清華大學(xué)在底層算法科研優(yōu)勢(shì)結(jié)合的一個(gè)有益嘗試。就設(shè)備本身而言,行業(yè)內(nèi)的朋友都知道,東進(jìn)在硬件設(shè)備的研發(fā)設(shè)計(jì)和生產(chǎn)制造上擁有超過(guò)20的創(chuàng)新歷史,設(shè)備以高可靠、高穩(wěn)定、高性能和高靈活度的特點(diǎn)獲得了產(chǎn)業(yè)鏈上各個(gè)環(huán)節(jié)的高度認(rèn)可。目前這臺(tái)FV-1000所搭載的聲紋識(shí)別算法不僅能通過(guò)靈活的參數(shù)配置來(lái)適應(yīng)不同的應(yīng)用場(chǎng)景,還具有防錄音和防錄音拼接功能,而且能夠進(jìn)行自我學(xué)習(xí),適應(yīng)人類(lèi)聲音的自然變化。另外,從聲紋識(shí)別技術(shù)應(yīng)用的系統(tǒng)架構(gòu)上看,東進(jìn)FV-1000聲紋驗(yàn)證機(jī)處在系統(tǒng)架構(gòu)較低層的接入層和支持層,并對(duì)上層應(yīng)用提供應(yīng)用開(kāi)發(fā)接口,應(yīng)用開(kāi)發(fā)接口完全基于Web Service,這也體現(xiàn)了東進(jìn)一貫堅(jiān)持的產(chǎn)業(yè)鏈合作的經(jīng)營(yíng)理念,東進(jìn)愿意與合作伙伴一起,共同打造基于(移動(dòng))互聯(lián)網(wǎng)的遠(yuǎn)程身份認(rèn)證解決方案,探索生物特征識(shí)別技術(shù)在更廣泛行業(yè)中的應(yīng)用。
  總而言之,技術(shù)的進(jìn)步和應(yīng)用需求使我們進(jìn)入了生物特征識(shí)別產(chǎn)業(yè)高速發(fā)展的增長(zhǎng)期,而要獲得持續(xù)的市場(chǎng)增長(zhǎng),就需要我們?cè)诩夹g(shù)及其應(yīng)用上進(jìn)一步去探索與突破,除此之外,生物識(shí)別技術(shù)的應(yīng)用還存在一些安全和隱私問(wèn)題,除了技術(shù)需要進(jìn)一步提升外,行業(yè)還要制定相關(guān)的標(biāo)準(zhǔn)和規(guī)范,甚至國(guó)家在法律層面還需要制定相應(yīng)的法律和法規(guī),以明晰可能存在的風(fēng)險(xiǎn),讓我們?cè)诨A(chǔ)研究、技術(shù)開(kāi)發(fā)、行業(yè)應(yīng)用等方面共同努力,以更好的產(chǎn)品和服務(wù)迎接生物特征識(shí)別市場(chǎng)收獲季節(jié)的到來(lái)。
  謝謝大家!

專(zhuān)題