亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

您當(dāng)前的位置是：首頁 > 資訊 > 國內(nèi) >

首頁|資訊|文章精選|商城|黃頁|會(huì)展|訪談|人才|專家團(tuán)隊(duì)|周刊|呼叫中心|企業(yè)通信|通信業(yè)務(wù)

首頁 > 資訊 > 國內(nèi) >

壹鴿AI技術(shù)小貼士-語音識(shí)別前端處理介紹

2020-06-08 10:22:30 作者：來源：CTI論壇評(píng)論：0 　點(diǎn)擊：

　　萬物互聯(lián)時(shí)代，語音識(shí)別被視為人機(jī)交互的新入口，人與機(jī)器人之間通過自然語言交互已成為可能，本周壹鴿科技站將在技術(shù)的角度上，為大家介紹語音識(shí)別前端處理。

　　前端語音處理，利用信號(hào)處理的方法對(duì)說話人的語音進(jìn)行檢測、降噪等預(yù)處理，以便得到最適合語音識(shí)別引擎處理的語音，其主要功能包括端點(diǎn)檢測VAD、流式語音智能斷句和噪音消除。

　　一、端點(diǎn)檢測

　　語音端點(diǎn)檢測是對(duì)輸入的音頻流進(jìn)行分析，確定客戶說話的起點(diǎn)和終止點(diǎn)的處理過程。一旦檢測到客戶開始說話，語音開始流向識(shí)別引擎，直到檢測到客戶說話結(jié)束。這種方式能夠使得識(shí)別引擎在客戶說話的同時(shí)開始進(jìn)行識(shí)別，做到最大限度的即時(shí)處理。

　　1 端點(diǎn)檢測過程

　　1、基于語音信號(hào)的特征，用能量，過零率，熵(entropy)，音高(pitch)等參數(shù)以及它們的衍生參數(shù)，來判斷信號(hào)流中的語音/非語音信號(hào)。

　　2、在信號(hào)流中檢測到語音信號(hào)后，判斷此處是否是語句的開始或結(jié)束點(diǎn)。在商用語音系統(tǒng)中，由于信號(hào)多變的背景和自然對(duì)話模式而更容易使得句中有停頓(非語音)，特別是在爆發(fā)聲母前總會(huì)有無聲間隙。因此，這種開始/結(jié)束的判定尤為重要。

　　2 端點(diǎn)檢測目的

　　減少識(shí)別器的數(shù)據(jù)處理量�？梢源罅繙p少信號(hào)傳輸量及識(shí)別器的運(yùn)算負(fù)載，對(duì)于語音對(duì)話的實(shí)時(shí)識(shí)別有重要作用。

　　拒絕非語音的信號(hào)。對(duì)非語音信號(hào)的識(shí)別不僅是一種資源浪費(fèi)，而且有可能改變對(duì)話的狀態(tài)，造成對(duì)用戶的困擾。

　　在需要打斷(barge-in)功能的系統(tǒng)中，語音的起始點(diǎn)是必須的。在端點(diǎn)檢測找到語音的起始點(diǎn)時(shí)，系統(tǒng)將停止提示音的播放。完成打斷功能。

　　3 端點(diǎn)檢測對(duì)識(shí)別系統(tǒng)的影響

　　隨著語音識(shí)別應(yīng)用的發(fā)展，越來越多的系統(tǒng)將打斷功能作為一種方便有效的應(yīng)用模式。

　　而打斷功能又直接依賴端點(diǎn)檢測，端點(diǎn)檢測對(duì)打斷功能的影響發(fā)生在判斷語音/非語音的過程出現(xiàn)錯(cuò)誤時(shí)，表現(xiàn)在過于敏感的端點(diǎn)檢測產(chǎn)生的語音信號(hào)的誤警將產(chǎn)生錯(cuò)誤的打斷。

　　例如，提示音被很強(qiáng)的背景噪音或其它人的講話打斷，是因?yàn)槎它c(diǎn)檢測錯(cuò)誤的將這些信號(hào)作為有效語音信號(hào)造成的。反之，如果端點(diǎn)檢測漏過了事實(shí)上的語音部分，而沒有檢測到語音，系統(tǒng)會(huì)表現(xiàn)出沒有反應(yīng)。

　　在用戶講話時(shí)還在播放提示音，端點(diǎn)檢測對(duì)識(shí)別系統(tǒng)的識(shí)別效果影響也很大。語音信號(hào)的起始點(diǎn)和結(jié)束點(diǎn)判斷有誤，有可能影響整個(gè)信號(hào)的完整性。在語句的開頭或結(jié)尾漏掉一些有用的數(shù)據(jù)。當(dāng)這種情況發(fā)生時(shí)，很可能對(duì)識(shí)別的準(zhǔn)確度有特別大影響，不完全的信息會(huì)使識(shí)別率降低。

　　4 商用端點(diǎn)檢測應(yīng)具備的特性

　　端點(diǎn)檢測的精確度高。

　　更好的背景噪聲和語音模型：使系統(tǒng)對(duì)背景噪聲，其它說話人和非語音的聲音有很好的拒絕功能。

　　默認(rèn)的系統(tǒng)相關(guān)參數(shù)有很好的適用性，而在有需要的現(xiàn)實(shí)環(huán)境中，可以通過系統(tǒng)調(diào)節(jié)來適應(yīng)通話環(huán)境，改善端點(diǎn)檢測的效果。

　　對(duì)信道有自適應(yīng)能力：在對(duì)話開始后能很快適應(yīng)當(dāng)前的信道特征，使得端點(diǎn)檢測的準(zhǔn)確度有進(jìn)一步提高。

　　獨(dú)特的識(shí)別服務(wù)器的反饋和非語音持續(xù)時(shí)間雙重結(jié)束點(diǎn)判定功能，有效的改善了語音結(jié)束點(diǎn)的判定，特別是對(duì)較長的語句效果更加突出。

　　基于可靠的端點(diǎn)檢測技術(shù)和智能反饋，智能打斷功能不僅應(yīng)該在一般的環(huán)境下工作出色，而且能有效的拒絕環(huán)境噪聲，非語音的高強(qiáng)噪聲(呼吸，關(guān)門等)環(huán)境中其它人的聲音。

　　二流式語音智能斷句

　　現(xiàn)有的語音處理方案是先用語音活動(dòng)檢測模塊對(duì)語音進(jìn)行斷句，再將斷開的語音進(jìn)行自動(dòng)語音識(shí)別。但是，在電話語音交互場景中，VAD面臨著兩個(gè)難題：

　　01如何可以成功檢測到最低能量的語音(靈敏度)？

　　02如何在多變的復(fù)雜噪聲環(huán)境下成功檢測（漏檢率和虛檢率）？

　　漏檢反應(yīng)的是原本是語音但是沒有檢測出來，而虛檢率反應(yīng)的是不是語音信號(hào)而被檢測成語音信號(hào)的概率。相對(duì)而言漏檢是不可接受的，而虛檢可以通過后端的ASR和NLP算法進(jìn)一步過濾，但是虛檢會(huì)帶來系統(tǒng)資源利用率上升，以及造成響應(yīng)不及時(shí)。

　　對(duì)于在目標(biāo)人交互語音前發(fā)生虛檢，主要問題是增加ASR識(shí)別處理數(shù)據(jù)量，如下圖所示：

　　對(duì)于在目標(biāo)人交互語音后發(fā)生虛檢，不僅增加ASR識(shí)別處理數(shù)據(jù)量，還會(huì)造成響應(yīng)不及時(shí)。

　　現(xiàn)有語音處理方案存在斷句不準(zhǔn)確的問題，主要有兩個(gè)主要缺點(diǎn)：

　　一是無法過濾噪音和無效的語音；

　　另外就是對(duì)說話人的要求較高，中間不能有停頓，如果句間停頓時(shí)長設(shè)置的太短，容易造成截?cái)�；句間停頓時(shí)長設(shè)置太長，又會(huì)造成響應(yīng)不及時(shí)。

　　如下圖所示：

　　流式語音智能斷句模塊是主要由語音識(shí)別模塊、信息流聚合模塊、動(dòng)態(tài)窗口設(shè)定模塊、斷句識(shí)別模塊構(gòu)成。其中：

　　語音識(shí)別模塊用于接收并識(shí)別語音實(shí)時(shí)流，并按照指定的頻率輸出帶有時(shí)序的語音識(shí)別結(jié)果；

　　信息流聚合模塊用于對(duì)帶有時(shí)序的語音識(shí)別結(jié)果進(jìn)行優(yōu)化處理，并整合經(jīng)過優(yōu)化處理后的帶有時(shí)序的語音識(shí)別結(jié)果，以形成語音識(shí)別結(jié)果序列；

　　動(dòng)態(tài)窗口設(shè)定模塊用于從語音識(shí)別結(jié)果序列中選擇指定范圍的文本，進(jìn)而將指定范圍的文本用于斷句分析；

　　斷句識(shí)別模塊用于分析指定范圍的文本的語義，并根據(jù)語義確定是否進(jìn)行斷句。

　　三噪音消除

　　引擎具備噪音消除功能，在實(shí)際應(yīng)用過程中背景噪聲對(duì)于語音識(shí)別應(yīng)用是一個(gè)現(xiàn)實(shí)的挑戰(zhàn)，即便說話人處理安靜的辦公室環(huán)境，在電話語音通話過程中也難免會(huì)有一定噪聲，語音識(shí)別系統(tǒng)需具備高效的噪音消除能力，以適應(yīng)客戶在千差萬別的環(huán)境中使用的要求。

　　關(guān)于語音識(shí)別前端處理的介紹就到這了，壹鴿科技后續(xù)將會(huì)為大家?guī)砀嘞嚓P(guān)的技術(shù)講解，敬請期待把！

【免責(zé)聲明】本文僅代表作者本人觀點(diǎn)，與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立，不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考，并請自行承擔(dān)全部責(zé)任。

相關(guān)熱詞搜索：壹鴿語音識(shí)別

上一篇:把握機(jī)遇、共創(chuàng)分享——普強(qiáng)助力“新基建”發(fā)展

下一篇:最后一頁

相關(guān)閱讀：

·告別傳統(tǒng)人工回訪，壹鴿智能語音回訪機(jī)器人用AI“聲”援！2020-05-12 09:17:31
·宅急送引入壹鴿智能語音機(jī)器人，用“黑科技”革新客戶服務(wù)2020-04-02 09:49:49
·壹鴿科技榮獲“國家級(jí)高新技術(shù)企業(yè)”認(rèn)定2020-03-24 09:14:03
·壹鴿智能語音機(jī)器人24小時(shí)在線，助力快遞企業(yè)為客戶送上最暖心的自助服務(wù)2020-02-25 15:35:41
·壹鴿智能語音機(jī)器人全天24小時(shí)在線2020-02-24 10:02:32
·眾志成城，AI抗疫 | 壹鴿疫情防控機(jī)器人加入戰(zhàn)隊(duì)，“壹”起行動(dòng)！2020-02-06 11:06:57
·壹鴿科技榮獲CTI論壇2019年度編輯推薦獎(jiǎng)2019-12-30 15:36:49
·雙11！壹鴿科技助力全場景AI語音客服首次大規(guī)模商業(yè)應(yīng)用2019-11-26 13:36:51
·壹鴿全場景智能語音交互機(jī)器人2019-11-13 11:15:40
·壹鴿科技：智能智慧政務(wù)新嘗試，AI客服來幫忙2019-11-05 10:01:43

評(píng)論排行

推薦閱讀

專題

語音技術(shù)行業(yè)現(xiàn)狀: 　　AI如此流行，從2019年開始一直延續(xù)到今年，我們在年...[詳細(xì)]

遠(yuǎn)程辦公高效...: 抗擊疫情戰(zhàn)役進(jìn)入攻堅(jiān)階段，在家遠(yuǎn)程辦公將成為近日工作...[詳細(xì)]

呼叫中心遠(yuǎn)程座席...: 2020年一場突如其來的新冠肺炎，牽動(dòng)著每個(gè)人的心，疫情...[詳細(xì)]

同心抗疫防疫機(jī)...: 2月4日，工信部發(fā)出倡議，進(jìn)一步發(fā)揮人工智能賦能效用，...[詳細(xì)]

大家都在看

點(diǎn)擊排行
周排行
月排行

CTI論壇會(huì)員企業(yè)

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079677
傳真：+86-10-62041062
投稿：ctiforum@ctiforum.com
地址：北京市西城區(qū)新德街20號(hào)513室（100088）

網(wǎng)站首頁 | 公司簡介 | 聯(lián)系方式 | 工作機(jī)會(huì) | 廣告服務(wù) | 會(huì)員服務(wù) | 服務(wù)項(xiàng)目 | 專家團(tuán)隊(duì) | 版權(quán)聲明 | 投稿方法

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079677 投稿：ctiforum@ctiforum.com

經(jīng)營性網(wǎng)站備案信息

京ICP證030771號(hào)

網(wǎng)絡(luò)110報(bào)警服務(wù)

京公網(wǎng)安備110102000104-1號(hào)