CTI論壇(ctiforum.com)7月14日消息(編譯/老秦): 位于猶他州的Cypher已經開發(fā)出一種技術,這種技術利用深層神經網(wǎng)絡來識別語音元素,去除語音通信中的背景噪聲。

根據(jù)Cypher的CEO約翰·沃克(John Walker)和首席戰(zhàn)略官約翰·尹(John Yoon)的介紹,除了神經網(wǎng)絡技術,這個解決方案還使用了數(shù)學和模式識別技術來檢測人的聲音,將噪音與主要講話者的聲音相隔離,忽略所有的背景噪聲。

沃克(Walker)介紹說,在最近的測試中,該項技術在Amazon Echo's Alexa上的自動語音識別過濾精度提高了121%,這是當背景噪聲存在時候的數(shù)據(jù)。他補充說,測試包括相當復雜的查詢,比如一個特定城市的天氣如何,這不是僅需要一個字來回答的簡單問題?偟膩碚f,測試包括了195種開放式查詢。
據(jù)該公司介紹,ASR過濾解決方案完全是基于軟件的,可以嵌入到現(xiàn)有的芯片當中。
沃克說,背景噪音問題越來越困擾大多數(shù)時間依靠移動設備進行通信的人群,他們經常處于嘈雜的環(huán)境當中,并且越來越依賴個人助理Alexa等工具。
在Cypher與Harris于今年早些時候進行的一項調查顯示,61%的手機用戶表示由于背景噪音的存在他們不得不結束通話。吵鬧的環(huán)境例如餐館或咖啡館(67%)、嬰兒啼哭的地方(49%)、繁忙的城市人行道(47%)和機場(39%)。
調查還發(fā)現(xiàn),有近四分之三(74%)的手機用戶對手機是否可以控制背景噪音這樣的功能感興趣。
按照Cypher高管的說法,這個調查結果顯示,市場急需一個更好的解決方案來處理背景噪音。

“所有其他的降噪解決方案將其看作是一個聲音問題,”尹(Yoon)說。“而我們的首席執(zhí)行官約翰·沃克(John Walker)和我們的團隊的大部分人則將它看作是一個計算機科學問題,所以他們著重于深層神經網(wǎng)絡,而不是尋求抑制噪聲,用這種方式研究語音匹配模式。”
根據(jù)尹(Yoon)的說法,這種技術致力于發(fā)現(xiàn)語音元素,通過移動設備或個人助理處理引擎?zhèn)鬟f這些元素。因此,Cypher技術的表現(xiàn)要三到四倍地優(yōu)于現(xiàn)有最好的降噪方案,尹(Yoon)介紹說。
這項技術將在今年秋季與思科一起進入公共安全市場(警察、消防等),沃克(Walker)介紹說。
沃克補充道,根據(jù)調查,對于當今的噪音消除解決方案,電話運營商、消費者、提供私人助理解決方案的企業(yè)以及使用它們的人們都不是很滿意的,所以他希望Cypher的技術在一年內獲得市場的認可。
聲明:版權所有 非合作媒體謝絕轉載
聲明:版權所有 非合作媒體謝絕轉載