廈門(mén)日?qǐng)?bào)訊(記者 林露虹)近日,在世界級(jí)聲紋識(shí)別競(jìng)賽中,廈門(mén)火炬高新區(qū)企業(yè)快商通拔得頭籌。根據(jù)VoxSRC國(guó)際說(shuō)話人識(shí)別競(jìng)賽(聲紋識(shí)別競(jìng)賽)最新公布的榜單顯示,快商通Kriston AI團(tuán)隊(duì)以4.9%的說(shuō)話人日志錯(cuò)誤率,位列榜單第一,展現(xiàn)了中國(guó)人工智能技術(shù)的硬核實(shí)力。

VoxSRC比賽由英國(guó)牛津大學(xué)、韓國(guó)NAVER公司、美國(guó)斯坦福國(guó)際研究院語(yǔ)音技術(shù)與研究實(shí)驗(yàn)室和麻省理工學(xué)院林肯實(shí)驗(yàn)室組織發(fā)起,是聲紋識(shí)別領(lǐng)域有影響力和權(quán)威性的國(guó)際賽事,每年都吸引大批業(yè)界精英參與。
據(jù)快商通聯(lián)合創(chuàng)始人李稀敏介紹,VoxSRC比賽采用隨機(jī)抽題、提交回答后系統(tǒng)自動(dòng)打分的形式進(jìn)行,榜單類似體育運(yùn)動(dòng)員的積分排名榜,定期更新。“簡(jiǎn)單理解,比賽題目是多個(gè)人說(shuō)話的語(yǔ)音數(shù)據(jù)包,參賽團(tuán)隊(duì)開(kāi)發(fā)的AI系統(tǒng)需根據(jù)語(yǔ)音數(shù)據(jù)來(lái)判斷‘誰(shuí)在什么時(shí)候說(shuō)話’。題目設(shè)置了不少干擾項(xiàng),語(yǔ)音長(zhǎng)短不一,數(shù)據(jù)來(lái)源也五花八門(mén),這對(duì)參賽者來(lái)說(shuō)是不小的挑戰(zhàn)。”
快商通的機(jī)器人是如何精準(zhǔn)“揪”出說(shuō)話人的?李稀敏說(shuō),團(tuán)隊(duì)訓(xùn)練機(jī)器人主要有兩類技術(shù)路線:一是從“你一言我一語(yǔ)”的多人對(duì)話中找出說(shuō)話人的“轉(zhuǎn)折點(diǎn)”;二是基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),給機(jī)器人“喂食”大量的語(yǔ)音數(shù)據(jù),以數(shù)據(jù)驅(qū)動(dòng)來(lái)提升機(jī)器人識(shí)別水平。
快商通是我市自主培育的人工智能企業(yè)。經(jīng)過(guò)十多年的積累,快商通Kriston AI團(tuán)隊(duì)在聲紋識(shí)別、語(yǔ)音識(shí)別等人工智能領(lǐng)域創(chuàng)造了多項(xiàng)行業(yè)領(lǐng)先的技術(shù)創(chuàng)新,擁有發(fā)明專利超過(guò)500項(xiàng)。