Google推視頻語音識別技術(shù) 將"政客"作為關(guān)注焦點(diǎn)
2008/09/17
9月17日國際報道 今年7月份,谷歌推出了應(yīng)用于網(wǎng)絡(luò)應(yīng)用的語音識別技術(shù),目前這一項(xiàng)目Gaudi(谷歌音頻索引)在Google Labs有一個正式界面。
網(wǎng)站的搜索框上有使用說明事例,如“搜索政治家的講話”,就會在YouTube視頻播放器旁邊顯示搜索結(jié)果,點(diǎn)擊每一個結(jié)果,播放器就會顯示講話地點(diǎn)的一段視頻。顯示結(jié)果不僅僅顯示演講,如果點(diǎn)擊“絕路橋”,還可以看到一段由約翰·麥凱恩和莎拉·帕琳參加競選的廣告。
從視頻中提取話語,將有助于谷歌輕易決定視頻的內(nèi)容,并在視頻旁邊配置最適宜的廣告。今年通過YouTube賺錢是谷歌的頭等大事。
語音與文本之間的轉(zhuǎn)換還將有助于谷歌將相關(guān)視頻混合到搜索結(jié)果中。目前最好的辦法就是通過檢查伴隨的元數(shù)據(jù)理解視頻中的內(nèi)容,例如標(biāo)題與說明,但其范圍要比所說的語言范圍小得多。
借助于谷歌的翻譯工具,谷歌有可能將視頻內(nèi)容翻譯成其它語言。顯然,谷歌在語音識別技術(shù)方面有更大的雄心。谷歌在FAQ網(wǎng)頁上談?wù)摰焦雀枰纛l索引項(xiàng)目時表示:“Google Labs上的谷歌音頻索引項(xiàng)目應(yīng)用范圍將更廣,美國競選只是第一步。我們將把谷歌音頻索引項(xiàng)目視作一個實(shí)驗(yàn)平臺,通過這一平臺,我們可以發(fā)現(xiàn)用戶尋找網(wǎng)絡(luò)演講內(nèi)容時獲得最佳體驗(yàn)的一些功能。”
谷歌之所以選擇政治家的信息,是因?yàn)檎渭乙鸬年P(guān)注更高,另外,政治家的語言往往比普通人的語言更簡潔,語音識別技術(shù)的執(zhí)行效果會更好。
CNET科技資訊網(wǎng)(www.cnetnews.com.cn)
相關(guān)鏈接: