語音識(shí)別,就是讓機(jī)器通過分析和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的尖端技術(shù)。語音識(shí)別是一門交叉學(xué)科,所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、人工智能等等。語音識(shí)別技術(shù)與語音合成技術(shù)一同成為實(shí)現(xiàn)人機(jī)語音通信,建立有聽和講能力的語音系統(tǒng)所必需的兩項(xiàng)關(guān)鍵技術(shù)。
捷通華聲ASR核心引擎是針對(duì)特定語言的識(shí)別軟件模塊,該軟件模塊是整個(gè)ASR軟件的核心模塊。核心模塊接收其他模塊的設(shè)置,并根據(jù)設(shè)置內(nèi)容對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,并將識(shí)別結(jié)果列表返回給調(diào)用模塊。返回的識(shí)別結(jié)果列表,包含一組識(shí)別結(jié)果--識(shí)別信心值對(duì),以供調(diào)用模塊使用。
捷通華聲ASR語音識(shí)別技術(shù)具有以下特點(diǎn):
- 支持語種:廣泛支持中英文識(shí)別;
- 識(shí)別率:高針對(duì)漢語普通話,連續(xù)語音識(shí)別率可以達(dá)到90%以上,支持語音打斷功能與端點(diǎn)檢測(cè)功能;
- 識(shí)別速度:采用實(shí)時(shí)識(shí)別方式,實(shí)現(xiàn)語音數(shù)據(jù)的傳輸和識(shí)別的同步,實(shí)時(shí)率可達(dá)0.5以下。
- 可定制:定制模型的識(shí)別率可達(dá)到95%以上
- 詞表長度:大詞表長度可達(dá)到百萬以上(可根據(jù)需要擴(kuò)展);
- 音頻格式:用于進(jìn)行語音識(shí)別的輸入語音格式為:16K*8Bit A-Law、16K*8 Bit u-Law、16K*16 Bit PCM;
- 識(shí)別方式:支持詞表識(shí)別、語法識(shí)別和自由說識(shí)別。
- 語法功能:可以在加載多個(gè)語法文件的情況下,同時(shí)激活多個(gè)語法文件,讀取單個(gè)詞條,從多個(gè)語法文件中得出單個(gè)詞條的識(shí)別結(jié)果。
- 支持云端識(shí)別和本地端識(shí)別。