語音識(shí)別應(yīng)用決定智能語音行業(yè)未來成長
2011/01/04
從智能語音技術(shù)的發(fā)展歷程來看,應(yīng)用的技術(shù)推動(dòng)力主要是語音技術(shù)核心算法和計(jì)算機(jī)芯片技術(shù)。二十世紀(jì)末,建立在統(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)理念基礎(chǔ)上的語音技術(shù)核心算法逐步成熟,基于HMM(隱馬爾可夫模型)的語音合成及識(shí)別技術(shù)在實(shí)用中占據(jù)了主導(dǎo)地位。計(jì)算機(jī)芯片技術(shù)則遵照摩爾定律,每18個(gè)月性能提升1倍,芯片運(yùn)算能力的持續(xù)增長使得更為復(fù)雜的語音技術(shù)算法不斷得以實(shí)現(xiàn)。嵌入式芯片技術(shù)特別是SOC技術(shù)的發(fā)展及芯片成本的下降,有力推動(dòng)了智能語音技術(shù)在移動(dòng)設(shè)備中的應(yīng)用。
語音合成技術(shù):成熟度較高,應(yīng)用廣泛。語音合成技術(shù)的研究起步于上世紀(jì)三十年代,到二十世紀(jì)末統(tǒng)計(jì)建模方法開始引入到語音合成技術(shù)中,從而提出了可訓(xùn)練的語音合成方法。基于HMM模型的合成技術(shù)和大語料庫波形拼接技術(shù)是目前主流的語音合成方法。語音合成技術(shù)在2000年時(shí)已達(dá)到用戶基本可接受的準(zhǔn)實(shí)用水平,2005年開始獲得了較為廣泛的應(yīng)用。未來語音合成技術(shù)將從清晰度和自然度的要求上升至對(duì)個(gè)性化合成的要求,如對(duì)語音、語調(diào)、情緒的豐富性要求等。
語音識(shí)別技術(shù):技術(shù)難度高,潛在需求較大。語音識(shí)別技術(shù)主要包括語意識(shí)別和聲紋識(shí)別,對(duì)語音識(shí)別的研究起步于二十世紀(jì)五十年代,從二十世紀(jì)末開始進(jìn)入實(shí)際應(yīng)用。語音識(shí)別在技術(shù)原理上主要采取匹配識(shí)別和檢測識(shí)別兩種識(shí)別方式,關(guān)鍵技術(shù)包括選擇識(shí)別單元、特征參數(shù)提取、聲學(xué)模型及語言模型的建立等。語音識(shí)別技術(shù)目前在桌面系統(tǒng)、移動(dòng)設(shè)備和嵌入式領(lǐng)域均有一定程度的應(yīng)用,未來的發(fā)展方向應(yīng)是無限詞匯量連續(xù)語句非特定人語音識(shí)別系統(tǒng)。
四大細(xì)分市場面臨突破。綜合考慮目前的技術(shù)能力和客戶接受度,我們認(rèn)為企業(yè)級(jí)市場、車載語音市場、移動(dòng)終端市場及教育娛樂市場有望在未來率先實(shí)現(xiàn)突破。我們預(yù)計(jì)國內(nèi)呼叫中心語音市場有望于未來兩年內(nèi)啟動(dòng),市場規(guī)模在其后有快速增長至億元量級(jí)的可能;車載語音識(shí)別系統(tǒng)市場出現(xiàn)快速增長,市場規(guī)模有望從2009年的6430萬美元提升至2014年的2.1億美元,年均復(fù)合增長率約為26.7%;而移動(dòng)終端語音市場和教育娛樂語音市場均有較大發(fā)展?jié)摿Α?br />
高技術(shù)壁壘形成寡頭壟斷競爭格局。智能語音技術(shù)是人工智能的研究領(lǐng)域之一,其技術(shù)原理涉及聲學(xué)、語言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科,同時(shí)智能語音技術(shù)的研究周期長、投入大,使得智能語音行業(yè)具有較高的進(jìn)入壁壘。在全球范圍內(nèi),目前已形成寡頭壟斷競爭格局,僅有Nuance、IBM、微軟、Googe、科大訊飛等少數(shù)廠商具備較強(qiáng)競爭力。
海通證券
相關(guān)閱讀:
津市市|
南京市|
尉氏县|
榕江县|
寿阳县|
蒲城县|
那曲县|
宜君县|
永寿县|
中宁县|
凤阳县|
郁南县|
钟祥市|
治多县|
泸州市|
茶陵县|
扬州市|
科尔|
怀安县|
宣武区|
精河县|
武平县|
柞水县|
西林县|
罗源县|
安图县|
云阳县|
廊坊市|
蕲春县|
错那县|
麟游县|
浪卡子县|
如皋市|
石柱|
牙克石市|
通江县|
文登市|
洛隆县|
绵阳市|
浑源县|
枣强县|