首頁>>廠商>>語音識別與合成>>得意音通

得意音通成為中文語音交互技術(shù)標(biāo)準(zhǔn)工作組首批成員單位

2003/11/28

  經(jīng)信息產(chǎn)業(yè)部科技司批準(zhǔn),北京得意音通技術(shù)有限責(zé)任公司、清華大學(xué)智能技術(shù)與系統(tǒng)國家重點實驗室、清華大學(xué)計算機科學(xué)與技術(shù)系等19個單位正式成為中文語音交互技術(shù)標(biāo)準(zhǔn)工作組首批成員單位。

   "中文語音交互技術(shù)標(biāo)準(zhǔn)工作組" (http://www.speechstandard.org.cn/)是由國內(nèi)產(chǎn)、學(xué)、研、用等企事業(yè)單位以及大專院校等自愿聯(lián)合組織、經(jīng)信息產(chǎn)業(yè)部科技司批準(zhǔn)成立的、組織開展中文語音交互領(lǐng)域技術(shù)標(biāo)準(zhǔn)制定和研究活動的非營利性技術(shù)工作組織。工作組成立于2003年10月,主要工作任務(wù)是:"研究并制定與中文語音交互技術(shù)有關(guān)的數(shù)據(jù)交換格式、系統(tǒng)架構(gòu)與接口、系統(tǒng)分類與評測及數(shù)據(jù)庫格式與標(biāo)注等方面的標(biāo)準(zhǔn)。"。

  北京得意音通技術(shù)有限責(zé)任公司(http://www.d-ear.com)專業(yè)從事語音識別與語言理解技術(shù)研發(fā)和應(yīng)用,在語音技術(shù)領(lǐng)域有著非常深厚的技術(shù)積累,擁有三大核心技術(shù):自動語音識別(ASR)技術(shù)、中文自然語言理解(CNLU)技術(shù)和聲紋識別(VPR)技術(shù)。得意公司的發(fā)展戰(zhàn)略是:以三大核心技術(shù)為基礎(chǔ),與國內(nèi)外公司和機構(gòu)開展廣泛深入的合作,為它們提供最佳的技術(shù)成果、解決方案和信息服務(wù)。得意公司的市場定位是:為硬件生產(chǎn)商、軟件開發(fā)商、系統(tǒng)集成商、通訊網(wǎng)絡(luò)運營商、通信增值服務(wù)平臺運營商等提供相應(yīng)的軟件應(yīng)用編程接口(API)/軟件開發(fā)工具(SDK),或者捆綁、集成定制的軟件系統(tǒng),主要的商業(yè)合作模式包括軟件授權(quán)以及信息服務(wù)分成。

  清華大學(xué)智能技術(shù)與系統(tǒng)國家重點實驗室(http://sp.cs.tsinghua.edu.cn/),1990年2月通過國家驗收并對外開放運行, 是信息技術(shù)領(lǐng)域處于全國領(lǐng)先地位的國家重點實驗室,主要研發(fā)方向包括人機交互技術(shù)和自動控制技術(shù),承接并出色完成過許多國家級重大基礎(chǔ)研究與應(yīng)用基礎(chǔ)研究項目。獲得很多國家級的科技成果獎,擁有相當(dāng)數(shù)量的專利技術(shù)。在國家科技部組織的全部三次評估中均被評為A級,是全國信息類國家重點實驗室中唯一的一個。國家重點實驗室屬下的語音技術(shù)中心(CST),成立于1979年,主要從事的方向為語音識別、聲紋識別、自然語言對話系統(tǒng)等。承擔(dān)過國家重點攻關(guān)任務(wù)、863項目、973項目、軍口預(yù)研任務(wù)、清華大學(xué)一流大學(xué)重點學(xué)科建設(shè)985項目,及許多國際和國內(nèi)合作項目等,多次獲獎;在國際國內(nèi)的會議和各種學(xué)術(shù)刊物上發(fā)表論文數(shù)百篇;研發(fā)了數(shù)十項語音產(chǎn)品。1990年參與發(fā)起全國人機語音通訊學(xué)術(shù)會議(NCMMSC);多次主持主持國內(nèi)外重要的語音學(xué)術(shù)會議。國家重點實驗室屬下的智能信息處理課題組自1995年開始語音信號處理的工作。主要是承擔(dān)的國際合作項目,進(jìn)行了語音識別、說話人識別等方面的研究。理論方面提出具有動態(tài)閾值的說話人模型、全局說話人模型、分段概率語音識別模型,及有關(guān)連續(xù)語音訓(xùn)練、時間駐留信息處理等等,其論文已在IEEE Trans. on SMC、《計算機學(xué)報》等國內(nèi)外刊物發(fā)表。除此之外,還進(jìn)行了小波變換、神經(jīng)網(wǎng)絡(luò)等理論在語音識別上的應(yīng)用的研究。發(fā)表論文30余篇。

  語音是人們獲取和溝通信息最方便、最有效的手段。近幾年來,語音技術(shù)的應(yīng)用已經(jīng)深入到人們生活的方方面面。從電信、交通、稅務(wù)、銀行、證券、保險等行業(yè)到企業(yè)和家庭用戶,從PC到手機再到MP3和玩具,其應(yīng)用幾乎無所不在。

  隨著語音技術(shù)和應(yīng)用的逐步成熟,市場需求增大的同時,面臨著復(fù)雜系統(tǒng)互聯(lián)的問題,如當(dāng)前應(yīng)用廣泛的160/168聲訊服務(wù)、電話銀行、語音門戶、無線通信業(yè)務(wù)等等,集成系統(tǒng)的復(fù)雜性呈指數(shù)級上升。在系統(tǒng)的互聯(lián)接口、內(nèi)容交換數(shù)據(jù)格式等方面沒有一個大家共同遵循的標(biāo)準(zhǔn),其開發(fā)難度、維護難度和運營難度是難以想象的。語音合成、語音識別引擎怎樣與電話設(shè)備、后臺數(shù)據(jù)庫、地理信息、無線定位等其他組成部分完成通信并和平共處,怎樣將不同廠商的產(chǎn)品根據(jù)統(tǒng)一的應(yīng)用場景需要加以集成,成了遏制語音應(yīng)用大規(guī)模發(fā)展的絆腳石。

  而國際上,跨國巨頭對語音市場垂涎已久,國際相關(guān)語音標(biāo)準(zhǔn)發(fā)展迅速,形成了VXML和SALT兩大語音標(biāo)準(zhǔn)陣營,并各自都獲得了廣泛的支持。另外國際巨頭也紛紛推出各自的應(yīng)用框架和標(biāo)準(zhǔn)全面進(jìn)入中國,憑借其既成事實的開發(fā)案例使得國內(nèi)廠商難以進(jìn)入。

  制定中文語音有關(guān)標(biāo)準(zhǔn),對促進(jìn)中文語音技術(shù)應(yīng)用、推動中文語音產(chǎn)業(yè)發(fā)展、增強民族軟件核心競爭力均具有非常重要的意義。國家信息產(chǎn)業(yè)部科技司在廣泛調(diào)研、認(rèn)真征求專家意見的基礎(chǔ)上,于2003年10月在合肥主持召開了"中文語音交互技術(shù)標(biāo)準(zhǔn)工作組"成立大會。

得意音通公司供稿 CTI論壇編輯



相關(guān)鏈接:
得意珠三角綜合智能信息增值平臺項目中標(biāo) 2009-08-20
北京軟件產(chǎn)品質(zhì)量檢測檢驗中心對《海量語音文件的目標(biāo)說話人篩選系統(tǒng)》進(jìn)行測試 2009-06-25
廣東政府和清華大學(xué)舉行了全面開展產(chǎn)學(xué)研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23
得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27

分類信息:  語音合成TTS_與_語音識別ASR     新聞頻道   技術(shù)_語音合成_新聞   技術(shù)_語音識別_新聞