首頁>>廠商>>DSP及器件廠商>>德州儀器

影響企業(yè)級IP電話性能的因素分析及解決方案

陳煒 2007/03/09

  VoIP是指通過IP網(wǎng)絡(luò)傳輸電話呼叫的一種方式。VoIP允許通過已有的IP數(shù)據(jù)網(wǎng)絡(luò)傳輸電話呼叫,從而幫助企業(yè)降低通信成本。同時VoIP技術(shù)在企業(yè)市場的應(yīng)用使數(shù)據(jù)通信產(chǎn)品廠商進(jìn)入了語音市場,激烈的競爭催生了很多新的應(yīng)用。在諸多新的應(yīng)用中,IP電話與企業(yè)數(shù)據(jù)以及桌面應(yīng)用的集成已成為一個熱點,企業(yè)級IP電話的語音質(zhì)量對于整個融合解決方案的質(zhì)量至關(guān)重要。

影響語音質(zhì)量的因素

  VoIP是以一種新技術(shù)的角色進(jìn)入市場,與傳統(tǒng)的PSTN網(wǎng)絡(luò)進(jìn)行競爭。作為替代技術(shù),其語音質(zhì)量應(yīng)該能夠與PSTN的語音質(zhì)量一致或者更好。但是因為IP網(wǎng)絡(luò)原本不是為傳遞語音數(shù)據(jù)而設(shè)計的,相對傳統(tǒng)電話系統(tǒng),一些技術(shù)難點需要克服,設(shè)計者必須面對由此而帶來的挑戰(zhàn)。常見的問題有網(wǎng)絡(luò)時延、抖動、丟包和聲學(xué)回聲。

1. 網(wǎng)絡(luò)時延

  在傳統(tǒng)的PSTN網(wǎng)絡(luò),洲際長話或者衛(wèi)星長話的回路時延大約在500~600ms,這時候,當(dāng)一方說話后要過一段時間對方才會聽到說話并反應(yīng),雙方通話脫節(jié)。在ITU的標(biāo)準(zhǔn)中建議電話系統(tǒng)的回路延時應(yīng)該不大于300ms。在IP電話系統(tǒng)中,回路的時延包括語音報文打包時長、語音編解碼所引入的延時以及處理網(wǎng)絡(luò)抖動所引入的延時等。系統(tǒng)設(shè)計者必須均衡考慮各方面因素,使系統(tǒng)的回路時延盡可能小,使通話自然流暢。

2. 抖動

  IP報文在網(wǎng)絡(luò)上傳遞時,每個報文傳輸?shù)穆酚啥加锌赡懿灰粯,在每個節(jié)點上傳遞轉(zhuǎn)發(fā)的時間也可能不一樣。在一個VoIP通話中,每個語音數(shù)據(jù)報文在網(wǎng)絡(luò)中的傳輸時間都不一樣。一些報文會比預(yù)計到達(dá)的時間晚到或者早到接收方,而在回放解碼IP語音報文時,解碼器以固定間隔回放語音數(shù)據(jù)。晚到的語音包會導(dǎo)致在一段時間內(nèi)解碼器沒有數(shù)據(jù)可解,而早到的數(shù)據(jù)報文有可能被丟棄。所以系統(tǒng)中需要引入報文緩存區(qū)以去除網(wǎng)絡(luò)抖動,平滑網(wǎng)絡(luò)抖動所造成的影響。但是引入過深的緩存區(qū),會使回路時延相應(yīng)增大,需要選擇合適的緩存區(qū)大小,在能去除網(wǎng)絡(luò)抖動的同時,不過多增大回路延時。

3. 丟包

  理想的網(wǎng)絡(luò)情況是所有發(fā)送的語音報文都能夠被接收端正常接收。但是IP報文在網(wǎng)絡(luò)上傳遞時,網(wǎng)絡(luò)的個別處理節(jié)點可能會出現(xiàn)處理能力不夠或者帶寬受限制的情況,部分報文可能會被丟掉。雖然IP網(wǎng)絡(luò)上有一些機(jī)制可以在報文丟失的時候重傳丟失報文,但是對實時性要求很高的話音數(shù)據(jù)并不能使用這些機(jī)制。

  部分語音編解碼方式有內(nèi)置的丟包補(bǔ)償算法,在丟包比率不高的時候,可以使用插值的方法做補(bǔ)償,讓接聽方感覺不到語音信息丟失。但是在丟包率較高的網(wǎng)絡(luò),必須采用其它方法來控制網(wǎng)絡(luò)丟包對語音質(zhì)量的影響。

4. 聲學(xué)回聲

  在電話二四線轉(zhuǎn)換系統(tǒng)中通常存在兩種回聲:線路回聲和聲學(xué)回聲。

  線路回聲是由于二四線轉(zhuǎn)換的時候阻抗不匹配引起。在這種情況下,通話者的聲音傳遞到遠(yuǎn)端的二四線轉(zhuǎn)換時反射,同對方的說話送回到通話者的耳中。如果回路延時比較小(<50ms),通話者很難察覺到回聲的存在,但是當(dāng)回路時延比較大的時候,通話者就能聽到自己的說話。IP通話的回路時延一般比較大,所以在有二四現(xiàn)轉(zhuǎn)換的節(jié)點必須有回聲抑制單元。

  聲學(xué)回聲是由于在電話側(cè)的播放和接聽之間存在聲學(xué)耦合,喇叭播放出的聲音經(jīng)過在空間中的一次或者多次反射以后回饋到聽筒或麥克風(fēng)而引起(如圖1所示)。


  在企業(yè)級IP電話的設(shè)計中,因為IP電話中沒有二四線轉(zhuǎn)換,所以線路回聲的影響不需要考慮。聲學(xué)回聲的影響,特別是免提模式下的聲學(xué)回聲是系統(tǒng)設(shè)計者需要考慮的難點和主要問題。

  市場上推廣的很多解決方案宣稱能夠做到全雙工免提。但是事實上,大部分算法都只能支持半雙工免提通話。當(dāng)全雙工電話工作在免提模式下,通話的雙方即使同時說話也能聽到對方的聲音。如果是只能支持半雙工免提通話,當(dāng)雙方同時說話的時候,一方的聲音被壓制消除,不能被另一方聽到。甚至在本地的背景噪聲比較大的時候,對方的說話聲音被壓制,而聽不到任何聲音。

  網(wǎng)絡(luò)時延、抖動、丟包以及聲學(xué)回聲都是影響IP電話通話質(zhì)量的重要因素,系統(tǒng)設(shè)計者必須妥善解決這些問題。芯片供應(yīng)商如果能夠提夠成熟的方案解決這些共性問題,可以使系統(tǒng)設(shè)計者集中精力設(shè)計差異化的新業(yè)務(wù),并縮短產(chǎn)品推向市場的時間。

TNETV1050 IP電話解決方案

  TI提供全面的VoIP解決方案,覆蓋IP電話、家庭網(wǎng)關(guān)、電信級網(wǎng)關(guān)以及VoADSL和VoCable。針對企業(yè)級IP電話需求,TI提供了多種解決方案,其中TNETV1050/TNEV1055的SoC方案基于TI的TMS320C55x DSP系列的可編程DSP和增強(qiáng)的32位MIPS內(nèi)核。它使用先進(jìn)的系統(tǒng)架構(gòu),在提供高性能低功耗的同時,兼顧系統(tǒng)的可擴(kuò)展性,還包括豐富的外設(shè)接口,滿足設(shè)計企業(yè)級電話系統(tǒng)的要求。

圖2:TNETV1050/1055 IP電話處理器。

  TNETV1050芯片包含一個內(nèi)置的以太網(wǎng)交換機(jī)以及雙PHY,可以在桌面上提供IP電話服務(wù)的同時,提供一個PC連接。TNETV1050的USB接口可以使IP電話連接多種USB設(shè)備,如PDA等。設(shè)計者還可以通過TI的VLYNQ接口擴(kuò)展多種其他功能,例如Wi-Fi模塊,硬件加密等。芯片集成了LCD控制器、CODEC以及鍵盤接口,降低了系統(tǒng)成本。

  TI的IP電話軟件套件包括了DSP核心算法和配套的CPU軟件包。完整的DSP軟件包括多種編解碼算法、VAD、聲學(xué)回聲消除算法、報文回放模塊,以及完全的統(tǒng)計調(diào)試信息功能和語音質(zhì)量監(jiān)控模塊。針對企業(yè)電話應(yīng)用,TI提供完整的聲學(xué)回聲消除模塊支持全雙工免提功能,同時支持本地三方會議功能以及寬帶編解碼算法。

  CPU軟件工具包,包括TI的CPU軟件以及第三方的軟件模塊。其中包括控制DSP的API模塊、支持呼叫控制的模塊、加密框架模塊、協(xié)議棧接口,以及第三方的協(xié)議棧模塊。

  TI的軟件和第三方的軟件一起提供了IP電話所需要的完整軟件解決方案,優(yōu)化的芯片解決方案和DSP/CPU軟件大大減少了系統(tǒng)設(shè)計時間。針對企業(yè)級IP電話設(shè)計中遇到的共性問題,TI的軟件提供系統(tǒng)的解決方法。

1. 抖動和時延的處理

  針對抖動和時延問題,TI的DSP軟件做了相應(yīng)優(yōu)化,采用緊湊的系統(tǒng)結(jié)構(gòu),消除不必要的算法延遲。同時采用自適應(yīng)的去抖動緩存區(qū)的算法,可以計算網(wǎng)絡(luò)的實時抖動,并根據(jù)實時抖動大小來調(diào)整緩存區(qū)的深度。在網(wǎng)絡(luò)狀況良好的時候,如企業(yè)的本地局域網(wǎng)中,去抖動緩存區(qū)算法可以縮小緩存區(qū)深度,以減小回路延時。

2. 丟報的處理

  TI的軟件包中包括主動和被動兩種丟包處理辦法。主動算法是在傳輸報文中加入冗余信息(RFC 2198)或者前向糾錯信息(RFC 2733)。這樣在回放端如果發(fā)現(xiàn)有報文丟失,就可以根據(jù)相應(yīng)的信息恢復(fù)出丟失的報文。當(dāng)丟失的報文無法用主動方法恢復(fù)的時候,可以用被動的方法去做補(bǔ)償,根據(jù)前面的語音信息,擬合出一段語音用來補(bǔ)償。


  從圖3可以看到,在網(wǎng)絡(luò)丟包比較高的時候,使用主動干預(yù)仍然可以獲得比較好的語音質(zhì)量。

3. 聲學(xué)回聲的處理

  解決IP電話的聲學(xué)回聲問題需要從兩方面著手。

  首先,設(shè)計者需要采用有良好聲學(xué)特性的模具結(jié)構(gòu),以減小聲學(xué)回聲的幅度以及非線性回聲的部分。設(shè)計者可以通過咨詢相關(guān)的設(shè)計公司得到幫助。TI的方案包中包含聲學(xué)設(shè)計指南,對聲學(xué)設(shè)計中的一些要點提出建議。設(shè)計中的要點包括:盡可能增大喇叭到麥克風(fēng)的距離;麥克風(fēng)和喇叭在模具中應(yīng)該有聲學(xué)隔離;麥克風(fēng)應(yīng)用比較軟的海綿包住,然后固定到話機(jī)上,以減少從模具上傳遞過來的震動;話機(jī)在接觸桌面的部分使用減震的墊腳,以減少震動;選擇頻譜特性良好的喇叭和麥克風(fēng)等。

  其次,聲學(xué)回聲處理模塊應(yīng)能夠良好地去除壓制聲學(xué)回聲,并能夠正確處理兩端講話(double-talk)和不損害背景噪聲連續(xù)性。TI的聲學(xué)回聲抑制模塊利用快速傅立葉變換,使用基于頻域算法,能夠快速收斂預(yù)測參數(shù),有效的檢測兩端講話。采用多級雙向非線性算法,同時在非線性算法工作的時候利用頻譜特征補(bǔ)償背景噪聲。

實時語音監(jiān)控方案——PIQUA

  VoIP的一大難點是IP網(wǎng)絡(luò)的不確定性,而VoIP系統(tǒng)的語音質(zhì)量很大程度上倚賴于網(wǎng)絡(luò)質(zhì)量的好壞。網(wǎng)絡(luò)管理員需要一種實時監(jiān)控VoIP的質(zhì)量,主動干預(yù)網(wǎng)絡(luò)配置和VoIP的設(shè)置。

  PIQUA是TI推出的實時語音監(jiān)控方案,它根據(jù)復(fù)雜的算法估算出用戶對VoIP系統(tǒng)語音質(zhì)量的主觀感覺并實時上報,同時還提供重要的網(wǎng)絡(luò)統(tǒng)計信息。上層軟件和網(wǎng)絡(luò)管理員可以根據(jù)實時語音質(zhì)量以及統(tǒng)計信息對系統(tǒng)配置進(jìn)行干預(yù)。例如,當(dāng)某一段時間網(wǎng)絡(luò)的丟報率比較大,導(dǎo)致語音質(zhì)量下降的時候,系統(tǒng)管理軟件可以根據(jù)PIQUA的信息,配置不同等級的冗余或者前向糾錯來保證語音質(zhì)量。同時網(wǎng)絡(luò)管理員也可以根據(jù)PIQUA的記錄,了解整個網(wǎng)絡(luò)的狀況,找到丟包率較高的原因,調(diào)整路由表或者網(wǎng)絡(luò)帶寬分配,主動維護(hù)整個語音網(wǎng)絡(luò)的質(zhì)量。

電子工程專輯



相關(guān)鏈接:
TI成本硬件開發(fā)套件 實現(xiàn)視頻網(wǎng)關(guān)應(yīng)用 2009-09-18
德州儀器推出三款全新多通道視頻解碼器 2009-08-24
德州儀器演示單處理器8通道H.264主類編碼 2009-06-01
德州儀器推出基于達(dá)芬奇技術(shù)的新型TMS320DM365處理器 2009-03-11
TI發(fā)布基于OMAP 3的最新Android移動平臺 2009-02-27

分類信息: