在電話通信線路上,研究語音過程是很重要的。這里簡單介紹語音在通訊中的應(yīng)用以及CTI系統(tǒng)中常見的問題,不涉及語音生理學(xué)和文語轉(zhuǎn)化等不成熟和不必要的技術(shù)。 |
東進(jìn)公司為系統(tǒng)開發(fā)商提供語音庫,語音編輯工具,語音轉(zhuǎn)換程序源代碼等支持。 |
聲音的三個要素是:音調(diào),音強,音色。人耳對 25-22000 Hz 的聲音有反應(yīng)。 |
電話公司認(rèn)識到,人們在談話中大部分有用的信息在 3K Hz以內(nèi)。模擬波形能用頻率表示并且譜的范圍是 30 Hz -10 KHz,但是,大部分有用的和可理解的信息的能量是在 200Hz 到3500Hz 之間。因此,電信的傳輸線路上使用了帶通濾波器,所提供的典型電話信道能運載 3K Hz帶寬(即300-3300Hz)。根據(jù)Nyquist準(zhǔn)則,A/D轉(zhuǎn)換采樣速率至少是信號最大頻率的兩倍,因此最小的采樣頻率應(yīng)該是6600Hz --- 實際上采用的頻率略高一點,達(dá)到 8KHz 。 |
每個采樣測量出特定時刻語音信號的幅度等級。一個采樣由8位組成,可以有256個不同的采樣結(jié)果,這對于在接收端無失真地恢復(fù)模擬信號已經(jīng)足夠。 |
根據(jù)8KHz采樣頻率,每個采樣8位來計算,電話線上每秒中將有64000位的數(shù)據(jù)流,即 64KBps。 |
運載不同的信息需要不同的線路。高保真音樂的帶寬是15KHz,F(xiàn)M電臺的帶寬是200KHz,電視信道的帶寬是4.5MHz。所以,在電話線路上放高保真音樂是無法忍受的,因為大部分的音色都被濾掉了--這就是所謂的失真。 |
|
模擬線路上傳輸?shù)腄TMF碼也是一種聲音(Dual Tone Multi Frenquence),一般而言,人的聲音不會發(fā)出DTMF 碼的頻率。但是并不排除聲音中出現(xiàn)DTMF的可能性。 |
所以,當(dāng)您錄制完一段聲音后,一定用有關(guān)的工具檢查聲音中是否有DTMF碼。 |