前言
有本暢銷(xiāo)書(shū)《世界是平的》,把網(wǎng)絡(luò)通訊技術(shù)的變革視為使全球化的力量之一,統(tǒng)一通訊技術(shù)發(fā)展方向是IP將融合所有協(xié)議,AV將融合所有格式,互聯(lián)互通,開(kāi)放式代替封閉式,技術(shù)越復(fù)雜就越要求用戶(hù)應(yīng)用上的簡(jiǎn)單,而數(shù)字音頻處理技術(shù)則是網(wǎng)絡(luò)通訊中最基礎(chǔ)和最核心的技術(shù)之一。
一、與朗谷數(shù)字音頻處理技術(shù)關(guān)聯(lián)的基礎(chǔ)概念
歷史
回音消除已經(jīng)替代了早期的回音抑制,回音抑制最早始于20世紀(jì)50年代,在衛(wèi)星通訊環(huán)境中用來(lái)控制由于比較長(zhǎng)的信號(hào)延時(shí)而聽(tīng)到的回音。最早的回音消除理論在二十世紀(jì)六十年代在AT&T貝爾實(shí)驗(yàn)室中發(fā)展起來(lái),但是直到20世紀(jì)70年代末,由于受到電子行業(yè)的技術(shù)能力限制,商用回音消除產(chǎn)品一直沒(méi)有取得太大的發(fā)展。
隨著DSP的飛速發(fā)展使得回音消除產(chǎn)品變得更小和更具有效費(fèi)比。在20世紀(jì)九十年代,回音消除器不再作為一個(gè)獨(dú)立的設(shè)備,第一次被集成于語(yǔ)音網(wǎng)關(guān)中(加拿大北電公司DMS-250)。這個(gè)整合使得回音消除直接內(nèi)置于語(yǔ)音網(wǎng)關(guān)中,意味著回音消除器可以在通話(huà)過(guò)程中非常可靠地被開(kāi)啟或者關(guān)閉,在語(yǔ)音通訊和數(shù)據(jù)通信中區(qū)分不同的干線(xiàn)組取得所需要的信號(hào)。
1、回聲與延時(shí)的關(guān)系
回聲和延時(shí)是兩個(gè)不同的概念,延時(shí)不會(huì)加重或者改變回聲的量值。聲音有一個(gè)遮掩效應(yīng),例如我們?cè)谏焦壤锬敲辞宄穆?tīng)到回聲的原因是因?yàn)槁曇舻膫鬟f時(shí)間長(zhǎng),聲音反射回來(lái)的時(shí)間就長(zhǎng),超過(guò)1秒甚至2秒,聲音的傳遞時(shí)間長(zhǎng)了,聲音的遮掩效應(yīng)會(huì)失去,這樣人的耳朵就會(huì)感覺(jué)到聽(tīng)到這個(gè)回聲,回聲是一直存在的,專(zhuān)門(mén)的研究機(jī)構(gòu)做過(guò)專(zhuān)門(mén)的測(cè)試,聲音的傳遞小于20毫秒左右的時(shí)候,遮掩效果發(fā)揮作用,人耳一般聽(tīng)不出來(lái),超過(guò)20毫秒以后遮掩效應(yīng)開(kāi)始衰減,超過(guò)50毫秒,聲音的遮掩效應(yīng)就基本消失了,只要有微弱的回聲人耳就能聽(tīng)得到。
2、回聲和數(shù)字延時(shí)及語(yǔ)音壓縮技術(shù)的關(guān)系
數(shù)字延時(shí)技術(shù)就是把線(xiàn)性的信號(hào),語(yǔ)音信號(hào)從喇叭或者電話(huà)中傳出去前,經(jīng)過(guò)數(shù)字信號(hào)采樣處理會(huì)延遲一段時(shí)間,就使得回音回來(lái)延遲的更長(zhǎng),所以我們能夠聽(tīng)到。而語(yǔ)言壓縮技術(shù)是對(duì)一段數(shù)字信號(hào)進(jìn)行采樣后壓縮,然后再把這個(gè)壓縮信號(hào)送出去,這一段數(shù)字信號(hào)一般是30毫秒,40毫秒左右,語(yǔ)音數(shù)據(jù)經(jīng)過(guò)拿出來(lái)做處理,處理之后,再送出去,這樣就增加了40毫秒的延時(shí),導(dǎo)致的結(jié)果就是有回音回來(lái)被聽(tīng)到。例如我們現(xiàn)在的電話(huà)網(wǎng)絡(luò)都采用用數(shù)字交換機(jī),而以前都是模擬交換機(jī),送出的都是模擬信號(hào),這個(gè)信號(hào)是以光速傳遞的,所以在模擬交換機(jī)時(shí)代,打本地電話(huà)和長(zhǎng)途電話(huà)感覺(jué)不到有回音,只有通過(guò)衛(wèi)星打國(guó)際電話(huà)的時(shí)候聽(tīng)到有回音,因?yàn)檠舆t時(shí)間就變長(zhǎng)了,那么打本地電話(huà),電信號(hào)以光的速度傳遞,只有幾個(gè)毫秒,我們就聽(tīng)不見(jiàn)感覺(jué)不到回音的存在,而現(xiàn)在的電話(huà)網(wǎng)絡(luò)全都用數(shù)字式的,它把電信號(hào)變成數(shù)字信號(hào),而數(shù)字信號(hào)的處理,不是采一個(gè)數(shù)字就送出去,它是采集一段信號(hào),可能是20毫秒40毫秒的信號(hào)進(jìn)來(lái)了,把它處理一下,然后送出去,這樣的數(shù)字處理的效率很高,把信號(hào)先壓縮以后,再送出去,結(jié)果就是效率更高,本來(lái)一根線(xiàn)只能送一路電話(huà),現(xiàn)在可能送10個(gè)電話(huà),但是提高效率的同時(shí),增加了延時(shí)作為結(jié)果,這是就導(dǎo)致回音的出現(xiàn),例如我們打手機(jī)有回音,也是這種原因。
二、AEC(Adaptive Echo Control) 朗谷自適應(yīng)回聲消除回音器的原理
1、回聲消除原理
回音的產(chǎn)生既復(fù)雜也簡(jiǎn)單,一般喇叭信號(hào)出來(lái)聲音它會(huì)傳遞到麥克風(fēng),這個(gè)傳遞過(guò)程本身從技術(shù)上講就有一個(gè)傳遞函數(shù),傳遞本身就已經(jīng)發(fā)生了一些變化,在傳遞過(guò)程中,高頻和低頻的傳遞系數(shù)是不一樣的,通常低頻傳遞的效率更高,高頻傳遞的效率低一點(diǎn)。麥克風(fēng)跟喇叭的位置靠的越近,聲音傳遞的時(shí)間越短,稍微離的遠(yuǎn)一點(diǎn),那么延遲的時(shí)間會(huì)多一點(diǎn),即使聲音直接傳過(guò)去,信號(hào)就已經(jīng)有時(shí)間延時(shí)了,麥克風(fēng)位置的改變,回音也隨之改變,傳遞的聲音隨著距離位置的改變,它傳遞的時(shí)間也發(fā)生改變,接觸到信號(hào)也就改變了,但聲音除了這個(gè)直接信號(hào)以外,聲音在空間中它是往各個(gè)方向傳遞的,它會(huì)碰到墻壁、碰到天花板反射回來(lái),然后反射到麥克風(fēng),有的反射到桌面然后到麥克風(fēng),各個(gè)情況都存在,所以這是一個(gè)很復(fù)雜的問(wèn)題,所有的信號(hào)最終的結(jié)果是疊加在一起的,疊加的結(jié)果就是有的信號(hào)被增強(qiáng)了,有的信號(hào)被減弱了,各種各樣的都有,然后墻壁對(duì)聲音信號(hào)的反射也不一樣,高頻低頻都不一樣,所以結(jié)果是一個(gè)復(fù)雜的所有疊加的結(jié)果,有的早有的晚,有的強(qiáng)有的弱,朗谷做回音消除呢,就是把總的傳遞函數(shù)效果算出來(lái),那么并不是簡(jiǎn)單的說(shuō)兩個(gè)信號(hào)一樣,這個(gè)你算出來(lái)的回音信號(hào),跟送出去的參考信號(hào),送到喇叭去的信號(hào)并不一樣,它已經(jīng)經(jīng)過(guò)了一些傳遞改變了,那么可能有些已經(jīng)延遲了100個(gè)毫秒,這是總的結(jié)果,回音消除的原理就是信號(hào)出去,然后麥克風(fēng)收的信號(hào)肯定是這些信號(hào)各種各樣的直接間接的傳遞,反射回來(lái)的信號(hào)疊加到一起,我們把這些傳遞函數(shù)計(jì)算出來(lái),疊加結(jié)果計(jì)算出來(lái),這樣就能得到一個(gè)回音信號(hào)和麥克風(fēng)信號(hào),在理想條件下如果計(jì)算出來(lái)的和麥克風(fēng)信號(hào)一樣,就可以把回聲消除掉,如果計(jì)算出來(lái)的有誤差,那么就不可能消除干凈,這就是回聲消除的原理。回聲消除技術(shù)后面還有很復(fù)雜的數(shù)學(xué)問(wèn)題。回音消除最難的地方是變量太多,回音模型的改變回音的疊加的結(jié)果都要計(jì)算出來(lái)。另外還有采用回聲抑制進(jìn)行回聲處理的方法,即非線(xiàn)性的過(guò)度就是兩邊同時(shí)說(shuō)話(huà)的時(shí)候,它分辯不出那個(gè)是回音信號(hào),所以就cutoff,剪切掉拉,這是處理不當(dāng),也可以說(shuō)是單工,就是因?yàn)榫(xiàn)性的做的不夠好,還有回音,所以它就多切掉一點(diǎn),回聲抑制就是這個(gè)道理。也就是回聲消除和回音抑制的不同。
2、回聲消除技術(shù)關(guān)鍵性技術(shù)指標(biāo)
1)ITU-T的G.167
這是國(guó)際電信聯(lián)盟有一個(gè)標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)要求任何回聲消除必須要做到降低45分貝以上,但是達(dá)到這個(gè)標(biāo)準(zhǔn)不是最好的,因?yàn)槿诉能聽(tīng)到這個(gè)回聲,這個(gè)是最基本的標(biāo)準(zhǔn)。原則上麥克風(fēng)信號(hào)收的信號(hào)有一個(gè)電平,這個(gè)電平我們可以用分貝來(lái)標(biāo)示,如果這個(gè)信號(hào)的電平比如說(shuō)是-3dB,如果你消除了30dB,那么結(jié)果就變成了-30Db,因?yàn)?0分貝能量上是10倍,20個(gè)分貝就是100倍,人耳能聽(tīng)到的聲音范圍值大約是100萬(wàn)倍,所以人耳朵能聽(tīng)到能量范圍值是60分貝左右,回聲處理要消除60分貝以上人耳才聽(tīng)不出來(lái),如果只消除30或者40分貝,能量降低到千分之一,萬(wàn)分之一,雖然能量弱了很多,但還是能聽(tīng)到。
朗谷的回聲消除技術(shù)通過(guò)線(xiàn)性和非線(xiàn)性的方法可以做到60個(gè)分貝甚至更高,可以達(dá)到非常優(yōu)秀的回聲消除的效果,人耳無(wú)法感受到回聲的存在。
2)回聲消除的帶寬:
窄帶模式頻率: 300Hz—3.4kHz
寬帶頻率模式: 50Hz—7kHz 應(yīng)用廠家ploycom/Cisco/skype
超寬帶模式:50Hz—14kHz,一般稱(chēng)HD高清音頻模式
全音域模式:20Hz—20kHz
朗谷的回聲消除技術(shù)采用20Hz—20kHz的全音域模式
三、AFC(Adaptive Feedback Control)自適應(yīng)聲反饋處理技術(shù)
1、原理:
朗谷的自適應(yīng)聲反饋處理技術(shù)不受環(huán)境位置、溫度、濕度的改變聲場(chǎng)參數(shù)的影響,完全自適應(yīng),是業(yè)界數(shù)字音頻處理技術(shù)應(yīng)用的顛覆性技術(shù)創(chuàng)新。
現(xiàn)場(chǎng)擴(kuò)聲環(huán)境產(chǎn)生聲反饋的問(wèn)題是麥克風(fēng)的信號(hào)到喇叭,從喇叭出來(lái)再到麥克風(fēng)就造成了放大回路,形成聲反饋,朗谷的AFC技術(shù)就是,從喇叭出來(lái)的信號(hào)回到麥克風(fēng),然后麥克風(fēng)接收的喇叭信號(hào)給它濾掉和降低,朗谷技術(shù)將此信號(hào)衰減10分貝,這樣就把它從喇叭出來(lái)的信號(hào)衰減了,這樣從放大器出來(lái)回到喇叭,就產(chǎn)生嘯叫,但是發(fā)言人說(shuō)話(huà)的聲音,經(jīng)過(guò)麥克風(fēng)以后照原樣送出去,原樣又放大出來(lái),這就是我們提高傳聲增益,但是又完成聲反饋消除的最基本原理。朗谷AFC首先把模擬信號(hào)變成數(shù)字信號(hào),然后采樣濾波,只把從喇叭出來(lái)的信號(hào)回到麥克風(fēng)的這一部分濾波濾掉,降低掉,然后再放大。
1、特點(diǎn):
1)朗谷AFC無(wú)須調(diào)整
朗谷的AFC技術(shù)不需要調(diào)整,麥克風(fēng)移動(dòng)、房間改變、濕度改變、溫度改變、氣壓改變統(tǒng)統(tǒng)沒(méi)有關(guān)系,不受任何影響。
2)朗谷AFC原音重放,聲音無(wú)改變
朗谷AFC對(duì)說(shuō)話(huà)人的信號(hào)、頻率等都不去改變,也沒(méi)有陷波器在里面,所以朗谷AFC不影響系統(tǒng)的音質(zhì),而目前市場(chǎng)上大多數(shù)的聲反饋處理技術(shù)都是采用陷波器的抑制技術(shù),陷波器不管是什么信號(hào),不管是從喇叭出來(lái)的信號(hào),還是人講話(huà)的聲音,都是把某些頻率陷進(jìn)去,凹下去了,頻率響應(yīng)應(yīng)該是平的,原來(lái)是什么聲音,重放出來(lái)還是什么聲音,而陷波器的技術(shù)原理就是陷下去了,把這個(gè)頻率衰減下來(lái),這就是陷波器的原理,也是目前用聲反饋抑制技術(shù)進(jìn)行信號(hào)處理劣化音質(zhì)的問(wèn)題所在,一只兩只話(huà)筒還可以,當(dāng)多只話(huà)筒尤其是多只界面式話(huà)筒應(yīng)用的時(shí)候,傳統(tǒng)的聲反饋抑制技術(shù)是無(wú)法勝任的,唯有朗谷實(shí)驗(yàn)室的AFC技術(shù)可以完美解決這個(gè)會(huì)議室聲學(xué)的棘手難題。
四、ANC(Adaptive Noise Control)自適應(yīng)背景降噪技術(shù)
朗谷的背景聲降噪技術(shù)保證清晰干凈的語(yǔ)音信號(hào)傳遞
朗谷的背景降噪的技術(shù)原理是將做信號(hào)分析模型和信號(hào)的頻譜分析,這樣我們就能分析背景噪聲響應(yīng)的強(qiáng)度和頻譜分布,然后根據(jù)這個(gè)模型就能設(shè)計(jì)一個(gè)濾波器,當(dāng)有人講話(huà)的時(shí)候,同時(shí)做信號(hào)分析,根據(jù)分析,朗谷ANC就能分析出講話(huà)者的頻譜,那么根據(jù)這些背景噪音和講話(huà)者的頻譜,這個(gè)濾波器根據(jù)兩個(gè)信號(hào)的對(duì)比實(shí)時(shí)的改變,讓講話(huà)者聲音頻譜通過(guò),讓背景噪聲的頻譜濾掉,這樣的結(jié)果就是把背景噪聲濾掉了,當(dāng)然不是完全的濾掉,比如說(shuō)降低15到20個(gè)分貝,就很明顯可以感覺(jué)體驗(yàn)到背景降噪的效果。
五、AGC(Automatic Gain Control)自動(dòng)增益控制技術(shù)
AGC自動(dòng)增益控制也稱(chēng)為智能電平控制(ILC)技術(shù),自動(dòng)增益控制提供語(yǔ)音電平調(diào)節(jié)能力,它把減弱了的和加強(qiáng)了的信號(hào)映射到一個(gè)用戶(hù)定義的最理想電平。不象普通的產(chǎn)品,在這些產(chǎn)品中只增加減弱信號(hào)的增益,而不理會(huì)增強(qiáng)了的信號(hào),Longoo的AGC是雙向的,并且不僅僅是一個(gè)固定電平的增益或衰減。一些增益控制技術(shù)使用一個(gè)固定的失真-補(bǔ)償類(lèi)衰減來(lái)減少對(duì)大聲語(yǔ)音的修剪,但把這種失真加到了所有信號(hào)之上,這使輕柔的語(yǔ)音更難以聽(tīng)清楚。AGC具有區(qū)分加強(qiáng)了的信號(hào)和輕柔信號(hào)的能力,避免了這種問(wèn)題,同時(shí)保持住對(duì)話(huà)聲調(diào)的連貫和讓話(huà)音易于聽(tīng)清楚。
為了維持聽(tīng)感上的舒適性,對(duì)可以應(yīng)用到AGC和NC的增益和衰減有一個(gè)限制,最大值是12dB。舉例,假如輸入的話(huà)音電平為-18dBu,并且AGC設(shè)定為-12dB,AGC將會(huì)把語(yǔ)音放大6dB來(lái)維持一致的設(shè)定語(yǔ)音電平值(-12dB)。當(dāng)噪聲出現(xiàn)時(shí),NC會(huì)根據(jù)引入噪聲的電平把語(yǔ)音放大到AGC設(shè)定電平之上,最多放大額外的6dB(AGC+NC=<12dB)。如果輸入的語(yǔ)音加強(qiáng)得太多,最大可能的NC增益會(huì)太大,并可能導(dǎo)致語(yǔ)音失真。為了補(bǔ)救這種失真,Longoo提供了一個(gè)防止飽和電平,它設(shè)定了一個(gè)-6dBu的默認(rèn)最大語(yǔ)音電平。這就限制了NC能夠增大的增益量,因此能保證語(yǔ)音總是可懂并且聽(tīng)起來(lái)舒適。
必須注意避免讓NC放大電平很低的回聲或背景噪聲,這些雜音可能會(huì)由呼叫的遠(yuǎn)端泄漏進(jìn)來(lái)。為了防止這種放大,NC必須能夠從語(yǔ)音中分辯出這些信號(hào),并只放大話(huà)音而不放大任何低電平背景噪聲或回聲。
噪聲補(bǔ)償、自動(dòng)增益控制以及這些功能特征的結(jié)合引出了一個(gè)新的、唯一的概念──智能電平控制(ILC)。普通產(chǎn)品只能提供一個(gè)基于設(shè)定值的固定增益電平(或衰減電平),而ILC技術(shù)適合于指定呼叫特征,調(diào)整語(yǔ)音到理想的收聽(tīng)電平,并在整個(gè)呼叫過(guò)程中動(dòng)態(tài)地再作調(diào)整,以達(dá)到一個(gè)清晰、持續(xù)的、可聽(tīng)懂的語(yǔ)音信號(hào)。
朗谷科技產(chǎn)品
目前分為工程固定安裝和商用移動(dòng)會(huì)議兩大類(lèi),產(chǎn)品完全基于自主的知識(shí)產(chǎn)權(quán)和專(zhuān)利技術(shù)進(jìn)行的技術(shù)創(chuàng)新,同時(shí)在工業(yè)設(shè)計(jì)和功能設(shè)計(jì)上進(jìn)行產(chǎn)品的應(yīng)用創(chuàng)新,為視頻會(huì)議、網(wǎng)絡(luò)會(huì)議、電話(huà)會(huì)議、現(xiàn)場(chǎng)會(huì)議提供卓越精密的聲音技術(shù)方案服務(wù)和高度集成的一體化產(chǎn)品方案服務(wù),詳細(xì)資訊請(qǐng)?jiān)L問(wèn)朗谷科技網(wǎng)站:www.longoocn.com。