隨著秒新月異的科技發展,各項技術成果不斷地應用在我們日益拓展的各領域需求當中,刷新著我們的生活和工作。地球村的崛起,不斷以互聯網、物聯網等方式揭示著萬物相連的關系。無論是飛機、高鐵還是電話、網絡,都成為托起地球新村時空縱橫的重要載體。怎樣拉近人與人之間的關系,如何建立起更行之有效的聯絡方式,提高遠程協同工作、信息傳達效率成為了一個重要命題。
遠程會議的出現在很大程度上為這種多極化辦公互動提供了優質的平臺保障,在借助互聯網便捷的遠程通信架構下,通訊數據安全,穩定可靠,很長一段時間廣受用戶青睞。
然而美中不足的是,這樣的(聲音)系統仍逃不出的還是自然聲學上的問題。有和業內朋友聊天中談到,今后的擴聲系統也許只保留兩級傳統裝置了,那就是聲電轉換和電聲轉換的拾音和還原。而正是這兩級客觀存在的物理聲學現象,造就了我們今天所討論的內容。
在遠程會議系統的終端(本地),為了實現多人互動、多人拾音等目的,系統聲音免不了被放大還原,而在諸如此類的放大系統中,僅為本地音箱能夠聽到遠端聲音,并能把本地拾音信號傳送到遠端而互通。
眾所周知,話筒在拾取到放大后的音箱信號后,再次回授、無限循環而產生反饋現象,而系統在均衡聲場后,該現象其實是可以得到明顯改觀的。但話筒的拾音靈敏度是不是可以無限大呢?不是,在足夠電平條件下,它始終會因拾取到具有相干性頻率相位關系的輸入信號而建立起回授。
上述嘯叫現象并不是本文重點,但它為我們討論接下來的話題提供了一個前提,那就是(同一個聲場環境中)話筒和音箱無論怎么擺都無法做到完全的隔離,更別說空間聲場條件有限的小中型會議室了。
在一套有擴聲、有拾音的遠程會議系統中,為了防止信號回授,我們通常會有意識地將遠端輸入信號不再路由給遠端輸出。然而無法抗拒的是,本地話筒因拾取到遠端傳送至本地擴聲的信號,仍可將聲音重新傳送至遠端。這也是一種回授,明顯的遠程回授現象可使得系統發生自激震蕩。
通過一個簡易的遠程音頻傳輸示意圖,能幫助我們更容易地理解聲音信號是怎樣的流向。也能夠更清楚地看到這里面可能存在的回授現象。
部分工程師在調試遠程會議系統時也許遇到過嘯叫,那可不一定是本地系統沒調好所造成的,你會發現,關掉終端一切非常正常。為什么絕大多數的遠程系統沒有嘯叫呢?這還得感謝您還不算非常優質的網絡。
我們常說,距離產生延時,而在模擬音頻大舉轉向數字音頻、網絡音頻的今天,網絡信號的延遲也為音頻領域賦予了新的現象,尤其應用在遠程會議這樣的音頻傳輸系統當中,它能將一次次回授剝離成一次次聽似回聲的現象,這就是網絡音頻回聲。
通常由A地發出的聲源A在幾乎不經過延遲處理的本地系統中,通過A地音箱擴聲;而其經過網絡終端編碼送向遠端時,除了考慮A地的上傳時間X,還得考慮B地的下載時間Y。在這樣一個架構在Internet網絡傳輸環境中的聲音,其到達B地擴聲音箱出來的信號則是A+X+Y。經B地本地話筒拾取后的該信號,再由B地的上傳網速(時間)Z、A地的下載時間W傳送回A地擴聲音箱,其表現出的信號則會出現一次A信號,及一次賦予了(X+Y+Z+W)時間的A信號。
假設A地—B地傳輸時間總和為200ms,B地—A地傳輸時間總和為200ms,則信號的一去一回,體現在A擴聲音箱中至少會存在A和A+400ms的信號,若反饋信號電平足夠強,則再被話筒拾取,這將不止產生一次的回聲,而是多次規律的回聲現象。
該圖片來源于Motivity產品DP處理器AEC調試界面
AEC即Acoustic Echo Cancellation(聲學回聲消除)技術簡稱,該技術的出現旨在消除這種因遠程網絡會議所帶來的回授現象,以遏制第一次回聲產生所需的必要條件來遏制多次回聲的出現。
為什么要費那么大周折去抑制回聲?這個話題應該不言而喻了。會議、語音擴聲最講究的即是STI語音清晰度(可懂度),而回聲是語言清晰度的最大殺手。設想踩腳跟式的語音信號傳達到耳朵,聽者難受,講者費勁,對于這樣的語音會議來說,那必將是一場災難。
我們把聲學回聲消除這個技術變成一張實體的插件(設備插卡),外掛在系統中,為實現第一次回聲過濾(過濾回聲源則過濾多次回聲)。這個技術應該插入在系統的哪個環節呢?我們不妨來找找系統中具備近乎相同/相似信號的一級進出環節。
通過上圖的分析,我們并不難發現一組具備相似信號的輸入輸出環節。而AEC技術認為,在這里對回聲下手是最治根的辦法!市面上有多種類的回聲消除器,也有部分抑制器,其算法和解決辦法各有不同,本文就不詳細闡釋了。須知,通過對具有相似性極高的輸入、輸出信號的比對,約掉這一具備相似信號的輸出,即切斷了回授的根源,A地將不再聽到回聲現象。
筆者也經常遇到有用戶因遠程會議本地有回聲而采購了帶有AEC回聲消除功能的處理器,拿回去安裝以后發現,沒任何作用?!這到底是為什么呢?不是廠家設備功能不實現,回觀上圖原理,答案自在其中。