中国的一级毛片_H无码精品3D动漫在线观看_9191久久_国产精品永久免费_亚洲精选一区_肉体裸体xxxxx免费观看

搜索新聞

讓視頻會議系統多一些人工智能!

來源:中計報 更新日期:2008-05-28 作者:pjtime資訊組

視頻會議設計需求

    網絡視頻會議中,人們都希望能實現發言人的特寫與其聲音同步的音視頻效果。那么,這一技術如何突破傳統的人工搜索方式,讓設備自己也能“尋聲辯人”呢?

  說話人的聲音不能被清楚地收音,會議雙方聽不到對方的聲音,產生回音或者斷續音現象從而使與會雙方無法互相理解……即使現在使用視頻會議系統時,我們仍常遇到這樣的問題。如何盡可能逼真地遠程再現會議環境的聲音和圖像,給人以身臨其境之感,一直是聲音處理領域的頭等課題。

  在視頻會議產品領域,中國產品重視視頻編解碼與聲音處理技術,歐美產品更著重軟硬件設備、管理套件以及與統一通信架構融合的研究,而日本的產品則堅持其一貫的技術分工精細的主張:索尼在顯示器領域深耕,雅馬哈則在音頻處理領域細作。

  日前,日本雅馬哈在中國推動PJP(Projectphone)網絡會議系列產品巡展,試圖為該領域引入另一種完全不同的技術解決思路。通過本報記者對日本雅馬哈株式會社Sound Network事業部長田丸卓也、雅馬哈中國網絡會議系列產品技術總監谷田的專訪,以下問題將得到解答:雅馬哈會采用哪些技術解決目前聲音傳輸的瑕疵,并輔助視頻功能?視頻會議中惱人的回聲與吞字現象如何得到解決?會議中重要的錄音功能,該如何設計?如何以人工智能的思路來設計網絡與視頻會議產品,最終使這一計算機科技成果貼近自然、符合人類習慣?

讓機器學會尋聲辨人

  據谷田介紹,如何將新型視頻會議系統擬人化,以貼近人工智能需求,是雅馬哈PJP系列倡導的最新網絡會議技術理念。這些理念將通過瞬間呈現技術、聲音非增幅音響設計、內置適應型回聲消除器等一系列技術得以體現。

  假如甲地和乙地一起舉行遠程視頻會議,甲地人員如何清楚確定乙地哪位與會者正在發言(視頻追蹤)十分重要。在處理這一問題上,思科、北電—寶利通采取的措施霸氣十足:打造一個30萬美元以上的網真會議室,租用超寬帶寬傳輸聲音和圖像,用超大電視墻1∶1地還原場景和參會者;而蘇州科達等國內企業的做法相對經濟實惠:用甲地員工手中的遙控器去控制乙地會議室攝像頭的轉動和焦距調節,尋找小顯示屏幕一次裝不下的參會者或給出特寫鏡頭。總體來說,這兩種做法都使用的是“尋聲辨人”的方式,但用的是人眼搜索。

  雅馬哈給這一問題增加了一條技術解決路徑,那就是使攝像頭學會尋聲辨人。谷田向記者介紹道:“不要忽略人類都是‘尋聲望去’這一聽覺的天性,在視頻會議系統中,視頻顯示與聲音的處理技術其實是密不可分的。以PJP-300V這款攝像頭、麥克風、揚聲器一體機為例,它可以實現說話人瞬間顯示的功能。即使使用普通液晶屏幕,會議發言人的特寫和聲音也能瞬間呈現。”這項技術的實現,依靠的是在PJP-300V上面配列16個麥克風陣列,可以自動判別說話人的位置;通過說話人的位置信息和3個攝像機的切換、聯動,使說話人可以瞬間在屏幕上顯示出來。這項技術不需要攝像頭的切換動作,保證了會議順暢進行。同時這項瞬間呈現技術,在桌面型VoIP電話中也可以應用,使音頻會議呈現立體感,實現與語話者座位的匹配。

回聲與吞字現象的消除

  聲音從會議系統的揚聲器中播放,又回到麥克風的時候,容易產生回音。會議過程中,異地雙方進行激烈的快語速交談時,往往會出現“吞字”的現象,即首句的末字與后句的首字會發生重疊和消音。當會議變成多地、多人同時發言的時候,這種情況將更糟。

  針對這些問題,谷田介紹了雅馬哈成功應用于產品中的基于參照人類講話方式設計的兩種技術。第一,使用適應型回聲消除器消除回音。什么是適應型回聲消除器?谷田解釋道,就是系統可以自動學習周圍音場環境和旋繞余音,并算出濾波系數,從而使用戶不必依房間類型選擇不同的產品,節省了重復購置產品的成本。第二,據點語音分隔模式可以幫助我們解決吞字的難題。雅馬哈PJP-100H形狀窄長,具有12個揚聲器和16個麥克風,沒有MCU時,最多可以連接8個據點的音頻會議。“在使用它進行多地點會議的時候,讓各地點的聲音從揚聲器的不同方向傳送至與會者,聲音不會混雜,不但能清楚地收聽,而且能簡單地識別出是哪個連接地點的發言。”

只收錄需要的聲音

  谷田表示,如何讓機器學會只錄取特定人和特定聲音是視頻會議音頻處理技術的重要研究方向,也是雅馬哈人工智能理念的體現。

  首先,在網絡或視頻會議進行的過程中,如果在開放空間或者有來自投影儀等雜音源的場所,如何識別音源的位置是對視頻會議產品與技術的一個挑戰。

  面對這個挑戰,雅馬哈采取的對策是,使會議用傳聲揚聲器可以根據場面的不同而采取不同的收音模式。該揚聲器中的麥克風陣列可以識別音源的位置,只收錄說話人的聲音,并清楚地傳達給對方。具體到具備了這樣功能的PJP-100H上,它擁有三種特定模式:第一,區域模式:最適合在安靜環境下的會議,在場所有人的聲音都可被錄入;第二,點式模式:可收錄特定方向上的聲音;第三:追蹤模式,設備可以自動追蹤發言人的聲音。

  其次,視頻會議系統通常會面臨出差員工從外地接入,參加會議這樣的情況,臨時會議錄音功能非常重要。市場上現有的產品一般的解決思路是靠一臺筆記本電腦、軟件外加耳麥,組成臨時的視頻會議端點。但是,長時間使用耳麥容易造成疲勞,也不利于兩位以上的出差員工同時參與。因此,雅馬哈研制了一系列輕巧、便于攜帶的Web會議用傳聲揚聲器,采用USB供電的方式,供連接筆記本電腦使用。

  針對此類產品,谷田如此描述他們的技術設計思路:這類小型揚聲器具備和個人電腦、音樂播放器連接,以增強其使用率;但更重要的是,不能忽略其傳聲和會議錄音的功能,只錄最需要的聲音。在一次對此類產品PJP-25UR的體驗中,記者一邊利用揚聲器大聲播放電腦中的音樂,同時利用揚聲器錄音現場的對話。最后播放錄音,里面只能聽到記者說話的聲音,完全沒有音樂等雜聲。田丸卓也表示,這是通過對揚聲器和軟件的設定實現的。

多終端自由接入會議

  在企業辦公自動化朝統一通信發展的大趨勢下,視頻會議應該要考慮到“無處不在”的接入特性。谷田告訴記者,多種多樣的連接終端可以使與會者成功應對各種場面,雅馬哈的設計理念是在產品中配置3個端口:LAN連接、模擬電話線、與PC連接的AUDIO(IN/OUT)。這一理念使得手機、固定電話、 PC、筆記本電腦都可穩定用聲音加入IP音頻會議、Web會議或者視頻會議系統。

  日本雅馬哈株式會社Sound Network事業部長田丸卓也:“寶利通在中國市場會出現一個新的競爭者——雅馬哈。”

  雅馬哈中國網絡會議系列產品技術總監谷田:“使會議系統更逼真地滿足人工智能需求,是網絡會議技術未來的發展方向。”

VoIP技術支持模塊

  為了在IP網絡中實現語音傳輸并保證一定的服務質量,基于IP的語音傳輸系統中通常包含有以下的技術支持模塊。

  信令模塊

  信令是順利實現電話呼叫和保證話音質量的重要技術前提,目前被廣泛接受的IP語音傳輸控制信令體系包括ITU-T的H.323系列和IETF的會話初始化協議SIP。

  編碼模塊

  話音壓縮編碼技術是IP語音傳輸技術的一個重要組成部分。目前,主要的編碼技術有ITU-T定義的G.729、G.723(G.723.1)等。

  QoS保障模塊

  IP語音傳輸業務的QoS保障技術是當前業界探討最多的話題,IETF建議了數種支持QoS的技術解決方案,主要有:綜合服務(Int-serv)/ 資源預留協議(RSVP)、區分服務(DiffServ)、多協議標簽交換(MPLS)、業務流量工程(Traffic Engineering)等。

廣告聯系:010-82755684 | 010-82755685 手機版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時代網 版權所有 關于投影時代 | 聯系我們 | 歡迎來稿 | 網站地圖
返回首頁 網友評論 返回頂部 建議反饋
快速評論
驗證碼: 看不清?點一下
發表評論
主站蜘蛛池模板: 国产亚洲v| 明星angelababy造梦视频 | 亚洲一区二区精品 | 欧美国产亚洲精品 | 乱子伦一区二区三区 | 欧美五月| 日韩精品免费在线观看 | jizz亚洲大全 | 亚洲国产精品无码成人片久久 | 一色屋精品视频在线观看免费 | 特黄一区二区 | 麻豆最新网址 | 国产高清免费 | 亚州一区二区三区 | 国产精品久久久久久久久久久久人四虎 | 国产成人亚洲综合a∨婷婷图片 | 乱人伦人妻精品一区二区 | 国产亚洲精品久久久久久动漫 | 精品日产一区二区三区视频怎么看 | 97色偷偷色噜噜狠狠爱网站97 | 精品国产自在现线看久久 | www.草逼.com | 欧美精品一区二区三区久久久 | 强壮的公次次弄得我高潮a片日本 | 一级黄色免费观看视频 | 91日韩精品久久久久身材苗条 | 曰本无码人妻丰满熟妇5g影院 | 亚洲在线视频一区 | 奶头和荫蒂添的好舒服囗交 | 欧美久久精品一级c片 | 亚洲跨种族黑人xxxxx | 午夜亚洲国产理论片无码片 | 中文字幕丰满乱子伦无码专区 | 精品深夜AV无码一区二区 | 国产精品久久久久7777婷婷 | 国产欧美一区二区精品性色超碰 | 亚洲日本韩国欧美云霸高清 | 日韩AV无码中文字幕 | 欧美成人性a片免费观看办公室 | 国产自啪精品视频网站丝袜 | 国产一级片一区 |