人与人之间的交流58%通过视觉,35%通过听觉,7%通过语言来实现。可见,清晰的声音对于有效沟通的重要性。视频会议是视频和音频实时、双向完整通信的过程。在这个过程中,我们在强调高清晰视频图像实时连续传输的同时,往往容易忽略另一个同等重要的??音频通信效果。
首先,我们应该知道,人的耳朵所能感知的自然界的频响能力范围是20Hz~20KHz,人的声音一般在100Hz~17KHz之间。为了保证与会者听到远端发言者的全频段声音,视频会议系统必须能够提供14KHz"接近CD音质"的音频质量,即必须回放至少7KHz的音频。否则,一些音频信息会在对现场环境音的还原过程中丢失,造成声音失真的情况。
但,目前我们常看到的一些视频会议设备主要采用G.711、G.722、G.722.1等音频标准,其音频宽度仅有50Hz-7KHz单声道。 在传统的视频会议系统中音频技术发展极其缓慢,原因在于目前应用于视频通信的音频编解码压缩标准都是为了保持传输时的低带宽占用和较高的编解码效率,从而将音频信号的采样频率、采样精度和采样范围指标做了极大的降低,使得所能提供的音频清晰度和还原性都有很大程度上的衰减,使现场声音的还原达不到要求。
优势1
音频频响范围达到22KHz,覆盖了人耳听觉的全部范围,使现场音频得到真实自然的还原,并且在还原时可以采用双声道立体声回放,使整个视频通信的声音有更强的临近感,达到CD级环绕立体声StereoSurround音质,使会议的语音犹如水晶般清澈。同时,在对链路带宽的适应和编解码效率上也达到最佳的效果。
环绕立体声音所产生的声场,不仅让人感受到音源的方向感,且伴有一种被声音所围绕所包围以及声源向四周远离扩散的感觉。环绕立体声增强了声音的纵深感、临场感和空间感,使视听者不仅能够感受来自前、后、左、右的声源发出的声音,而且感受到自己周围的整个空间,都被这些声源所产生的空间声场所包围,从而营造出一种置身于歌厅、影剧院的音响效果。
2005年3月,ITU将原先POLYCOM专为可扩展的宽带音频解决方案而设计的Siren14TM算法,定义成新的ITU音频算法--G.722.1 Annex C。G.722.1 Annex C能在24Kbps~48Kbps(24Kbps至64Kbps为目前视频会议中音频通信的通用带宽)带宽上实现14KHz音频质量,结合回音消除技术,可以使本地和远端的通话者尽享同时发言的自然交流方式,而不会损失信号。与其他音频算法相比,在较低的网速下,G.722.1 Annex C能够提供比MPEG4-AAC更流畅、更出色的音质。
Wainhouse Research在高清视频会议系统评测报告中写到"通过Polycom的Siren22TM协议发送的音频相当出色,提供了被我们称之为"剧场"级别的体验。"
优势2
POLYCOM是目前业内唯一提供的360度全向MIC的厂家,POLYCOM的MIC其实是3个小MIC的集合阵列,在MIC的每个角均内置了1个小型MIC,360度的采集范围是由这个小MIC阵列实现的。麦克风独特的抗电磁干扰功能,即使附近有手机电磁波的干扰,仍然能够保障会议语音的正常采集功能。
由于POLYCOM采用的是独特的MIC阵列技术,因此是目前唯一可以实现高品质立体声会议的厂家。仅在使用1个MIC的情况下就可以实现不同发言人的立体声效果,大大的增强了会议的临场感和亲切感,降低开会时的疲劳感。