人声效果的精细处理 普及知识库 什么是VST、DX、 详细�0�3

如题所述

2010-07- 23 09:57 唱歌录音,通常获取两个音源:一个伴奏、一个麦克声。其中伴奏是大家都一样的,因此制作的效果好坏,主要体现在人声的效果处理上,这一篇文章主要探讨一下人声效果的处理。 对人声效果的处理,大多数人都是使用反复试探性调节的方法,以寻找音感效果最好的处理效果。此种调音方式的不足十分明显: (1)寻找一个理想的调音效果,需经多次假设和尝试,所以需要较长的时间。 (2)较好的调音效果常常是偶然遇到的,这对于调音规律的归纳总结没什么帮助,并且以后也不易再现。 (3)不同设备的各项固定参数和可调参数都不尽相同,因而使用某一设备的经验,通常都无法用于另一设备。 发展到目前的效果处理设备,用于改变音源音色的技术手段并不太多,其中比较常用的只有频率均衡、延时反馈、限幅失真等3 种基本方法,然而这些效果处理设备的不同参数组合所产生的音色则大相径庭。 效果处理器的参数设置可以有很多项,尤其是延时反馈,这种模拟混响效果参数的设置理论上可达几十项之多。当然这些专业性极强的参数,大多数人都难以理解,也不知道如何理解。因此,大部分效果处理设备都只设置一、二个可调参数,并且其可调范围也比较狭窄。这种调整简单的效果处理设备容许人们在上面进行尝试性调整,而不会出现太大的问题。但对于效果处理要求更为精细的调音场合,例如在多轨录音系统当中,则必须使用更为专业的效果处理设备,用以做出更为精细的效果处理。 频率均衡 很明显,频率均衡的分段越多,效果处理的精细程度也就越高。除了图示均衡,一般调音的均衡单元通常只有三四个频段,这显然满足不了精确处理音源的要求。为了能足够灵活的对人声进行任意的均衡处理,我们建议使用增益、频点和宽度都可调整的四段频率均衡。 多数频率均衡的可调参数只有增益一项,然而这并不意味着其他两项参数不存在,而且这两项参数为不可调的固定参数。当然这两项参数设置为可调也并非难事,但这些会增加设备的成本,并使其调整变得复杂化。所以增益、频点和宽度都可调整的参量均衡电路,通常只有在高档设备上才能见到。 实际上,增益、频点和宽度都是可调整的频率均衡,几乎不可能使用胡猜乱试的方法找出一个理想的音色。在这里我们必须研究音频信号的物理特性、技术参数以及他在人耳听感上的对应关系。 人声音源的频谱分布比较特殊,就其发音方式而言,他有三个部分:一个是由声带震动所产生的乐音,此部分的发音最为灵活,不同音高、不同发音方式所产生的频谱变化也很大;二是鼻腔的形状较为稳定,因而其共鸣所产生的谐音频谱分布变化不大;三是口腔气流在齿缝间的摩擦声,这种齿音与声带震动所产生的乐音基本无关。 频率均衡可以大致的将这三部分频谱分离出来。用语调节鼻音的频率段在 500Hz,以下均衡的中点频率一般在 80~150Hz,均衡带宽为 4 个倍频程。例如,可以将100Hz 定为频率均衡的中点,均衡曲线应从100~400Hz 平缓的过渡,均衡增益的调节范围可以为+10Db~-6dB。这里应提醒大家的是:进行此项调整的监听音箱不得使用低频发音很弱的小箱子,以避免鼻音被无意过分加重。 人声乐音的频谱随音调的变化也很大,所以调节乐音的均衡曲线应非常平缓,均衡的中点频率可在1000~3400Hz,均衡带宽为六个倍频程。此一频段控制着歌唱发音的明亮感,向上调节可温和地提升人声的亮度。然而如需降低人声的明亮度,情况就会更复杂一些。一般音感过分明亮的人声大多都是2500Hz 附近的频谱较强,这里我们可用均衡带宽为1/2 倍频程,均衡增益为-4dB 左右的均衡处理,在2500Hz 附近寻找一个效果最好的频点即可。 人声齿音的频谱分布在4kHz 以上。由于此频段亦包含部分乐音频谱,所以建议调节齿音的频段应为6~16KHz,均衡带宽为3 个倍频程,均衡中点频率一般在10~12KHz,均衡增益最大向上可调至+10Db;如需向下降低人声齿音的响度,则应使用均衡带宽为1/2 倍频程,均衡中点频率为6800Hz 的均衡处理,其均衡增益最低可向下降至-10Db。 由以上分析可以看出,对人声进行频率均衡处理时,为突出某一音感而进行的频段提升,都尽量使用曲线平缓的宽频带均衡。这是为了使人声鼻音、乐音、齿音三部分的频谱分布均匀连贯,以使其发音自然、顺畅。从理论上讲,应使人声在发任何音时,其响度都保持恒定。 为了在不破坏人生自然感的基础上对其进行特定效果的处理可以使用1/5 倍频程的均衡处理,具体有以下几种情形: (1)音感狭窄,缺乏厚度,可在800Hz 处使用1/5 倍频程的衰减处理,衰减的最大值可以在-3dB。 (2)卷舌齿音的音感尖啸,"嘘"音缺乏清澈感,可在2500Hz 处使用1/5 倍频程的衰减处理,衰减的最大值可以在-6Db。 对音源的均衡处理,最好是使用能显示均衡曲线的均衡器。一般数字调音台均衡器上的均衡增益调节钮用"G"来标识,均衡频率调节钮用"F"来标识,均衡带宽调节钮用"F"或"Q"来标识。 延时反馈 延时反馈是效果处理当中应用最为广泛,但也是最为复杂的方式。其中,混响、合唱、镶边、回声等效果,其基本处理方式都是延时反馈。 1、混响 混响效果主要是用于增加音源的融合感。自然音源的延时声阵列非常密集、复杂,所以模拟混响效果的程序也复杂多变。常见参数有以下几种: 混响时间:能逼真的模拟自然混响的数码混响器上都有一套复杂的程序,其上虽然有很多技术参数可调,然而对这些技术参数的调整都不会比原有的效果更为自然,尤其是混响时间。 高频滚降:此项参数用于模拟自然混响当中,空气对高频的吸收效应,以产生较为自然的混响效果。一般高频混降的可调范围为 0.1~1.0。此值较高时,混响效果也较接近自然混响;此值较低时,混响效果则较清澈。 扩散度:此项参数可调整混响声阵密度的增长速度,其可调范围为0~10,其值较高时,混响效果比较丰厚、温暖;其值较低时,混响效果则较空旷、冷僻。 预延时:自然混响声阵的建立都会延迟一段时间,预延时即为模拟次效应而设置。 声阵密度:此项参数可调整声阵的密度,其值较高时,混响效果较为温暖,但有明显的声染色;其值较低时,混响效果较深邃,切声染色也较弱。 频率调制:这是一项技术性的参数,因为电子混响的声阵密度比自然混响稀疏,为了使混响的声音比较平滑、连贯,需要对混响声阵列的延时时间进行调制。此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。 调治深度:指上述调频电路的调治深度。 混响类型:不同房间的自然混响声阵列差别也较大,而这种差别也不是一两项参数就能表现的。在数码混响器当中,不同的自然混响需要不同的程序。其可选项一般有小厅(S-Hall)、大厅(L-Hall)、房间(Room)、随机(Random)、反混响(Reverse)、钢板(Plate)、弹簧(Sprirg)等。其中小厅、大厅房间混响属自然混响效果;钢板、弹簧混响则可以模拟早期机械式混响的处理效果。 房间尺寸:这是为了配合自然混响效果而设置的,很容易理解。 房间活跃度:活跃度,就是一个房间的混响强度,他与房间墙面吸声特性有关,此项参数即用于调节此特性。 早期反射声与混响声的平衡:混响的早期反射声与其处理效果特性关系密切,而混响声阵的音感则不那么变化多端,所以数码混响器的这两部分的生成是分开的,本参数就是用于调整早期反射声与混响声阵之间响度平衡。 早期反射声与混响声的延时时间:即早期反射声与混响声阵之间的延时时间控制。此时间较长,混响效果的前段就较清澈;此时间较短,早期反射声与混响声就会重叠在一起,混响效果的前段就较浑浊。 除以上可调参数之外,混响效果还有一些其他附属参数,例如低通滤波、高通滤波、直达/混响声的响度平衡控制等。 2、延时 延时就是将音源延迟一段时间后,再欲播放的效果处理。依其延迟时间的不同,可分别产生合唱、镶边、回音等效果。 当延迟时间在3~35ms 之间时人耳感觉不到滞后音的存在,并且他与原音源叠加后,会因其相位干涉而产生"梳状滤波"效应,这就是镶边效果。如果延迟时间在50ms 以上时,其延迟音就清晰可辨,此时的处理效果才是回音。回音处理一般都是用于产生简单的混响效果。 延时、合唱、镶边、回音等效果的可调参数都差不多,具体有以下几项: *延时时间(Dly),即主延时电路的延时时间调整。 *反馈增益(FBGain),即延时反馈的增益控制。 *反馈高频比(HiRatio),即反馈回路上的高频衰减控制。 *调制频率(Freq),指主延时的调频周期。 *调制深度(Depth),指上述调频电路的调制深度。 *高频增益(HF),指高频均衡控制。 *预延时(IniDly),指主延时电路预延时时间调整。 *均衡频率(EQF),这里的频率均衡用于音色调整,此为均衡的中点频率选择。 由于延时产生的效果都比较复杂多变,如果不是效果处理专家,建议使用设备提供的预置参数,因为这些预置参数给出的处理效果一般都比较好。 声激励 对音源信号进行浅度的限幅处理,音响便会产生一种类似"饱和"的音感效果从而使其发音在不提高其实际响度的基础上有响度增大的效果。 一些数码效果器上也配有非线性饱和效果,他就是对信号的振幅处理,模拟大电瓶信号在三极管上的饱和所引起的非线性,从而产生出"发硬"的音感效果。 由于限幅失真所引起的主要是产生额外的高次谐波成分,因而新设计的激励器,为了使其处理效果柔和一些,都是通过在音源中家置高次载波成分来模拟限幅失真,营造不那么"嘶哑"的声激励效果。 另外,通过一个用于加强高次谐波的高通滤波器对原信号进行处理,然后再叠加在经延时的原信号上,可以营造出音头清澈的声效果。显然、这种处理方式可以产生出不那么嘈杂的激励处理。 激励处理类似于音响设备的过载失真,因而对音源的过量激励,会产生令人不悦的嘈杂感。由于早期音响设备的保真度都不高,人们已经习惯了那种稍显嘈杂的音响,而对于音感清洁的高保真度音响,反而不太习惯,感觉其发音过分柔弱。在人声音源当中,除了一少部分经过专门训练的人之外,大部分的发言都缺乏劲度,因而这里的激励处理是十分必要的。 对人声的激励处理有下面几种情形: (1)对人声乐音的激励处理,其频谱分布以2500Hz 为中点。此种激励的效果比较自然舒适、对增加音源突出感的作用也比较明显。 (2)对人声鼻音的激励处理,其频谱分布以500Hz 为中点。此种激励可以有效地增大人声的劲度感。 (3)对人声800Hz 附近进行激励,可以增加音源的喧嚣感,当然此处理方式的使用应十分谨慎,最好是只用于摇滚乐的演唱。 (4)对人声3500-6800Hz 范围内的频谱,不宜使用激励处理,因为它容易使音源产生令人不悦的嘈杂声响。 (5)对人声的齿音一般应避免使用激励处理,因为此频段的失真很容易被人察觉。当然如果是使用激励效果比较柔和的数字式激励器,也可以对齿音做轻微的激励处理,以用于加重齿音的清析感。其处理的频谱应在7200Hz 以上。 歌唱发音的激励处理通常要保守一些。在实际的调音当中,激励处理的音感效果有可能随长时间的听音而逐渐弱化,所以在调节激励效果时,时间不要超过10 分钟。 对人声音源的激励处理,最好是使用数码效果处理器。它通常有以下几项调整参量: 1.输入增益(Gmn),用于调节输入电平,注意此处切勿使设备产生过载。 2.调谐频率(Tuning),根据需要处理的频段,选择一个合适的频率。 3.驱动电平(Drive),用于调整激励的深度。驱动电平较大时,效果比较嘈杂;驱动电平较小时,效果则比较温和。 4.混合比率(Mix),即原信号与效果信号的响度比。 效果处理的整体规划 对人声音源的精细处理,需要使用1 台全数字式调音台,至少3 台数字式效果器和一台数字式激励器。 首先在调音台上,使用通道均衡控制单元对人声进行音色调整,以使其音感得以改善,这里给出几个常用的例子。 (1)8OOHz 附近的频段可使人产生某种厌烦感,因而是可在此频段予以最大为15dB 的衰减,频带宽度为1/5 倍频程,用于改善人声发音的总印象; (2)68O0Hz 附近的频段可使人声产生尖啸、刺耳的感觉,可在此频段予以最大为10dB 的衰减,频带宽度为l/5 倍频程,用以减弱齿音的尖啸感; (3)对于发音过亮、有炸耳棍子的感觉者,可在3400Hz 处予以最大为8dB 的衰减,频带宽度为1/3 倍频程; (4)对于鼻音过重者,可在500Hz 以下频段适当衰减,衰减带宽为3 倍频程; (5)齿音的超高频段由于受人耳灵敏度的影响,需对12KHz 处提升6dB(频带宽度为2 倍频程),其响度才能与人声的乐音平衡。 以上均衡处理较适用于现场扩音,如果是多轨录音或节目转发,则应将增益的调节量减半。 均衡调好之后,再调节激励器。先将激励器的驱动电平和混频电平调至最大状态,频率调谐放在2500Hz,此时如果其发音已显嘈杂,或音色过硬,可将驱动电平调低,应注意这种调整有变化的是音源的硬度。如果驱动电平调在较高的位置,而只将混频电平调低,则高硬度声响的音响保持不变,但它会被未经激励处理的原声略微掩盖。此一现象在激励深度很强时比较明显,其中前一种发音给人的听感就是原声,后一种则可产生出两层声音,它具有增加人声层次感的效果。 一般1 台激励器只能处理一个频段,并且很多单一功能激励器的连接都要求不能并联,只能串联。如需对音源的多个频段加激励,这里建议在附图所示的设备连接当中,混响器应选用含有激励处理的多重效果器(如 YAMAHASPX990),此时就可以用激励器处理500Hz、800Hz 和7200Hz 频段,用混响器上的激励功能处理2500Hz 频段。 再次提醒大家的是,激励处理的调整时间不能太长,以免人耳疲劳后,无法准确辨认激励的程度是否合适。 最后就是调整混响效果。这里的混响效果包含两个方面,一个是基础润饰,另一个是强染色。 混响处理的基础润饰,主要是为了增加音源的融和性,但又不能让人听出有房间残响。此处的混响处理的强染色效果,主要是用于为音源生成余音缭绕渲染性,其处理方式有以下3 种情形: (1)生成空间感。使用厅堂或房间混响效果。模拟余音明显的自然混响效果,是混响处理简单而又有效的方式,对此效果通道上 3500Hz 附近的频段稍作提升,可以产生穿透感良好的高亮度声响。当然,也有一个缺点,即处理的效果比较浑浊,有时带有一种"闷罐"声响。 (2)生成回音。长延时时间的延时反馈处理,可以模拟山谷回音效果;处理的延时时间一般都与演唱歌曲的节奏合拍。为使其效果更具有遥远感,可对其 1600Hz 以下和3800Hz 以上的频段适量衰减。模拟山谷回音效果,很多数码效果处理器上都有现成的程序可供使用。 (3)生成融和的声背景。余音缭绕的混响效果对人声音源的美化作用非常有效,几乎所有的人声演唱都要使用混响。在不导致其发音变浑,或引起"闷罐" 声的前提下,我们认为混响效果越强越好,但实际常常是混响效果还很弱时,其发音已经变浑,并引起明显的"闷罐"声。 为了在不导致其发音变浑,或引起"闷罐"声的前提下,生成融和的声背景。下面推荐如下效果处理方式,即延时一混响串联处理方式。此种处理的延时时间一般为200-600ms,反馈增益40%-60%,混响使用大厅混响效果,混响时间为 2-8s。串联处理后的混响效果要求平滑、连贯。如果处理后的声响音头毕露,则可作如下调整,一是缩短延时时间,二是增加混响的响度,三是增大混响的时间。 混响处理的强染色效果,一般都应在基础润饰的前提下进行,这样强染色处理就可以弱一些。 == ·VST VST 是Virtual Studio Technology 的缩写,他是基于Steinberg 的软件效果器技术,基本上以插件的形式存在,可以运行在当今大部分的专业音乐软件上,在支持ASIO 驱动的硬件平台下能够以较低的延迟提供非常高品质的效果处理。要达到VST 的最佳效果(也就是延迟很低的情况),声卡要支持 ASIO。 VST 效果器覆盖了几乎所有音乐制作里用到的效果器,而且由于VST 技术的开放性,很多大厂商,小厂商,甚至是个人开发了数不清的VST 效果器,有些是相当成功相当实用的效果器,连好莱坞的电影制作中都用到了这些VST 插件提供的顶级效果。目前国内大部分的商业录音棚使用的后期混缩、母带处理效果器大多是VST 效果器。 能够使用这些VST 插件的音乐软件我们称为VST 宿主,常用的有 Samplitude(7.0 以后的版本),Cubase VST32,Cubase SX,Nuendo,Wave Lab, FruityLoops,Orion,Project5,Audition 等等。VST 效果器都是来处理音频的,所以都要加载在音频轨中使用,MIDI 轨不能使用VST 效果器。 ·DX DX 是DirectX 的缩写,他是基于微软的DirectX 接口技术的软件效果器技术,基本上以插件的形式存在,可以运行在当今99%的PC 专业音乐软件上(毫不夸张),在支持WDM 驱动的硬件平台下能够以较低的延迟提供非常高品质的效果处理。 DX 效果器覆盖了几乎所有音乐制作里用到的效果器,而且由于DirectX 技术的开放性,很多大厂商,小厂商,甚至是个人开发了数不清的DX 效果器,有些是相当成功相当实用的效果器,连好莱坞的电影制作中都用到了这些DX 插件提供的顶级效果。 能够使用这些DX 插件的音乐软件我们称为DX 宿主,DX 宿主比任何其他类型插件的宿主都要多(前面说了要有99%),常用的有Samplitude,Cubase, Sound Forge,Wave Lab,SONAR,Cakewalk,FruityLoops,Orion 等等。DX 效果器都是来处理音频的,所以都要加载在音频轨中使用,MIDI 轨不能使用DX 效果器。 ·VSTi VSTi 是Virtual Studio Technology Instruments 的缩写,他是基于Steinberg 的虚拟乐器技术,基本上以插件的形式存在,可以运行在当今大部分的专业音乐软件上,在支持ASIO 驱动的硬件平台下能够以较低的延迟提供非常高品质的效果处理。要达到VSTi 的最佳效果(也就是延迟很低的情况),声卡要支持ASIO。 VSTi 软合成器与VST 效果器不同,他是控制MIDI 轨的,每个VSTi 插件都为你提供了很多的音色,以及丰富的参数控制让你自己创造出独一无二的音色。不同的 VSTi 有着不同的音色合成方法,波表合成器,模拟合成器,FM 合成器, VSTi 都可以胜任。 能够使用这些VSTi 插件的音乐软件我们称为VSTi 宿主,常用的有 Samplitude(7.0 以后的版本),Cubase VST32,Cubase SX,FruityLoops, Orion,Project5 等等。VSTi 虚拟乐器可以看作是软音源,所以只能加载在 MIDI 轨上。 ·DXi DXi 是DirectX Instrument 的缩写,是Cakewalk 公司在DirectX 基础上独立开发的软合成器技术,基本上也以插件形式存在,现在只能运行在 SONAR 上(注意:Cakewalk 不支持DXi,Cakewalk 到9.0 就停产了,取而代之的是SONAR),在支持WDM 驱动的硬件平台下能够以较低的延迟提供非常高品质的合成音色。 DXi 软合成器与DX 效果器不同,他是控制MIDI 轨的,每个DXi 插件都为你提供了很多的音色,以及丰富的参数控制让你自己创造出独一无二的音色。不同的DXi 有着不同的音色合成方法,波表合成器,模拟合成器,FM 合成器, DXi 都可以胜任。
温馨提示:答案为网友推荐,仅供参考