2021年1月20日 星期三 20:08

理解采样间峰值

深入研讨 理论知识 理解采样间峰值

采样间峰值是D/A转换过程中的一个现象,即重建滤波器制造出的超过0dBFS的信号电平。
采样间峰值是D/A转换过程中的一个现象,即重建滤波器制造出的超过0dBFS的信号电平。

采样间峰值现象是困扰新手母带工程师的一个问题。许多发烧友坚持认为这是所谓的响度战争导致的,我们本可以完全避免这种形式的失真。而另一些人则认为,采样间峰值是一个很少见的现象,根本不值得关注。

那么,采样间峰值究竟是什么呢?是否值得我们去关注呢?

感受峰

要理解采样间峰值的含义,我们需要深入理解数字领域的信号电平,尤其是数字到模拟的转换过程。众所周知,数字领域的信号电平是以连续的数字表示的,最响的录制信号是0dBFS(0dB Full Scale)。在数字领域中,当信号以超过0dBFS的电平进行录制时,波形中超过0dBFS的采样将被“削掉”。当然,大部分的数字录音都会留有充足的动态余量——所有工程师都害怕碰到“数字用尽”的窘境。

MP3转换处理也会在峰值信号中引入糟糕的失真,而Sonnox推出的Pro-Codec可以预防这些问题的发生。
MP3转换处理也会在峰值信号中引入糟糕的失真,而Sonnox推出的Pro-Codec可以预防这些问题的发生。

在混音和母带处理阶段,工程师们很容易将最终的信号增加到0dBFS。现代音乐中大部分的响度都来自激进的砖墙限制。它将峰值作为处理目标,让母带冲到0dBFS,但同时又不让听众听到削波的发生。在这个电平就是一切的世界里,这种处理方式完全能够理解。你得确保自己的歌曲更响,至少,是与竞争者一样的。但是,在我们将峰值表挤压到0dBFS的时候,是否考虑到了音频的质量?

过还是超越

之所以将母带处理到0dBFS,完全是因为我们假设数字信号电平是一个绝对值——换句话说,就是任何东西都不能超过0dBFS。在我们设置好最终混音或母带的电平后,还有一系列的信号路径需要考虑。我们无法直接听到数字音频,所以每一段数字音乐都需要转换为模拟信号,这样才能被听到。作为这个转换过程的一部分,数模转换器采用了一类重建滤波器——将步进式的数字波形通过插值法制造成平滑的最终输出。

作为插值处理的一部分,重建滤波器会在最终的输出电平上制造一点细微的差异。当然,对于大部分的动态范围来说,这些小的电平变化根本不值一提。但在接近0dBFS的信号上,这些小小的电平变化就会造成问题。在这里,不同级别的转换器和电子元件存在的问题程度不同。发烧级的D/A转换器能提供这些动态余量,但廉价的CD播放器则没有动态余量来容纳这些采样间的峰值。简单来说,就是在录音室中,你的混音听起来没有失真,但可能会在廉价的hi-fi设备上发生峰值削波。

当混音经过“激进”的母带处理并转换成有损的音频编码,如MP3时,会发生什么变化呢?虽然这不是采样间峰值问题的一部分,但也值得注意。为了让数据按照指定数量进行衰减,许多编码应用了各种形式的滤波来减少音频信息,有损的编码通常应用着严酷的滤波处理。与D/A转换处理阶段中的重建滤波器一样,编码滤波也会在未压缩的原始音频文件与数据压缩后的版本间制造出一定程度的电平差异。正如你所预见的,数据压缩的程度越大,音频就越容易出现失真。

Ozone的Maximizer通过对转换后可能存在的峰值电平做出预估来避免采样间峰值的出现。
Ozone的Maximizer通过对转换后可能存在的峰值电平做出预估来避免采样间峰值的出现。

值处理

认识了采样间峰值背后的问题和缘由,那有什么实际的措施可以用来避免它们呢?当然,最直观的解决方案就是在母带的峰值电平和0dBFS之间留出一定程度的动态余量。问题就是这些建议措施之间也存在差异,有的发烧友坚持认为-3dBFS是唯一安全的峰值电平,而另外一些则理所当然地将母带电平做到了-0.3dBFS。问题是,在CD播放器和DAC之间有太多的类型,这个恰当的安全空间很难去定义。而且,我们还没有考虑音乐本身的动态和音色的品质呈现。

另外,还有一个解决采样间峰值的简单办法,就是使用改良的数表,比如在SSL的X-ISM(www.solidstatelogic.com);或者,数据压缩失真方面,使用Sonnox的Pro-Codec(www.sonnoxplugins.com)。以X-ISM插件为例,数字有限脉冲响应(FIR)滤波器被用来模拟D/A转换中典型的插值处理,处理后的音频将进入一个“模拟的”采样间削波指示器。理论上讲,这个数表会在采样间峰值可能发生的时候进行指示(当然,它的结果不是绝对的),以便你更好地设置最终的动态余量。

SSL的X-ISM插件模拟了D/A重建滤波器的行为,指示了采样内峰值可能出现的位置。
SSL的X-ISM插件模拟了D/A重建滤波器的行为,能指示出采样间峰值可能出现的位置。

最大动态余量

因为能够实时地进行编码,所以Sonnox的Pro-Codec可以在最终文件渲染完成之前,识别出任何不需要的峰值失真。当然,以数据压缩为例,你可以通过增加动态余量或改变数据压缩量(比特率越高,失真越少)来减少不必要的失真。不过,使用之前提到的X-ISM插件,你可以在动态余量的设定上做出更加明智的决定,避免日后出现问题。

除了提升动态余量和使用高级数表外,你也许会对一些“采样间”产品感兴趣。比如,iZotope的Ozone,在它的Maximizer控制中就包括了采样间探测(Intersample Detection)模式。当你激活采样间探测模式时,Ozone的Maximizer能有效地根据D/A转换后的电平(而不是当前数字采样的电平)来应用砖墙限制。简单来说,这是一种基于最终信号电平的智能限制形式,能够有效地回避采样间峰值,获得最大的响度。

呼吸空

采样间峰值的问题是响度战争中不可避免的产物,也是音乐行业缺乏规则和标准的表现。在很大程度上,我们可以用-3dBFS的峰值电平来解决采样间峰值的问题,像其他行业,如电影、电视广播,都有对最终信号电平和响度标准的严格限定。不过,音乐行业的散漫态度让响度战争愈演愈烈,音频品质被人抛至一边。当然,最讽刺的事就是,人们根本不在乎峰值电平,因为响度的主要依据是表示平均值的RMS电平。

当越来越多的工程师、音乐人和听众开始理解采样间峰值现象时,我们就更容易认真地去考虑音乐的品质。行业驱使的举措,比如“Mastered for iTunes”,便是行业人对响度和数据压缩问题的一些反思。因此,在未来,应该会有更少失真,更高比特率的标准出现,那时候,采样间峰值就将成为历史。

以下视频是来自Fabfilter的专家对采用间峰值的解释和探索:

原文地址:MusicTech

有什么想对作者说?

avatar
  Subscribe  
提醒
Logic Loc
Logic Lochttp://www.logiclocmusic.com
乐极客创办人,独立音乐制作人,混音师。

评测:Superlux HD661

秉承着HD系列的特质,HD661在声音和价格上的优势依然稳固。

AudioEase发布:360pan

如果你需要为YouTube的360°全景视频制作音频,那么你需要细致地处理影片中物体的声像。

免费插件:La Petite Excite

Fine Cut Bodies发布了一款免费的激励器插件,据说,可以让你的音乐拥有崭新的面貌。
- 广告 -