2021年1月18日 星期一 05:18

使用88.2kHz录音的三个原因

深入研讨 理论知识 使用88.2kHz录音的三个原因

#1 转换的过程简单

一般音乐听众听到的数字音频都是每秒44,100个采样的(44.1kHz)。如果这不是你的制作采样率,那么就有必要进行采样率的转换。采样率转换有两种方式,但是无论哪一种转换方式,只要采样源和目标采样率之间的公倍数越小,结果就会越好。

“同步”的采样率转换:

它是通过使用采样源和目标采样率之间的最小公倍数来建立一个临时的高采样率,然后将高采样率的数据向下转换(过滤)为低的目标采样率。用高采样率作为媒介,可以避免转换不均或者有残余数据存在。

如果原始素材是96kHz,要想减少到44.1kHz的话,必须先提高采样率到14.112MHz。这个过程包含了三个数字过滤的阶段,每一次过滤都成为了频率响应和整理延迟失真的潜在隐患。

如果原始素材是88.2kHz,或者是任何44.1kHz的倍数,那么就只需要一个阶段的过滤就能转换到44.1kHz了。不管你使用的滤波器质量如何,越少的过滤意味着越少的失真。

“不同步”的采样率转换:

它在转换过程中,降低采样率的阶段使用了单独的转换器和时钟。采样源和目标采样率之间的数学关系越简单,音质受损的可能性就越小,在这里仍然是一样的道理。比如,2:1就比160:147要简单,转换的损失也小。越少的计算,意味着越少的误差容许量。

#2 数字音频转换器的性能上限是20kHz

在Nika Aldrich周密详实的文章《Digital Audio Explained: for the Audio Engineer》中,他提醒我们,“我们听不到20kHz以上的频率。我们也听不到对20kHz以上音频作用的效果。”那么,使用高于44.1kHz的 采样率录音可能会有什么好处呢?

尽管确定的采样定理已经有了,但在现实中,奈奎斯特频率[注1]不得不建立在反锯齿滤波器(A/D转换)和重建滤波器(D/A转换)的性能上。虽然理论上存在完美的滤波器,但是现实中情况是不同的。
在现实中,我们的反锯齿和重建滤波器是不完美的,所以会导致混叠现象,瞬变环现象和高频相位偏移的现象。当音频频段接近这个限制,也就是奈奎斯特频率时,这些问题就会开始恶化。

88.2kHz的奈奎斯特频率是44.1kHz。这将滤波形成最糟糕的异常部分放在了超过人耳可听频率频段以上的地方。有影响的频段只存在于20kHz以下。使用88.2kHz采样的数字音频会比44.1kHz产生更少的混叠和相位失真现象。

顺便说一下,越高效的滤波器售价也越昂贵。所以,如果你拥有的并不是很高级的转换器,那么使用更高的采样率就会获得更好的效果。

#3 176.4kHz,数据量太大,优势不足

如果我们使用88.2kHz已经有很好的效果了,那么为什么不加倍,使用176.4kHz呢?

我们在音频上使用了88.2kHz,这样的好处是避免听到那些因为转换器性能的不完美而产生的糟糕部分。当我们已经听不到是不是有差异存在时,要想把结果变得更好就相对困难了。

而且不用想就知道176.4kHz的文件体积会大一倍。如果你经常在设备之间移动文件,上传到云存储空间或者管理大量的自动备份系统,显然这样做并不是明知之选。

应该注意的是,根据以上这些逻辑,如果转交给消费者的版本是48kHz的话,那么音频制作可以扩展到96kHz上去。

同时也要注意,现在有很多关于在44.1kHz下录音的解决方案可以采用。而我们在这里考虑的是一个工程问题,所以 重点是这些完美设计的方案之外会发生的事情。

我和James Gleick一起完成了文章《The Information: A History,A Theory,A Flood》。我得知了数字音频系统的理论基础是在1928年到1949年间建立起来的。而现在,争论这些理论应用导致的不完美结果已经成了一件很有意思 的事。

[注1]奈奎斯特率(Nyquist率)是离散信号系样频率的一半,因哈里·奈奎斯特(Harry Nyquist)或奈奎斯特-香定理得名。采定理指出,只要离散系的奈奎斯特率高于采信号的最高率或带宽,就可以避免混叠象。

有什么想对作者说?

avatar
  Subscribe  
提醒
Logic Loc
Logic Lochttp://www.logiclocmusic.com
乐极客创办人,独立音乐制作人,混音师。

说唱人声缩混技巧(1)

如果要我挑选被问到最多的问题是什么,那应该就是“我要怎么缩混说唱的人声?”或者诸如此类的问题。至少每周都会被问到一次。 我一周会缩混4到5个说唱人声——如果要计算同一首歌中不同的说唱歌手,那就更多了。我研究了一个捷径——类似于创造一个公式。事实上,我们知道每 首歌,每个人声,每次对声音的采集,以及演绎方式都是不同的。从来没有一个公式可以有效地用来处理所有的人声。但是有很多方式可以让我们对人声的处理形成 概念——我的这些也是其中之一。 概念 所有事物都得先有概念。我反复提到这一点,因为它不断被证明是对的。在你要处理声音之前,脑袋里应该有很多想法。这些想法可能在途中会发生很多变化,但你得让这些想法指引你怎么去做。 人们处理说唱人声最大的问题是他们总是考虑到这是“人声”,而不考虑这是“说唱”。从1994年纽约风格的说唱到2010年洛杉矶风格的说唱人声之前发生了很大的改变,这在说唱的历史上也是很普遍的现象。 比如你可以对比A Tribe Called Quest的《1nce Again》和LL Cool J的《Loungin》,都是慵懒舒适的说唱歌曲,但是混音上却完全不同。 《Loungin’》属于经典的Bad Boy风格,混音是Rich Travali做的。你可以从112,Mariah Carey和Biggie后期的音乐中听到相似的感觉。 《1nce Again》是Bob Power的主要作品——很能代表早起的纽约说唱。我希望你能对比这两首歌。 注意,在《Loungin’》中说唱部分在整体混音中相当突出——跟军鼓的电平一样——高频也很亮很平滑,清晰度很高,在中频之上有很开阔的细节表现。 而《1nce Again》中的人声位于军鼓下面,中频部分的人声很有冲击力。高频很有沙粒感,在低频部分使用了很陡峭的高通滤波器。声音的包络也是不同的—— 《Loungin》的压缩相对较轻,而《1nce Again》的压缩是很猛的(特别是Phife的声音)。让我们来看一个最近的例子——Nicki Minaj的《Massive Attack》。 人声本身和高音特别清晰,突出于整个混音之上,没有像《Loungin’》那么多得中低频。 这三个例子有一些特别的地方: 1.《1nce Again》中是很锐利,很猛的声音——代表了早起的纽约说唱。 2.《Loungin》的人声就很亲切,很平滑——接近R&B歌曲的处理。 3.《Massive Attack》有水晶般剔透的人声,留给低频的乐器大量的空间,在夜店播放效果应该是很好的。 重点是,要知道处理的原因和方式同等重要。艺人的听众是哪些人,艺人是什么风格,音乐主要在哪播放——这些才是作为工程师应该考虑的。 所以你决定要做什么了,那该怎么做呢? 清理 在混音之前,很多说唱的人声都需要清理。通常的问题是——人声并不是在理想的情况下录制的,比如在衣橱里或者浴室里。我知道这样听起来很奇怪。但是 有传言说在衣橱或者浴室录音是一个好的主意。但通常来讲不是的。另一个问题是,人声录制得太猛。又有传言说录制的信号越大越好。这实际上也是不对的,特别 是在24位音频的时代。 其实清理是很粗糙的——因为你能做的范围是很有限的。对于太猛的信号——用iZotope的Rx De-Clipper这种去除失真、削波的软件是很理想的。同样,失真会创造出频率中心的共鸣,你可以用EQ来去掉。 对于在有混响的空间录制的人声,加上些微门限,小心地调整EQ可以抑制房间的声音——或者你可以用像SPL...

寻找用于Remix的循环、人声和伴奏

在数字DJ软件中,DJ有多种创作工具:唱盘、效果和采样台(比如,Serato DJ的SP-6采样播放器或Traktor Pro 2的Remix Deck)。这些采样台可以载入用于Remix的单声采样、循环素材、伴奏和人声。今天,Ryan Dejaegher将与大家分享5个资源,涵盖采样、循环素材、伴奏和人声。

- 广告 -