这是一篇来自于izotope的文章,作者是Chris Wainwright. 虽然原文目的是推荐他们的软件Neutron,但内容上却实打实的阐释了人声均衡中非常核心的要素与解决思路,因此我们完全可以除开关于Neutron的介绍部分,只吸收对于我们有用的部分。原文链接 目前文章还是机翻, 但我也不断的勘误中...
通过更好地了解人声频率、分析人声录音和发现人声的最佳 EQ 设置,了解如何对人声进行 EQ 设置。
可以说,虽然相似,但没有两个相同的乐器是完全相同的。特别是,不同歌手之间的人声就像雪花或指纹一样独一无二。出于这个原因,对于如何用 EQ 塑造人声,没有一个放之四海而皆准的解决方案。但是,有一些通用的概念和久经考验的真实技术可以让您朝着正确的方向前进,并通过一些练习让您走上成功之路。
在本文中,我将重点介绍评估人声录音时的重要考虑因素,并指导您逐步完成如何均衡人声以获得这些结果的过程:
音高和基本人声频率范围
在我们深入研究人声均衡之前,首先要了解一下人声以及它在可听频谱中的位置,对于人类来说,这个频谱是 20 Hz 到 20 kHz。
根据古典音乐中定义的音域,有六种声乐类型。这些分为男低音Bass、男中音Baritone、男高音Tenor、女中音Alto、女次高音Mezzo Soprano和女高音Soprano几个类别。
下图说明了每种人声类型相对于相对音符音高的基本频率范围。
任何音高的基频也可以称为一次谐波。如果只产生这个频率,它听起来会像纯正弦波。
然而,人类的声音远比这复杂得多。我们识别为人声的最终音色Timbre(音调特征tonal character)是基频及其所有高频谐波和泛音的组合。通过均衡 (EQ) 来操纵这些高谐波和泛音的振幅,使我们能够塑造或重塑录制人声的整体音调特性。
分析人声录音:调、旋律和泛音
在评估人声录音时,了解歌曲的音高和演唱旋律的音符范围可以帮助我们了解在作品的背景下可能更能引起共鸣,或者只是更具音乐性的某些频率。
这是一首主歌、副歌和副歌再现的简短样本。
如果我们分析这段音乐,我们会发现以下内容:
歌曲调式为D大调,调性音符为“D”。
按部分划分的人声旋律范围是这样的:
主歌:D3-A4
副歌:D3–D4
副歌再现:F#3–G3
如果我们知道这首歌的强音是“D”,那么我们就知道代表音符“D”的任何八度音阶的任何频率都可能在人声录音中很突出。
此外,如果我们看一下音符的第 3 次和第 5 次和声,“D3”,这是旋律的最低值,我们会看到完美的 5 度和大 3 度的出现,在 Dmaj 的调中,它们分别是“A”和“F#”。
这告诉我们,任何代表音符“A”和“F#”的八度音阶的频率也可能在人声录音中很突出。
一次谐波(基波)= D3,147 Hz(强音)
二次谐波 = D4,294 Hz(第一倍频程)
三次谐波 = A4,440 Hz(完美的 5 次谐波,加上 1 个倍频程)
第四次谐波 = D5,587 Hz(第 2 次倍频程)
五次谐波 = F#5,740 Hz(大三度,加 2 个八度音阶)
简而言之,这意味着任何代表调性、大调 3 度或完美 5 度的频率都具有提升或削减的潜在频率。
通过使用 iZotope Neutron 的 EQ 模块中的频谱分析器并捕获正在唱的音符“D3”的屏幕截图,我能够直观地演示这一点。
为了找到 20 Hz–20 kHz 范围内任何音符的频率,我创建了一个图表,以便快速轻松地参考。
Neutron EQ 不仅向您显示您当前正在提升或削减的频率,而且还向您显示该频率的相对音符音高。
与人声相关的音调特征
现在我们已经介绍了如何使用歌曲调高、旋律和音高来找到人声录音中潜在的共振或音乐频率,让我们来看看不同的频率如何影响人声的音调。
在下面的图表中,我根据 EQ 人声图表中与人声相关的音调特性对某些频率范围进行了分类。
我还添加了代表 Dmaj 键的 1 次谐波、3 次谐波和 5 次谐波的所有频率,这是我们音频示例的键。在这样做的过程中,我基本上创建了一个 EQ 人声速查表。
请记住,使用此技术来精确定位特定频率仅供参考。每个声音都不同,每个录音都不同,每个目标都不同。
然而,以这种方式分析一段音乐的能力,当与“提升和扫描”方法(我稍后将解释)相结合时,并拥有良好的聆听环境,是一个非常强大的起点。
让我们开始吧!
如何均衡人声
除了通过电平平衡和声像创建有影响力的音乐组合外,EQ 还是我们下一个最强大的工具。与允许我们增加或减少整个信号音量的电平不同,人声的 EQ 设置允许我们增加或减少信号中特定频率范围的音量,从而允许我们改变其整体音调特性。
使用 EQ,我们可以使人声更暗或更亮、更流畅或更清脆、沉闷或闪亮轻盈,或您能想到的任何其他创意特征。
在接下来的步骤中,我们将处理原始音频示例的诗句,该示例由 D maj 调中的男声组成。
1. 去除不需要的低端 (1 Hz–100 Hz)
在人声录音中,低于 80 Hz 的通常是低频房间隆隆声、麦克风处理噪音、来自意外来源的麦克风渗音或固有设备噪音。
它可能并不总是可以听到,但如果不加以检查,当与其他信号结合时,此频率范围内的任何音频信息都会累积起来,从而可能会混淆整个混音的低端,甚至减少主总线的整体动态余量。
出于这个原因,在处理人声时,我做的第一件事就是使用具有陡峭斜率 (Q) 的 HPF(高通滤波器),并从 50-100 Hz 及以下的任何地方删除所有内容。
为了找到正确的频率,一个好的经验法则是从 20 Hz 开始使用 HPF,慢慢地将其向上移动到频谱,直到它开始影响人声,然后稍微后退一点。
对于我们的示例录音,我将 HPF 设置为 90Hz,每倍频程的斜率 (Q) 为 48 dB。
由于很少有人声生活在 90 Hz 以下,因此差异将非常微妙。更有可能的是,您注意到底鼓的低端现在更加集中,而没有人声录音中可能与之相冲突的任何低频隆隆声被掩盖。同样,这听起来可能不多,但是当您有多层人声双声、三重音、和声等时,它可以加起来。
2. 平衡身体和温暖 (100 Hz–400 Hz)
人声的基本频率通常在 100 到 400 Hz 之间。这就是人声的主体和温暖生活的地方。
这个频率范围太大,人声会听起来很嗡嗡作响,缺乏清晰度,并可能使混音的低端变得混乱。这个频率范围太小,人声听起来会变得单薄和微弱。
在我们的示例中,录音是在 100–400 Hz 频率范围内的触摸嗡嗡声。
参考我们之前的分析,我们知道,在此范围内,代表音符 D、F# 或 A 的任何频率都是可能增强或削减的频率。但是,我们也必须使用我们的耳朵。
为了找到任何过度谐振或麻烦的频率,一种常见的技术是“增强和扫描”方法。这是通过使用“钟形滤波器”提高任何频率来实现的,通常具有中等到紧密的 Q,然后将其扫描到整个频谱中,直到过度谐振或麻烦的频率显现出来。
一旦被发现,就在这个频率上进行均衡器削减。
使用 Neutron 的 EQ,您还可以选择“独奏”任何频率。
通过使用这种方法,我发现最大的共振集中在 185 Hz 和 370 Hz,所以我在这里进行了剪辑。在这种情况下,我将 Q 设置得有点宽,以减少 185 Hz 以上和以下的一些额外频率。
这应该立即引起注意。人声仍然温暖,而不是单薄,总体上更清晰,不那么嗡嗡作响。
3. 去除空洞或四四方方的频率 (400 Hz–800 Hz)
大量的人声特性存在于 400 Hz–800 Hz 的频率范围内。
这个频率范围过大会加剧人声的喉咙感,导致它听起来像纸一样或四四方方。这个频率范围太小,人声听起来会空洞和不自然。
同样,使用“提升和扫描”方法,我在 657 Hz 处发现了一些不需要的“纸质”共振,并进行了非常小的削减。
同样,这是一个非常微妙的变化,但是通过这种剪辑,人声不那么纸质,听起来更自然。
4. 消除鼻腔中不需要的共振 (800 Hz–1.5 kHz)
人声的中频范围为 800 Hz–1.5 kHz(有时根据歌手的不同会更高一些),是人体鼻腔产生最大共鸣的地方。
这个频率范围太大会导致人声听起来有点沙哑或鼻音。
如果这个区域有任何不需要的共鸣,它通常与歌曲的键或旋律关系不大。它更经常地取决于单个歌手物理鼻腔的大小和形状。因此,“提升和扫描”方法在这里非常有用。
还应该提到的是,鼻共振的频率一旦被发现,就相当恒定。为了避免在中心频率上方和下方降低太多频率,使用更严格的 Q 值是很常见的。
在我们的示例中,我发现大部分鼻共振都在 931 Hz。
同样,就像我们之前在 657 Hz 下的剪辑一样,差异很微妙,但提供了类似的结果。人声现在听起来应该不那么闷闷不乐,不那么鼻音,更自然。
5. 提高临场感和清晰度 (1.5 kHz–5 kHz)
虽然人类的听觉范围在 20 Hz-20 kHz 之间,但我们的耳朵对 2 kHz-5 kHz 范围内的频率最敏感。这也恰好是人类语言最容易理解的频率范围。因此,应用于此频谱区域的任何均衡器都应谨慎处理。在此区域进行小的提升或削减,不超过 1 或 2 分贝是很常见的。
在这个频率范围内太多,人声很快就会变得刺耳和咄咄逼人。
在这个频率范围内太少,人声听起来会很平淡或低沉。
在以 3,577 Hz 进行小切后,您可能会注意到人声现在听起来稍微沉闷一些。虽然这似乎有悖常理,但它实际上是设计使然。这将使我能够在 8 kHz 到 12 kHz 的后期增强和增强人声。我更喜欢在 8 kHz 到 12 kHz 范围内照亮人声,而不是 1.5 kHz 到 5 kHz 范围的人声,因为它可以使人声更流畅、更不刺耳。
6. 定位嘶嘶声 (5 kHz–8 kHz)
请注意,在人声表演中,“S”和“T”的明亮共振,称为“嘶嘶声”,在 5 kHz 至 8 kHz 的频率范围内最为突出。通过提高这个领域的情商,你将增加这种嘶嘶声。但是,如果您觉得声音太暗并且可以从该区域的提升中受益,那么您应该这样做。这不应该是一种威慑,因为嘶嘶声可以通过其他方式处理。
虽然可以通过使用 EQ 削减频率来柔和嘶嘶声,但这样做会使人声表演的其余部分听起来沉闷而毫无生气。
出于这个原因,通过手动编辑波形本身或使用去嘶嘶声器,可以更好地处理嘶嘶声。我将在本文的最后一步中演示这一点。
在我们的示例中,我决定不理会这个频率范围。我认为这里不需要任何东西。
7. 增加闪光 (8 kHz–12 kHz)
当我们进入 8 kHz 及以上的频率范围时,我们会发现人声更加光彩和闪光。正如我在上一步中提到的,我发现,通过减少 2 kHz 和 5 kHz 之间的一点粗糙度,并将其与 8 kHz 和 12 kHz 之间的小幅提升进行对比,可以带回任何损失的亮度,而不会产生任何粗糙度。
在我们的示例中,我将 9,357 Hz 提高了约 1.5 dB,Q 值相当宽。
你可能会注意到,通过这样做,我也增加了一些人声的嘶嘶声。同样,我们稍后将通过使用 de-esser 来处理这个问题。
8. 注意空气感 (12 kHz–20 kHz)
在处理人声时,我考虑的最后一个频率范围是 12 kHz 及以上。虽然这个区域没有太多的音调信息,但在这个高频范围内稍微增强一点可以帮助人声感觉更加开放和令人兴奋。
为此,我更喜欢使用不同的均衡器来添加更多字符。Ozone Vintage EQ 在这方面非常出色,因为它是以老式模拟设备为模型的。
如果原始录音很暗,我通常会使用 12 kHz 及以上的“高搁架”进行提升。如果原始录音已经相当明亮,我通常会使用 16 kHz 及以上的“高搁架”进行提升。在我们的示例中,它非常黑暗,因此我选择使用从 12 kHz 开始的“高搁架”将功率提高约 3 dB。
差异会很微妙,但您应该听到声音稍微张开一点,并且稍微不那么低沉。
就像在上一步一样,高端的这种额外提升可能会引起更多的嘶嘶声,但在最后一步中,我们将添加一个去嘶嘶声器来补偿这一点。
9. De-ess 人声
iZotope Nectar 有一个出色的 De-esser 模块。我将频率范围设置为从 4.4 kHz 开始,并调整阈值,直到我听到 S 和 T 降低到我觉得听起来最自然的水平。
重要的是不要过度贬低。当这种情况发生时,它会产生口齿不清的声音,并且某些单词缺乏可理解性。
人声均衡器的最终结果
现在我们已经评估了我们的录音,在20 HZ到20 kHz的整个频谱上全面检查了我们的人声,并使用iZotope Neutron应用了均衡器,让我们再听一遍,并将原始产品与最终产品进行比较。
在这些最后的聆听示例中,我将人声的电平降低了一点,以便它在混音中更好地放置,并且还添加了一点混响。
让我们听听!
开始使用人声均衡器
我们在本文中介绍了很多信息,但是,值得重申的是,当将 EQ 应用于人声或任何与此相关的乐器时,没有一个放之四海而皆准的解决方案。
在这个练习中,我们观察了一首 D maj 调式歌曲的男声录音,总旋律范围为 D3 到 D4。您创作的歌曲可能涉及一位女歌手以不同的调式演奏,旋律范围更广。这肯定会改变你选择提升或削减的频率,但是,概念和技术将保持不变,通过练习和重复,你将迅速训练你的耳朵,以听到许多起初可能会逃脱的微小微妙之处。
最后,永远记住,没有人在真空中混合。不要低估一个好的参考轨道的力量和重要性!