什么是等响曲线及它的重要性

理解等响曲线对于混音的实际帮助

我们讨论等响曲线的篇幅并不算多,但在混音和母带领域,理解等响曲线对我们的工作能带来巨大的帮助,它并不是一个实际的技术指标,而是一个需要时刻埋藏在潜意识中的精神导师,它会告诉你,声音的频率严重取决于监听的响度,选择了一个包容性的监听响度,能帮助混音在绝大多数场合回放准确。原文转自The Pro Audio Files网站文章:What Are Equal-Loudness Contours? (+ Why It Matters) ,作者 Philip Mantione。我还在文后为大家附上了一篇现实中声音的声压级例表,以帮助理解dBSPL的实际强度对照。以下为原文:


音频制作或声学课程的任何基础知识都将包括对 Fletcher-Munson 等响曲线(Equal-Loudness Contours)的讨论。对于音频工程师来说,了解这种图形表示在混音、母带处理以及听众如何感知他们制作的音乐方面的影响非常重要。

Fletcher和Munson使用的音调产生机(来源)

响度是一个主观概念

不同的人可能会认为同一声源处于不同的响度水平。响度也因物种而异,任何养狗或猫的人都可以证明这一点。感知响度也高度依赖于频率和听众的局限性。另一方面,振幅是可以通过声压计等仪器精确测量的东西。Pa(帕斯卡,以数学家和物理学家布莱斯·帕斯卡的名字命名)是压力的测量单位,就声压级而言,人类听觉的阈值被认为是帕斯卡的百万分之二(表示为 20 x 10-6 Pa 或 .00002 Pa)。这是一个非常小的压力!使用帕斯卡等绝对度量来描述音频制作方面既麻烦又不必要地精确,因此我们采用分贝(Decibel,简称dB)来描述相对术语的幅度电平和变化。作为一名执业工程师,您将很快习惯将轨道上的电平更改 个3 dB、6 dB、12 dB 等的效果。当实现 10 到 12 dB 的变化时,通常会感觉到幅度加倍或减半。对于大多数人来说,在 2 到 3 dB 的变化下可以感知到明显的响度差异。重要的是,要认识到分贝是相对单位,这意味着它们需要参考值或起始值才有意义。因此,-3 dBFS(FS = Full Scale满量程,专指数字音频系统)基本上毫无意义,除非您将其与 0 dBFS 或单位增益时感知到的响度进行比较。使用 SPL 计测量响度将提供相对于人类听力阈值或 0 dBSPL 的分贝单位。因此,如果房间里的正常对话的音量为 65 dBSPL,那么我们可以估计在水牛城比尔队橄榄球比赛期间声音会提高一倍(大约 77 dBSPL)。

smpiggy:在这里,我们会了解到三个重要的指标:dB,dBFS,dBSPL。dB与dBFS指的是相对的音量变化,而并非实际中听到的音量大小。只有dBSPL能准确的测量在一个听觉环境内,一个声音的音量大小。这就如一张数码照片,不管你拍摄时使用的分辨率有多大,文件体积有多大,最终这张照片的大小,还是需要由你选择的打印尺寸来决定。

频率呢?

一旦您了解了分贝等相对值和一般响度的主观性,考虑频率就会增加另一层复杂性。人类对响度的感知在不同频谱中有所不同。这就是 Harvey Fletcher 和 WA Munson 于 1933 年在贝尔实验室研究的精髓。由于每个人的听力能力略有不同,因此他们需要得出一个平均值,才能在整个听觉频谱上获得人类听力的有意义的表现。他们是第一个在一项研究中测试这种人类听觉敏感性的人,该研究包括大量样本以获得平均统计结果。他们在一篇题为“响度、其定义、测量和计算”的论文中发表了他们的发现。

自最初的研究以来,经过改进和修订,形成了当前的 ISO 226(国际标准化组织),如下所示。该图形现在通常称为等响曲线。

Fletcher Munson 等响度等值线
等响曲线,Equal Loudness Contour

这些数字是什么意思?

X 轴表示整个频谱的频率,从左到右从低频到高频,Y 轴表示各个级别人耳所感受到的幅度。phon 是响度单位,被认为等于 1 kHz 音调的强度(以dB为单位)。因此,以 40 dBSPL 播放的 1,000 Hz 正弦波的响度相当于 40 个phon。因此,出于实用性,我们可以认为,在响度领域,phon的相对变化等同于 dBSPL 的相对变化。

smpiggy:原文这一段可能有点晦涩难懂,我们尽量简单的解释:如等响曲线图中所示,这张图形中,代表着同样的一条正弦波声音,在不同的回放音量下,人耳对不同频率的敏感度。而在这些不同的敏感度中,唯一保持一个较为恒定的,随着音量增减而保持相对稳定变化的频率,是位于1000Hz处的频率。我们观察图片,比如,我们在以20dBSPL的音量回放正弦波时,我们几乎听不到低频部分(蓝色的线条此时根本没有呈现),而在逐渐到达1000Hz时,我们听到了一定的声音。接着在40、60、80Hz下,我们可以或多或少的听到低频和高频,但只有1000Hz处的频率,是稳步提升的,并不像其他频率那样过小或过大。这一状态一直延续,直到超过人耳可以承受的声压。因此证明,人耳对于1000Hz左右的频率,所感受到的音量变化,与dBSPL声压的变化维持在同样的比率下,因此,我们选择了1KHz的频率,作为可以脱离dBSPL测量,而独立存在的响度值Phon。任何响度测量工具,只要能准确的测量1KHz的响度变化,那么以它为基准的声音作品,在dBSPL回放标准下,也是准确的。

如何阅读曲线?

Fletcher Munson 等响度等值线
等响曲线,Equal Loudness Contour

曲线上的每个点都代表特定幅度的频率。需要注意的重要一点,也是这张图的本质,是位于相同形状或曲线上的每个点都会被认为与普通人具有相同的响度。例如,在上图中找到在大约 50 dBSPL 处穿过 200 Hz 线的蓝线。现在沿着那条线向左走,直到它穿过 100 Hz 线。请注意,此时的幅度约为 59 dBSPL。这意味着为了让一个人听到 100 Hz 频率,并让它与以 50 dBSPL 播放的 200 Hz 音调相同的响度,它必须增加 9 dB。或者换句话说,在这个特定水平上,我们作为一个物种对 200 Hz 频率比 100 Hz 频率更敏感。

当我们提高整体水平时,情况就会发生变化。在 120 dBSPL 处查看 200 Hz 的曲线,然后沿着曲线到达 100 Hz 。现在我们看到,创建同样响亮的 100 Hz 音调所需的电平仅高出 5 dB,即 125 dBSPL。因此,尽管我们仍然对 200 Hz 音调更敏感,但两个频率的感知响度之间的差异已经明显变小。随着整体电平的增加,曲线会变平,尤其是在 1 kHz 以下。这意味着当我们增加整体音量时,我们会感知到更响亮的低音频率。

查看图形的右侧,我们可以看到大约 4,000 Hz 的下降。使用相同的逻辑,这意味着我们对这个频率范围比其他任何频率范围都更敏感。但是,与低端频率相比,当整体电平增加时,会有所不同。

例如,找到 4,000 Hz 线与 35 dBSPL 相交的点,然后沿着该等高线向左到达 1,000 Hz 线。我们看到它跨越了大约 40 dBSPL,相差 5 dB。查看 120 dBSPL 时的 4,000 Hz 线,我们看到 1,000 Hz 处的相同响度将升高 20 dBSPL,达到140 dBSPL。这意味着 4,000 Hz 的音调在感知响度中会高出 20 dBSPL!

smpiggy:综合前面提到的1000Hz的均匀分布,在这一段内容中,我们更加强化了这个理论,即频率在不同声压下,人们的感知音量的不同。我们要理解等响曲线,就可以通过观察蓝色线条的走向,来总结,低频需要在极大的音量下,才能让人感受到和高频差不多的响度。另外,我们从图中还能得知,人类对于3000~5000Hz以内的频率极为敏感,这也能帮助我们理解混音中为什么要尽力克制这个频率范围内的声音。

然后呢?

这些曲线在混音和母带处理方面的影响是巨大的。我想每个人都会同意,理想的混音应该在所有音量级别下听起来都很好,这意味着整个频谱的平衡应该符合混音工程师的预期。有很多因素使这成为一个具有挑战性的命题,例如听众的播放系统、房间的声学效果以及耳机/扬声器的保真度。这些事情是不可知的,无法控制的。但是我们可以利用我们在这里讨论的心理声学现象及由等响曲线的所再现的知识来进行操作。解决方案是从平均水平的相对中性声音开始,这将很好地转化为多种聆听情况。

以高于平均水平的音量进行混音会导致工程师通过过度削减低频来平衡与高频类似的感知响度,从而导致低频的不足。于是,当混音以较低的音量播放时,低音听起来会很薄。

smpiggy:这点相对很好理解。之前的例子已经证明了,在回放音量较弱时,我们几乎很难听到低频,而在回放音量较大时,我们听到的低频和高频的曲线已经平缓了很多。这意味着,回放音量越大,我们感受到的低频量越足。但我们必须考虑,这首混音是不是通常需要在巨大的回放场所下进行播放。如果不是,比如它更适合在轻松惬意的家庭音响或咖啡厅播放,我们就不适合在较高声压的监听环境下进行混音,以免过多的削弱了低频。

以非常柔和的电平进行混音会产生相反的效果,因为工程师会过度补偿听起来微弱的低端。因此,当混音以较大的音量播放时,低音会变得过强。

smpiggy:还是引用之前的例子,在音量较微弱的监听环境下,比如40 dBSPL,我们几乎听不到低频,这可能会导致我们盲目的增加低频,使它达到跟高频较为平衡的音量。但考虑到混音的适用性,大部分用户回放曲目可能是在60~70 dBSPL的环境下,这种情况下,你的低频就会过于饱和。

解决方案是找到一个快乐的中间地带,大多数工程师将其定义为最多在 70 到 85 dBSPL 之间。就准确感知的频谱平衡和听众疲劳而言,这是一个相对安全的范围,这是另一个问题。长时间聆听,尤其是在较大的音量下,会损害您做出正确决定的能力。请参阅我关于最佳实践的文章 点击此处.

在非常低和非常响亮的电平下抽查混音也是一个很好的做法,以了解它对极端情况的反应。混音总是涉及到妥协。也许您的听众会足够精明,可以根据他们的系统进行自己的调整。我仍然保留着我在 80 年代中期购买的 Denon 接收器(为数不多的经受住时间考验的设备之一),它有一个称为可变响度的控件。此控件根据整体音量调整低端音量以保持频谱平衡。这与直接的低音控制有很大不同。

天龙接收器

结论

混音时始终注意聆听电平,不仅是为了频谱平衡,也是为了耳朵的安全。目标应该是找到一个好的折衷方案,以便混合能够很好地适应各种情况。在进行彻底的调整之前,请多多参考其他已发行的曲目的声音,并认识到我们作为人类的局限性。

下面为好奇和自学的人提供一些很好的参考资料:

Ballou, Glen M. 音响工程师手册。爱思唯尔/Focal Press,2008 年。
Everest, F. Alton. 音频专业人士的关键听力技巧。汤姆森课程技术,2007 年。
Everest, F. Alton. 和 Ken C. Pohlmann。声学大师手册。麦格劳-希尔,2009 年。
Howard, David M.等人。 声学和心理声学。焦点出版社,2013 年。
William, Moylan. 理解和制作混音:录音的艺术。焦点出版社,2013 年。


SMPIGGY:

事实上,这篇文章很久以前在国内网站Midifan上就已经有过转载了。很感谢Midifan这个国内专业的音频技术网站持之以恒对专业音频新闻与文章的报道与转载,他们帮助了早期的我了解这个广阔无垠的音频世界。不过我依然希望自己再次转载一遍这篇文章,一来,我需要不断的在阅读与翻译过程中,真正的理解和消化这些文章的精髓;二来,在越来越多的混音实践中,我也逐渐意识到利用等响曲线的重要性,我需要反复的搜集这类文章来提醒自己,在混音中,时刻预测自己曲目未来的回放场所,及时调整自己的监听音量,以为之进行优化。

同时,我还希望补充一下dBSPL的扩展参考,即不同声压的现实中音量实例大小,这个非常具有参考价值。

声压实例列表

声源距离声压级 Sound pressure level[*]
(Pa)(dBSPL)
冲击波 (失真的声波> 1 个大气压; 在零压力下波谷被削波)>1.01×105>191
简单的开放式热声装置[此例尚待澄清]1.26×104176
1883年克拉克托火山喷发165 公里外172
.30-06款春田步枪发射离射手1米处7.09×103171
鞭炮炸裂0.5米7.09×103171
震撼弹爆炸Ambient1.60×103
…8.00×103
158–172
23 cm直径的派对气球被充爆近耳处4.92×103168
23 cm直径的派对气球被压爆近耳处1.79×103159
23 cm直径的派对气球被充爆0.5米1.42×103157
23 cm直径的派对气球被针刺爆近耳处1.13×103155
LRAD 1000Xi型号的远距离声学装置1米8.93×102153
23 cm直径的派对气球被充爆1米731151
喷气式发动机1米632150
23 cm直径的派对气球被压爆0.95米448147
23 cm直径的派对气球被针刺爆1米282.5143
最响的人声1英寸110135
小号0.5米63.2130
Vuvuzela号(南非世界杯助威乐器)1米20.0120
听力疼痛的阈值近耳处20–200120–140
瞬时噪音所导致的听力丧失的风险近耳处20.0120
喷气式发动机100–30米6.32–200110–140
双冲程电锯1米6.32110
水泥冲击钻1米2.00100
听力损伤(禁止长期持续)近耳处0.3685
美国环保署确定的音量最大值,以预防听力损失和其他破坏性影响,如睡眠障碍,压力,学习障碍等周围0.0670
时速30公里的乘用车(包含电动和内燃机)10米0.045–0.06367-70
电视 (家用级别)1米0.0260
正常对话1米2×10−3–0.0240–60
时速10公里的乘用车(内燃机)10米12.6×10−356
时速10公里的乘用车(电动)10米6.32×10−350
非常安静的房间周围2.00×10−4
…6.32×10−4
20–30
轻柔的树叶摩擦,平静的呼吸声周围6.32×10−510
1 kHz时的听觉阈值(或3m外蚊子飞行的声音)近耳处2.00×10−50
位于欧菲尔德实验室的电波暗室,A加权周围6.80×10−6−9.4
位于索尔福德大学的电波暗室,A加权周围4.80×10−6−12.4
位于微软公司的电波暗室,A加权周围1.90×10−6−20.35

 *:除非特殊说明,所有数值均为有效声压级。