什么是 LUFS?最完整的指南

我觉得这篇文章将是非常非常友好且重要的一篇响度入门指南

感谢iZotope的技术文章,让我们有机会深度的了解关于响度测量中的每一个指标与技术解释,很多人可能一直对这个话题非常感兴趣但从来没有机会认真的阅读相关文章,那么我觉得这篇文章将是非常非常友好且重要的一篇入门指南。原文链接: What Are LUFS? The Complete Guide。另外,此引文框内的内容,均代表smpiggy个人的分析与理解,此形式将会出现在文章段落中。

了解 LUFS(loudness units full scale, 全量程响度单位)在混音和母带处理过程中的重要性,以及如何使用它们来创作满足主要流媒体和电视平台交付规范的音乐。

谈论 20 年代的音乐制作就很难不提到 LUFS 和Loudness 响度这个话题。但LUFS的定义是什么?它们与其他类型的电平表有何不同?为什么它们如此重要?

在本文中,我们将解密这些及更多内容,到最后,您将完全掌握 LUFS 定义,并了解LUFS 仪表上的五个指标 – momentary 瞬时、short-term 短期、integrated loudness综合响度、LRA 和真实峰值。您还将深刻理解, 为什么 LUFS 测量在现代音乐制作中很重要, 以及如何利用它们。

很抱歉这里去掉了iZotope Insight的产品推荐,但我承认它是一款非常好用且准确的响度测量插件!

什么是 LUFS?

LUFS 代表Loudness Unit Full Scale 满量程响度单位。如果您以前听说过 dBFS,那么“满量程”可能听起来很熟悉,事实上,它与此密切相关。正如 dBFS 是相对于满量程的分贝(其中“满量程”是定点数字音频中允许的最高级别, 简单的说就是0dB)一样,LUFS 是相对于满量程的响度单位。

这不可避免地引出了一个问题:“什么是响度单位,即 LU?” 用最简单的术语来说,响度单位与分贝相同,但有一个关键区别:它们试图考虑我们的耳脑系统根据声音的音调平衡解释响度的方式。结果是,如果您将声音或混音调高 3 dB,其 LUFS 读数也会增加 3 LU。但是,如果您将 EQ 应用于声音或混音而不更改级别,则 LUFS 值也可能会根据您的 EQ 方式而变化。

这里的知识点我们需要了解,dB是具体数值,通常代表两个音量之间的分贝差别,而dBFS则是相对于数字系统可承受的最大级别来说,它所处的音量位置。因此,我们说的提升几个dB,就是一个具体的差值,而如果我们要确定一个声音当前的具体分贝值,就要使用dBFS单位。同样的,LU和LUFS也是一个意思,它们分别代表差值和相对确切值。尽管dBFS和LUFS的计量标准不同,并非一个意思,但dB和LU在实际使用中对音量加减的分贝或响度大小却几乎是相同的。

我们先简单谈谈测量 LUFS 值的基本方法,然后看一下五个具体指标。计算 LUFS 的第一步是将所谓的 K 加权滤波器应用于被测量的音频。简单来说,这将使用一个约 2 kHz 以上的 4 dB 高架以及 100 Hz 时的 12dB/oct 高通滤波器。这是为了模拟一个事实:在我们对响度的感知中,我们往往对高频更敏感,而对低频不太敏感。

将此 K 加权滤波器应用于音频后,将计算其RMS级别,并将所得值用于五个主要指标中的前三个:瞬时响度短期响度综合响度。现在让我们深入研究一下。

iZotope Insight 测量中

瞬时响度

瞬时响度是短期和综合测量的基础,本质上只是一个 RMS 计,就像您可能习惯于从音频工作站或其他较旧的“传统”计量器中获得的那样。

它与后者的不同之处在于:首先,它测量 K 加权、经过滤波器的音频 – 如前所述。这意味着它对非常低的频率不太敏感,而对高频稍微敏感一些。这解决了两个众所周知困扰标准 RMS 和 VU 表的问题——对低音过度敏感和对高音缺乏敏感。

这里也是一个知识点。我们传统的对音频音量的测量方式,是来自于音频的振幅,而振幅的不准确性在于,它会考虑很多我们人耳根本感受不到的频率,这让我们对一首过于偏重低频或高频的音乐的音量控制无从下手,要么VU显示过载,要么显示太低。这也是为什么现在音频测量全面转向了响度测量,也就是以人耳感知为目的的全新标准。

其次,它有一个特定的测量窗口,有时称为综合时长。标准 R.M.S. 表的另一个问题是,如果测量 50 ms 音频块的 R.M.S. 值,则得到的值与测量 500 ms 数据块时得到的值截然不同。这意味着两个 RMS 仪表的读数可能会非常不同,具体取决于它们的测量窗口。

而瞬时响度通过指定一个 400 ms 的窗口并额外规定每个测量窗口应与前一个窗口重叠 75% 来解决这个问题。这可确保您从仪表中获得良好、平滑的读数,并且所有瞬时仪表的读数都相同。

短期响度

短期响度建立在瞬时指示器的输出之上,并显示最后三秒瞬时值的移动平均值。这提供了一个移动得更慢的电平表,并平滑了瞬时电平表将拾取的响度中的一些波峰和波谷。因此,它的读数也往往略低于瞬时仪表。

综合响度

综合响度是三个测量时长中最长的。换句话说,它分析短期读数并在整个 “程序” 的持续时间内对其进行平均。通常,这可能意味着一首歌、一个电视广告、整个电视剧集,甚至是一部完整的故事片,实际上,它可以告诉您整个音频的总平均响度。

现在我们就知道这三个测量指标,瞬时,短期和综合的区别了。瞬时测量瞬态响度,短期则根据瞬时响度给出一个较慢的平滑值,而综合响度则根据短期响度的数值,再给出一个持续到结束的平均值。

大多数电平表会在您每次停止和开始播放时重置,但有些电平表(如 Insight)可以保留响度计算并在传输重新启动时恢复计算 — 上方设置齿轮旁边的顶部绿色按钮。这可能很有用,但如果你一遍又一遍地播放最响亮的副歌部分,它也会给你一个夸大的值。要获得真正的积分值,您需要一直播放您的歌曲,或使用 RX 中的 Waveform Statistics 窗口之类的东西。

iZotope RX 波形统计

综合响度的最后一个细节是它使用两个门限:第一个是 -70 LUFS。这意味着任何低于 -70 LUFS 的水平都不会对积分测量值产生影响。第二个是比当前综合电平低 10 LU 的所谓“浮动”门限。这意味着,一旦开始进行综合测量,任何安静超过 10 LU 的段落也不会对整体测量产生影响。

好,这里就有两个趣味的知识点了。首先这里提到了前面我们分析过的LUFS是个相对数值而LU是个相对差值,而另一个知识点则是,段落之间差值超过10LU(我们可以想象为10个dB)则综合响度不进行计算。这一点我还没想明白。

LRA(Loudness Range)响度范围

响度范围(LRA)是最复杂的指标,涉及统计数据、矢量数组、更多浮点门限等。我们不打算在这里深入讨论,但作为一个思考练习,首先想象由最安静到最响亮的所有测量点绘制出的所有瞬时测量值,其中特定响度值的重复测量会在图表上产生更高的峰值。接下来,想象一下在图表中间找到大约 50% 的最频繁响度读数所在的区域。

LRA 由该范围的顶部和底部之间的差异来描述,显示为下面 50% 的深蓝色,在 Insight 中由底部的“LRA”值以及集成液位计左侧的白色条表示。

简化的响度分布

如果这感觉有点抽象,我不能怪你——确实如此。不过,从本质上讲,它告诉你大部分响度都集中在哪个 LU 范围内。任何响亮或柔和的时刻以及发生在该范围之外的时刻,每个时刻的发生时间都少于 25% 左右。

由于这仍然很抽象,让我们考虑几个例子。想象一下一首 LRA 为 3 LU 的歌曲。这意味着歌曲的大约 50% 在 3 LU 以内,换句话说,它具有非常一致的电平。另一方面,想象一下 LRA 为 25 LU 的故事片。这意味着这部电影有很多我们可以称之为宏观动态的东西,有很多柔和的对话,可能还有一些响亮的动作场面。

这个部分确实很难理解,或者说,我们能理解大概得意思,但很难具象化这个场景。不过我的意见是,我们只需要知道LRA响度范围,代表着整首音乐的动态幅度就行了。实际上一般的流行音乐中,响度范围大多在4~6个LU左右,意味着音乐中间会有一定的起伏,换句话说就是缓口气。电音的范围会更小,也许在3~5LU之间?那么,管弦乐的响度范围一般会多大呢?

真实峰值

True peak 真实峰值是 LUFS 仪表上五个主要指标中的最后一个,旨在显示数模转换器实际产生的峰值电平。您可能会想,“等等,为什么这与我的数字音频工作站中显示的正常峰值电平不同?“问得好!

音频工作站中的大多数指示器都显示所谓的采样峰值电平。换句话说,它是数字音频样本所具有的最高瞬时电平。然而,数字音频的一个奇怪之处在于,数模转换器发出的实际模拟电压可能高于其两侧的采样电平。

RX 中的真实峰值(蓝线)与采样点峰值(白点)

True peak 测量试图通过对音频进行 “过采样” 来预测这个实际的模拟电平。过采样意味着采样频率增加(在真实峰值的情况下,增加四倍),并且新的采样点更准确地反映了最终将产生的模拟电平。这有助于避免无意中削波转换器的输出,或者更有可能的是消费类播放设备中的转换器的输出。

这个部分当初我也理解了好久,但最后一旦理解,就完全明白了数字音频的特点。从上图我们可以看到,实际音频信号的峰值,明明已经超过了两个白点即采样点的读数,但由于采样率的限制,传统测量电平只能读到前后两个采样点的读数,比如-1dBFS和-0.6dBFS,这就让我们误以为当前音频不会出现削波。但实际情况是,真实的峰值可能已经达到了0dBFS,甚至已经产生了削波。这也是为什么很多音频工程师强调,在输出数字文件时,最好对限制器进行-1dB或其他参数的余量空间,因为我们一旦将这些数字文件转换为采样率更低的压缩音频格式如mp3等,某些极限峰值可能又会出现在这些低采样率的大空格中间,导致削波失真。你知道吗?在阅读这些文章时最大的乐趣,就是不断发现了音频世界的秘密。

为好奇心强的人准备的补充阅读

如果您真的想深入研究这些东西并深入了解这些东西,您可以查看 ITU 建议 BS.1770-4 以及 EBU 技术文档 3341 和 3342

为什么 LUFS 很重要?

LUFS 已成为许多交付平台上测量音频响度的事实标准。在某些情况下(例如 Netflix、Amazon 等平台上的电视和电影音频或杜比全景声 (Dolby Atmos) 混音),需要以符合特定规范的方式传输音频,无论它们是综合响度、真实峰值、LRA 还是某种组合。

另一个主要用例是音乐流媒体平台上的响度规范化。虽然您当然不需要将您的音乐掌握到 Spotify、Apple、Amazon、Tidal 和其他公司使用的标准化参考级别,但了解这些级别是什么以及您的音乐在相应地播放时听起来如何非常有帮助。

虽然 LUFS 确实试图测量感知的响度,并且理论上两首都测量为 -14 LUFS 的歌曲听起来应该相同,但在实践中通常情况并非如此。它们可能会非常接近,但编曲、混音和母带处理的差异可能会导致感知响度的微小但明显的差异。

因此,最好在一些常见的标准化参考级别试听您的混音或母带,并将其与使用该参考级别的流媒体平台上您最喜欢的参考轨道进行比较。让我们看一些例子。

如何在混音和母带制作中使用 LUFS

LUFS 电平表,如 Insight,在混音和母带处理过程中都非常方便。如果您有辅助显示器,您甚至可以考虑将其永久打开,以便您随时可以浏览以快速了解您的级别在哪里。但是,您查看的指标以及您可能希望看到它们的值范围会有所不同,具体取决于您是混音还是母带制作。

我非常信任Insight的作用,不过我也购买了另一款响度测量软件,Youlean Loudness Meter Pro,由于它是全域式的,意味着我除了可以在DAW中使用,也可以在系统层面使用,用来观测Youtube节目,播客,影视等音频内容的响度。很抱歉iZotope,这算是拆台吗?

在混音中使用 LUFS

混音中一直很困难的部分之一是弄清楚您所带入混音中的初期内容适用于什么响度指标。您可以使用一些技术来帮助解决这个问题。一种是使用经过校准的监听器增益,这通常允许您通过耳朵工作。另一种是在 Neutron 中使用 Mix Assistant,这可以帮助您获得良好的起始平衡,同时留出足够的动态余量。

但是,如果您想充分利用 LUFS 仪表,它也可以通过多种方式为您提供帮助。首先,您可以对音乐进行一个快速的粗糙的初调。不要担心,就当是一顿照样能填肚子的麦当劳快餐一样。如果您的主输出通道开始削波,依然不必担心(这是你唯一听到我这么说的时候!)。

然后,打开你的 LUFS 计量器,选择你所有的混音推子,并将它们拉低,直到你的短期电平徘徊在 -20 到 -18 LUFS 左右。从那里,把你所有的推子 – 除了贝斯或主唱音轨,都拉到 -inf 无限低 – 我告诉过你不要担心!在这个基础上,您可以开始围绕这个关键音轨认真构建您的混音,您应该会发现您有足够的空间。

这是个有趣的思路,作者的建议居然是一开始围绕响度来建立混音,这和我的习惯大不相同。到达罗马的途径不必完全一样,但下次有机会我会试试这种方法!

一旦你有了满意的粗略混音,就可以尝试独奏一些关键元素,如主唱或乐器、贝斯、底鼓和军鼓,或其他重要的混音元素,并记下它们的瞬时响度值。这将非常依赖于混音和流派,这就是为什么我没有给你具体的值,但在未来的混音中,你可以简化这个过程,首先将关键元素放在你知道效果很好的响度范围内作为你的起点。

到这里,我算有点理解作者的思路了。从响度开始建立某件乐器的初始值是很有道理的,这能帮你系统的建立围绕在你的工作环境中一个长期稳定的混音框架。

在混音阶段,您无需太担心综合响度或真实峰值水平,但值得密切关注 LRA。如果您使用我上面列出的指南(-20 到 -18 LUFS 范围内的短期电平),您最终可能会得到 -24 到 -20 LUFS 范围内的综合响度值,并且在最响亮的真实峰值电平之上有足够的峰值余量。

但是,如果您最终得到的 LRA 非常低(比如小于 3 LU)或非常高(比如超过 15 LU),则可能需要查看您的一些 编曲段落或音量自动化。低 LRA 不一定是问题,但可能表明错过了制作更具活力和更抓人的混音的机会。相反,高 LRA 可能是一个不好的预兆,表明在这个基础上制作的母带,可能很难在流媒体平台上占据一席之地。

有关混合中计量的边界概述,请查看这篇关于计量的文章。综上所述,您永远不应该让数字支配您的艺术!

在母带制作中使用 LUFS

使用 LUFS 进行母带处理,情况会有所不同。并不是说你也应该让数字来决定你在这里做什么,但了解大师在流媒体世界中的工作方式是工作的一部分。因此,有几个数字值得关注。

True Peak Level 真实峰值电平

一些流媒体服务建议的最大真实峰值水平不超过 -1 甚至 -2 dBTP。这对于 Spotify 和 Soundcloud 等有损流媒体服务很重要,因为有损编解码器通常会导致文件的峰值超过其在无损文件中的相应值,这可能会导致削波。

嗯,这一点我上面也提到了。

然而,随着越来越多的服务支持无损流媒体,留出真正的峰值余量正变得越来越不是一个因素。就我个人而言,我通常的目标是将我的真实峰值保持在 -0.3 dBTP 左右,但对此的看法广泛而多样。

Integrated Level 综合响度电平

您的最终综合响度为多少其实相对来说并不是首要任务,不如了解这一点,在大多数流媒体服务上它会降低到大约 -14 LUFS,但是它不会总是增加到 -14 LUFS。这意味着:

  • A) 您可能希望综合响度至少略高于 -14 LUFS
  • B) 如果它远高于 -14 LUFS 意味着你可能会不必要地牺牲冲击力和微动态,尽管这也许可以帮助你实现你想要的声音,
  • C) 可能有必要以 -14 LUFS 的综合响度收听您的最终母带试试,看看它与您最喜欢的流媒体平台上的参考曲目相比如何。据我所知,最简单的方法是在 RX 中打开您的母带,打开 Loudness Control 模块,然后运行 Music Streaming Playback Check 预设。
用于流媒体的 RX 响度控制

短期水平

同样,特定的短期水平并不是特别重要,但如果您的短期响度的最大值,比您的真实峰值水平的差值小于 6 LU,这可能再次表明您的音频响度有点太过了。

这段话也有点烧脑,真实峰值电平的计量是dBFS,而短期响度的值是LUFS,直接用这两者对比差值是比较奇怪的。但前面我也提到过,涉及到差值时,dB和LU的数值是可以等量换算的,那么我们简单的思考,这段话的意思就是,如果我们当前的真实峰值数值为 -4 dBFS,那么我们的短期响度最大值尽量不要高于 -10 LUFS。这是由于短期响度是计量了峰值和谷值后的近似平均值,如果这个响度还依然很大,就说明音频实际响度已经大得过份了。

开始在音频制作中使用 LUFS

因此,在这一点上,您应该很好地了解现代 LUFS 测量表向您展示的五个指标 — 瞬时、短期和综合响度,以及 LRA 和真实峰值 — 以及如何计算这些指标。此外,您应该牢牢掌握为什么它们适用于现代音乐制作,以及如何在混音和母带制作时使用它们。

然而,有一点我已经提到过几次,值得重复一遍:不要让数字为你做决定!归根结底,这是一门艺术,我们需要用我们的耳朵。这些数字可以作为一个有用的参考,并告诉我们要监听什么,以及要监听的具体位置,但它们永远不应该是最终的和全部。

引用任贤齐的歌词,“没什么大不了”,祝你好运,开始测量吧。

以上这句引言原本是援引一句对中文群体完全不认识且无法理解的某人的一句话,因此我换成了任贤齐。