杀掉相位的凶手 零延迟

音频软件中, 零延迟并不代表高端, 相反的, 它需要你付出巨大的代价

最近在不断翻看Dan Worrell的视频, 这位(可能是来自英国的)大师, 总能用幽默嘲讽的口吻解释一些音频技术上的不为人知的知识.

有一期他讲到了EQ中关于Zero Latency和Linear Phase的区别, 我才突然发现, 原来我们一直追逐的低延迟, 往往并不是什么好事.

低延迟, 或者零延迟, 在音频圈一向是设备高端, 技术先进的代名词, 如果你有一台延迟相当低的音频接口, 好家伙, 那估计要上万, 那么恭喜你, 装X成功. 但音频软件中, 零延迟并不代表高端, 相反的, 它需要你付出巨大的代价.

我们所使用的哪怕是最顶级的EQ插件, 也会给你两个甚至更多选项, 零延迟, 或是线性相位对齐. 而一些专为母带制作的EQ插件, 甚至根本不给你零延迟的选项, 上来就是大几百ms的延迟.

? 为什么到了这里, 零延迟反而没什么价值了呢?

那是因为, 我们在零延迟的基础上使用的EQ, 在偷偷的谋杀你的声音. 而当你发现你的声音变得一团糟时, 你可能根本都不知道是tm谁干的.

你的相位被杀了

对于一个单独的声音来说, 零延迟的EQ, 和线性相位对齐的EQ, 听起来没什么差别. 因为单独的一个音频, 只有它独立的相位, 不存在相位冲突, 因此也不存在相位问题. 这时候, 零延迟EQ和线性相位EQ对它的作用是相同的.

但如果, 你在进行多轨混音时, 你使用了零延迟的EQ, 进行一些频率操作, 一些你意料不到的事情可能会静悄悄的, 在你眼皮子底下发生.

案件

我们使用Bertom EQ Curve Analyzer 2(本工作室非常骄傲的购买了它)来进行观测. 这款EQ分析器, 不仅可以观测你所使用的EQ会对频率做些什么, 还能观测到相位Phase. 套用老办法, 我加载两个ECA, 然后中间夹住一个Pro Q3, 这样就能观测Pro Q3对频率的改变了.

在零延迟模式下, Pro Q3准确的对频率进行了增益, 一切都非常准确. 但如果你观察ECA中那条粉红色的线, 那条代表相位的线, 出现了扭曲.

Zero Latency Pro Q3

这条扭曲的相位线, 会随着你的频点, 你频点处的相位永远是准确的中心, 但频点低频处相位会变成反向, 而频点高频处会变成正向.

更有甚者, 如果你缩紧Q值, 让它变得锐利, 相位的扭曲也变得缩紧且剧烈.

我们再来看看线性相位对齐的Pro Q3.

Linear Phase Pro Q3

这时候的Pro Q3, 非常干净的完成了EQ的增益工作, 但丝毫不会触及相位, 那条粉红的线笔直的穿过大街小巷, 没有一丝动摇.

WTF? 还有这种区别? 不过你也许会说, 这个相位问题我们能听出来吗? 回到我前面说过的, 如果你仅仅是处理一条单独的音频, 那确实听不出来. 但如果你将一个零延迟的Q3, 放在一个多轨混音的项目中, 你的某些频率可能就被Q3偷偷杀死了.

推理

我用最简单的相位抵消法来做个试验:

我先找一段440Hz的信号, 然后让它持续播放.

然后复制它, 成为同样的一条音轨.

这时候, 由于两轨播放同样的音频(当然它们相位也一样), 总音量就会叠加6个dB. 但我们如果在任何一个轨道上添加一个相位反转:

两个同样的信号, 由于其中一个反转了相位, 它们之和等于0dB. 也就是说我现在完全听不到任何声音. 可以看到, 尽管两人在卖力的表演, 可是现场鸦雀无声, 气氛尴尬至极.

现在, 我们给其中一轨加入一个Pro Q3, 现在它还是线性相位对齐模式下的.

!注意, 以下视频将出现声音, 不过不算大!

我们先在线性相位模式下, 看看Pro Q3能不能准确的做好一个低切, 然后我们再切换到Zero Latency零延迟模式, 看看它会带来什么.

我们可以看到, 在线性相位模式下, Pro Q3的低切, 在到达发声的频点前, 对频点没有任何干扰, 这让两个持续的频率继续保持着相互抵消而无声的状态, 知道低切到达了其中一个的频点, 打破了对称, 另一个的声音出现了.

可是, 当我们切换到零延迟模式下, 低切的频点即使尚未到达频点, 不对称的平衡就已经开始被打破了. 从很远开始, Pro Q3中的频点对相位的破坏就开始, 然后我们直接就听到了声音.

OK, 我们再反过来做同样的试验.

刚才我们使用了两个相同的信号, 并将其中一个信号的相位反转, 这时播放, 两个信号由于相位相反, 会互相抵消而无声.

这次我们关掉这个信号反转, 让两个信号同步相位. 我们会听到一个增加6dB的双信号(不过不用担心, 我降低了输出的音量, 因此不会刺耳).

我们再同样的用Pro Q3做一次低切, 看看会发生什么?

有趣的事情发生了不是吗? 我们现在线性相位模式下, 对其中一个声音进行低切, Pro Q3非常准确, 靠近那个频点时, 咔嚓一刀, 那个信号被切掉了.

但当我们换成零延迟模式, 很诡异, 当低切的频点逐步靠近目的频点时, 声音突然消失了! 再靠近一点, 声音又突然出来了, 直到当我们划过目标频点时, 才真正切除.

反过来推理, 我们就知道, 两个信号都是同相位的, 声音会加倍而不会消失, 只有当两个信号的相位反相时, 信号才会正负为零. 那么, 这个零延迟下的低切, 一定在某个地方出现了相位反转, 这样, 这个相位反转才会在某个特定的频率, 提前与另一个信号的相位抵消, 从而出现无声.

动机

事实也正是如此. 我们再次打开Bertom ECA, 将刚才的Pro Q3包起来. 看看它的相位是怎么回事. (纯信号分析, 无声)

可以看到, 在Pro Q3的Zero Latency零延迟模式下, 低切频点的高一点的频率部分, 出现了可怕的相位反转, 正是这个提前反转了的相位, 让我们的低切频点在靠近两个同频率信号之和时, 提前反转了其中的一个相位, 从而导致了突然消失的电波.

在EQ插件中, 零延迟状态下, 低切所产生的相位反转是最可怕的, 直接极性化了. 其他形状的频点也会产生形态各异的相位扭曲.

而且, 不只是现代化的参数EQ在零延迟下会如此, 一些经典的复古EQ模拟, 也同样会产生相位问题, 只不过它们的看起来较为线性不那么剧烈罢了. 上图是UAD的Pultec EQP1A和NoiseAsh的Heritage Pro, 两者只使用EQP1A模块, 参数调节一样, UAD Pultec的调节曲线为绿色, 相位曲线为粉红色, Heritage的调节曲线为灰蓝色, 相位曲线为灰色. 两者的频率曲线几乎一致, 但Heritage到了高频, 相位就开始下滑走向负值, 而UAD Pultec的依然较为平稳衰减.

结论

包括我在内, 很多人都赞叹如今的行业科技进步, 我们在比较那些高新科技的软件时, 总将其没有延迟的特性当做至宝, 但很可能, 在零延迟的畅快之下, 是混音中的暗潮涌动.

曾经的我, 在选择插件时也犯过这样的错误, 拖入音轨, 延迟剧增, 然后我内心”好家伙, 这玩意儿能用?”随即将其弃之不顾. 直到我用了很长时间, 深入的去了解各种音频知识后, 才意识到了这些插件也许正是为了保护音质, 而牺牲性能而存在. 当然, 我们依然要感谢那些零延迟或低延迟的软件, 如果所有的品牌都制造巨大延迟的高品质软件, 我们一样无法正常的运转这个行业, 如直播, 现场等项目.

这篇文章只是希望你, 将零延迟与线性相位的区别Bear in mind, 以后在执行, 比如多只话筒录制合唱, 鼓组等同音源录音时, 先完成多轨的同步In Sync, 对齐相位起点, 同时在调整EQ时预计可能出现的结果. 只要你能控制住这个相位杀手, 你同样可以在零延迟下完成优秀的混音.