单从倍频程和钢琴调式这两个名词看,距离确实有点远,一个偏科技一个偏娱乐。但是距离远不代表没有关系,下面就让我们给它们俩拉拉关系吧。
作者:良逸,阿里云技术专家,阿里云音视频通信 QoS 研发
首先什么是倍频程?从中文字义上看,就是“X 倍频率的范围”,是截至频率和起始频率之比成倍数关系的频段。与之相对应的另一个概念是等宽频程,意思是截止频率和起始频率之差相等的频段。具体定义如下:
等宽频程
ƒ1 -ƒ2= 常量 ( ƒ2 是截至频率,ƒ1 是起始频率)
倍频程
ƒ2 / ƒ1 = 常量( ƒ2 是截至频率,ƒ1 是起始频率)
并且
ƒ2 / ƒ1 = 2n 这个指数n就是 n倍频程表达式
例如,起始频率 ƒ1 =100Hz,它的一倍频程的截止频率 ƒ2=200Hz,即 2 的 1 次幂(2倍)的 ƒ1 ;它的 1/2 倍频程的截至频率 ƒ2 = 141Hz,即 2 的 1/2 次幂的 ƒ1 ,2 的平方根倍;同样它的 1/3 倍频程的截止频率,就是 2 的三次方根倍的起始频率。
为什么要用倍频程?我们知道人耳的听觉的频率感知范围在 20Hz-20000Hz,范围非常的广,分析的时候,需要将这个频率范围划分成不同的频段(频带)来分析,怎么划分呢?于是有了上文的两种划分方式,一种是等宽频程,意味着每个划分的频带宽度是相等的;另一种是倍频程,意味着每个划分的频带宽度与上一个紧邻的频带宽度符合等比数列。
如果采用等宽频程,要表现出低频到高频的声音信息需要的数据量非常大,效率比较低,而且人耳对高低频率的敏感程度是不一样的,通常人耳对低频部分的频率变化比较敏感,而对高频部分的频率变化不太敏感,所以采用倍频程更符合人耳的听力特点,而且提高了频带数据的分析效率。
还有一个跟倍频程有关的概念是中心频率,每频程的上限与下限频率的“几何平均值”称为该频程的中心频率 ƒ0 。特定的中心频率 ƒ0 就代表了一个特定的频段, ƒ0 作为基准频率,只要确定了基准频率,整个 20Hz-20000Hz 的频率范围,就可以按照倍频程的定义分段展开。通常显示倍频程,是以其带宽的中心频率线性间隔的,这叫做倍频程格式。这会导致倍频程在频谱图对应的横轴上出现相同的间隔,即使它们间隔不是均匀的。如下图所示(引用网络公开测试结果,数据来源见图片下方):
数据来源:https://community.sw.siemens.com/s/article/octaves-in-human-hearing
同一个白噪声表现为窄带(蓝色)和倍频程(紫色)格式,x轴是倍频程格式。注意到,与较高频率的倍频程段相比,较低频率处的倍频带的填充数据较少。如上表格所示,这是因为较高频率的倍频带覆盖的频率范围,相比较低频率的倍频带要宽。如果将x轴线性绘制的话,效果如下图所示(引用网络公开测试结果,数据来源见图片下方):
数据来源:https://community.sw.siemens.com/s/article/octaves-in-human-hearing
与倍频程格式相比,上图绘制了与之前相同的白噪声数据,但x轴是线性格式。可以看出,功率谱(蓝色)在所有频率下具有相同的密度,但每个倍频带(紫色)覆盖的频率范围越来越大。
另外,因为选取不同的基准频率,最终展开的频段格式也不一样,那如何来选取基准频率呢?标准化组织根据不同的应用场景就给出了不同的倍频程的标准定义。在声学测量中一般采用 1/3 倍频程来对频谱进行分析,国标《GB 3240-1982 声学测量中的常用频率》中对其标准频率有如下的定义:
八度音阶从这里开始我们看一下倍频程跟音乐有什么关系。我们搜索“倍频程”英文翻译的时候,会发现如下结果: