什么是时间拉伸?

时间拉伸是一种数字过程,它改变音频信号中感知到的时间流逝,而不打算修改其频谱特征,例如改变其音高。如果不引入声音伪影,很难实现广义时间拉伸。然而,在某些音乐环境中,人工制品是可以接受的,甚至是有用的。这是因为当伸缩收音机很大时,它们增加了额外的频谱兴趣。这个过程也被称为时间压缩或扩展。

时间拉伸是你在任何DAW中都能找到的工具。它主要是一个简单的功能工具,一个真正的好选择让你的鼓循环与网格的时间。有了它,你还可以在DJ集中改变音轨的节奏。此外,您可以使用它来创建一些真正有趣的混乱的声音。此外,你还可以在大多数音频材料上执行它(人声、合成器、鼓、FX等)。

相位声码器和时域

时间延伸通常是基于复杂的算法,如相位声码器或时域。这些算法都在尝试“猜测”,虽然进行频率分析,但需要对某些样本进行剔除或插值。一旦你知道了原始音频的节奏,就很容易调整到新的节奏轨道的节奏。记住,提高音频文件的节奏总是比降低它更好。这是因为在第一个例子中,计算机将消除一些样本。第二个例子需要通过插值的过程生成新的样本。

时间拉伸算法

自Gabor(1946)在颗粒合成方面的早期工作以来,时间拉伸算法就一直在研究。颗粒合成的工作原理是将音频流分成颗粒,这些颗粒是音频片段,例如,长度为100毫秒。为了对音频进行时间扩展,它会重复某些颗粒;为了对音频进行时间压缩,它会从流中删除一些颗粒。颗粒边界之间的交叉褪色有助于最小化伪影。然而,这种方案引入的工件并不明显,但非常小的拉伸因素。

Rabiner和Schafer(1978)开发了一种时域技术,称为时域谐波标度(TDHS)。首先,利用自相关或其他方法估计音频段的基频。然后,为了延长音频的时间,他们使用重叠添加机制将输入音频复制到输出音频缓冲区。这将改变通过输入和输出缓冲区的相对遍历率,以便能够延长音频的时间。遍历输入音频被限制以保持估计基频的基音同步。这种技术也被称为pitch synchronous overlap-add (PSOLA),由Moulines和Laroche(1995)创立。Verhelst和Roelands(1993)提出了一个替代方案。

附加资源和源文本

https://books.google.pt/books?id=YFEWhvhWAkwC&dq=audio+time+stretching&source=gbs_navlinks_s