共计 978 个字符,预计需要花费 3 分钟才能阅读完成。
时间:2019 年 2 月版本:1.7.1(最新版本的 1.7.2 不知道为啥总是解压失败)
Introduction
Basic Operators
Feature Extractors
Dynamics
Rhythm
处理音频信号中对于节奏的估计
mirfluctuation
估计节奏的一种方法是基于变换的频谱图计算(FFT),通过听觉建模,然后是每个频段的频谱估计(Pampalk 等,2002)。mirfluctuation 就是 Pampalk 提出的模型。默认参数为 23ms/frame,频率 80Hz。默认用的是 Bark bands,可以使用 mirfluctuation(…, ‘Mel’) 替换为 Mel 波段。(下图均为左图是 Mel bands,右图)s = mirspectrum(rag,’Frame’,.023,’s’,80,’Hz’,’Power’,’Terhardt’,’Mel’,’Mask’,’dB’) 和 s = mirspectrum(rag,’Frame’,.023,’s’,80,’Hz’,’Power’,’Terhardt’,’Bark’,’Mask’,’dB’) 获得未经 FFT 的结果:
f = mirspectrum(s, ‘AlongBands’, ‘Max’, 10, ‘MinRes’, .01,’Window’, 0, ‘Resonance’, ‘Fluctuation’, ‘NormalLength’) 进行 FFT(FFT 的参数为.01Hz,使用 mirfluctuation(…, ‘MinRes’, mr) 修改)。横坐标频率,纵坐标波段。横坐标默认是 10Hz(mirfluctuation(…, ‘Max’, m) 修改最大值),纵坐标 25-bands(Bark bands 应该是 20 啊?为啥是 25),使用 Mel bands 后纵坐标为 40-bands。
mirfluctuation(…, ‘Summary’) 获得统计信息:
也可以使用 mirsum(f) 生成,可以应用到所有二维形式结果的统计。
修改默认参数:
>> mirfluctuation(rag, ‘InnerFrame’, 0.010, 30)
mirbeatspectrum
节奏频谱,通过计算时滞函数的自相似性,相似矩阵,参考 mirsimatrix。
Q:为什么横坐标只到 4s?
#mirevents (previously mironsets)
Timbre