2
MFCC çıkarma işlemindeki DCT adımını nasıl yorumlayabilirim?
Çoğu ses işleme görevinde, en çok kullanılan dönüşümlerden biri MFCC'dir (Mel-frekans cepstral katsayıları) . Çoğunlukla MFCC'nin arkasındaki matematiği biliyorum: Hem filtre bankası adımını hem de Mel frekansı ölçeklendirmesini anlıyorum. DCT (Ayrık Kosinüs Dönüşümü) adımı: Bu adımda ne tür bilgiler alabilirim? Bu adımın iyi bir görsel temsili nedir?