Frekans çözünürlüğüne karşı zaman, iyi bilinen bir sorundur ve gerçekten bunun üstesinden gelmek için yaklaşımlar vardır. Ses sinyalleri için, yaygın olarak kullanılan tekniklerden bazıları şunlardır: parametrik yöntemler; uyarlanabilir çözünürlük (çeşitli zaman / frekans konfigürasyonları ile analiz edin ve sonuçları bir araya getirin - Wen X. ve M. Sandler, "Birden fazla fourier dönüşümü kullanan kompozit spektrogram"); aşırı tamamlanmış bazlarda dalgacıklar / ayrışmalar; ve frekans piklerinin (IFgram) tam yerini çıkarmak için faz bilgilerinin kullanılması.
Ancak, gösterdiğiniz grafikte bu tekniklerin bazılarının kullanılmadığı görülmektedir; bu yüzden aradığınız şey bu olduğundan şüpheleniyorum. Yatay eksende bir miktar "bulaşma" olduğu görülmektedir (örneğin, t = 1.2s'de) ve bu, analizin parçalar arasında yüksek bir çakışma ile yapıldığına dair kesin bir işarettir.
Gerçekten de, karelerin çakışmasına izin verirseniz yığın süresi ve saniyedeki analiz karesi sayısının birbirine bağlanması gerekmez. Dolayısıyla, 40ms uzunluğunda analiz çerçevesini kullanmak istiyorsanız, şebekenizin olması gerekmez:
çerçeve 1: t = 0..t = 40ms; çerçeve 2: t = 40ms..t = 80ms
Çok iyi olabilir:
çerçeve 1: t = 0..t = 40ms; çerçeve 2: t = 10ms..t = 50ms
Bu üst üste binme, FFT pencere boyutunu çok fazla azaltmadan daha yüksek bir zamansal çözünürlük yanılsaması verebilir. Bunun yalnızca zaman ekseninde bir olayın doğru bir şekilde bulunmasına yardımcı olabileceğini unutmayın - zaman içinde iki olayın çözülmesine yardımcı olmaz ... Tıpkı FFT boyutunun artırılması, bir frekans zirvesinin yerini belirlemeye yardımcı olabilir, ancak iki bitişik frekans tepe noktasının çözünürlüğü.