Fourier dönüşümü genel olarak ses frekans analizi için kullanılır. Bununla birlikte, insanın ses algısını analiz etme konusunda bazı dezavantajları vardır. Örneğin, frekans bölmeleri doğrusaldır, oysa insan kulağı frekansa doğrusal olarak değil logaritmik olarak tepki verir .
Dalgacık dönüşümleri , Fourier dönüşümünün aksine farklı frekans aralıkları için çözünürlüğü değiştirebilir . Özelliklerini dalgacık dönüşümü yüksek frekanslar için kısa zamansal genişlikleri muhafaza ederken düşük frekanslar için büyük zamansal destek sağlar.
Dalgacık Morlet yakından işitme insan algısı ile ilgilidir. Müzik transkripsiyonuna uygulanabilir ve Fourier dönüşüm teknikleri kullanılarak mümkün olmayan çok doğru sonuçlar verir. Her nota için net bir başlangıç ve bitiş zamanı ile tekrarlanan ve değişen müzik notalarının kısa patlamalarını yakalayabilir.
Sabit S dönüşümü (yakından dalgacık dönüşümü Morlet ile ilgili), aynı zamanda bir de müzik verileri için uygun . Dönüşümün çıktısı, log frekansına karşı etkili bir genlik / faz olduğundan, belirli bir aralığı etkili bir şekilde kapsamak için daha az spektral bölme gerekir ve bu, frekanslar birkaç oktav içerdiğinde yararlı olur.
Dönüşüm, işitsel uygulamalar için arzu edilen daha yüksek frekans bölmeleriyle frekans çözünürlüğünde bir azalma sergiler. İnsan işitsel sistemini yansıtır, böylece daha düşük frekanslarda spektral çözünürlük daha iyidir, zamansal çözünürlük daha yüksek frekanslarda iyileşir.
Benim sorum şu: İnsan işitsel sistemini yakından taklit eden başka dönüşümler var mı? İnsan işitsel sistemine mümkün olduğunca anatomik / nörolojik olarak uyan bir dönüşüm tasarlamaya çalışan var mı?
Örneğin, insan kulağının ses yoğunluğuna logaritmik bir yanıtı olduğu bilinmektedir . Eşit ses yüksekliği konturlarının sadece yoğunlukla değil , spektral bileşenlerin frekansındaki aralıkla da değiştiği bilinmektedir . Birçok kritik bantta spektral bileşenler içeren sesler, toplam ses basıncı sabit kalsa bile daha yüksek olarak algılanır.
Son olarak, insan kulağının frekansa bağlı sınırlı bir zamansal çözünürlüğü vardır . Belki de bu dikkate alınabilir.