Bir ses dosyasından özellikleri ayıklamak ve sesi belirli bir kategoriye ait olarak sınıflandırmaya çalışıyorum (örneğin: köpek kabuğu, araç motoru vb.). Aşağıdaki konularda netlik istiyorum:
1) Bu hiç yapılabilir mi? Konuşmayı tanıyan ve farklı köpek kabuğu türleri arasında ayrım yapabilen programlar vardır. Ancak bir ses örneği alabilecek ve sadece nasıl bir ses olduğunu söyleyebilecek bir programa sahip olmak mümkün mü? (Başvurulması gereken çok sayıda ses örneği içeren bir veritabanı olduğunu varsayın). Giriş ses örnekleri biraz gürültülü olabilir (mikrofon girişi).
2) İlk adımın ses özelliği çıkarma olduğunu varsayıyorum. Bu makalede MFCC'lerin çıkarılması ve bir makine öğrenme algoritmasına beslenmesi önerilmektedir. MFCC yeterli mi? Genel olarak ses sınıflandırması için kullanılan başka özellikler var mı?
Zaman ayırdığınız için teşekkür ederim.