Ham mikrofon girişini analiz edecek ve oyuncuya ne kadar iyi şarkı söylediğini söyleyecek bir şarkı oyunu uygulamaya çalışıyorum. Bunun gerçek zamanlı yapılması gerekiyor.
Aynı soruyu soran birçok konuya rastladım, ancak muhtemelen alandaki deneyim eksikliğimden ve sığ matematik arka planımdan dolayı hala bitirmedim. DSPDimension web sitesi adım kaydırma makalesine dayanan bir algoritma uyguladım: http://www.dspdimension.com/admin/pitch-shifting-using-the-ft/
Makalenin açıkladığı gibi gerçek frekansı ve büyüklüğü çıkarıyorum, ancak bununla temel frekansı bulacağımı bilmiyorum. Ben en büyük büyüklüğü ile bin almaya çalıştım ama bu sadece daha yüksek perde sinyalleri için bana doğru sonuçlar vermek, hangi aşırı örnekleme faktörü kullandığım önemli değil hala düşük frekans sinyalleri için kötü veri olsun. Bu yaklaşım tamamen yanlış mı yoksa doğru yolda mıyım, ama sadece bir şey mi eksik?
Şimdiden teşekkürler,
EDIT: Ben sadece pitch sınıf ilgileniyorum bahsetmeyi unuttum, bu yüzden temel eksikse Tamam ama örnek güçlü bir ton var.
EDIT2: Herkese teşekkürler, algoritmanın cazibe gibi çalışan bir sürümünü bitirdim. Düşük perde tahmin problemi girdi testimden kaynaklandı. Notu söylediğimde doğru eşleşti. Ayrıca, sadece en yüksek zirveyi değil, tüm harmonikleri düşünüyorum.