«mfcc» etiketlenmiş sorular

2
MFCC çıkarma işlemindeki DCT adımını nasıl yorumlayabilirim?
Çoğu ses işleme görevinde, en çok kullanılan dönüşümlerden biri MFCC'dir (Mel-frekans cepstral katsayıları) . Çoğunlukla MFCC'nin arkasındaki matematiği biliyorum: Hem filtre bankası adımını hem de Mel frekansı ölçeklendirmesini anlıyorum. DCT (Ayrık Kosinüs Dönüşümü) adımı: Bu adımda ne tür bilgiler alabilirim? Bu adımın iyi bir görsel temsili nedir?

1
MFCC'lerin hesaplanmasına / anlaşılmasına yardımcı olun: Mel-Frequency Cepstrum Katsayıları
Çevrimiçi olarak bitleri ve parçaları okuyorum ama hepsini bir araya getiremiyorum. Bunun için yeterli önkoşullar olması gereken sinyaller / DSP şeyleri hakkında temel bilgilerim var. Sonunda Java'da bu algoritmayı kodlamakla ilgileniyorum ama tam olarak anlamadım, bu yüzden buradayım (matematik olarak sayılıyor, değil mi?). İşte bilgimdeki boşluklarla birlikte nasıl çalıştığını düşünüyorum. …

4
Ses sınıflandırması için özellik çıkarma
Bir ses dosyasından özellikleri ayıklamak ve sesi belirli bir kategoriye ait olarak sınıflandırmaya çalışıyorum (örneğin: köpek kabuğu, araç motoru vb.). Aşağıdaki konularda netlik istiyorum: 1) Bu hiç yapılabilir mi? Konuşmayı tanıyan ve farklı köpek kabuğu türleri arasında ayrım yapabilen programlar vardır. Ancak bir ses örneği alabilecek ve sadece nasıl bir …

1
Cepstral Ortalama Normalizasyonu
Herkes Cepstral Ortalama Normalizasyonu hakkında bilgi verebilir mi, evrişimin eşdeğerlik özelliği bunu nasıl etkiler? MFCC Tabanlı Hoparlör Tanıma'da CMN yapmak gerekir mi? Evrişim mülkiyeti neden MFCC için temel ihtiyaçtır? Bu sinyal işleme konusunda çok yeniyim. Lütfen yardım et
15 mfcc 

3
Bu MFCC hesaplamasında DCT adımının doğru bir yorumu mu?
Bu, burada tartışmanın devamıdır . Orada yorum yapardım, ama 50 temsilcim yok, bu yüzden yeni bir soru soruyorum. MFCC hesaplama sürecinde DCT adımını şu şekilde anlıyorum: Arkasındaki mantık, filtrelerin çakışması nedeniyle log-spektral büyüklüklerdeki (filtre bankasından) korelasyonu ayırmaktır. Esasen, DCT bu log-spektral büyüklüklerin verdiği spektrum temsilini yumuşatır. Aşağıdaki görüntüdeki mavi çizginin, …
9 mfcc  dct 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.