Bu soruna en iyi nasıl saldıracağımı araştırmaya ve anlamaya çalışıyorum. Müzik işleme, görüntü işleme ve sinyal işlemeyi birleştirir ve bu yüzden ona bakmak için sayısız yol vardır. Saf sig-proc alanında karmaşık görünen şey, görüntü veya müzik işleme yapan insanlar tarafından basit (ve zaten çözülmüş) olabileceğinden, ona yaklaşmanın en iyi yollarını araştırmak istedim. Her neyse, sorun aşağıdaki gibidir:
Sorunun el çizimini affederseniz, aşağıdakileri görebiliriz:
Yukarıdaki şekilde 3 farklı tipte sinyale sahibim. İlki bir pals olduğu gelen frekans içerisine 'adımları' tür için ve tekrarlar. Belirli bir darbe süresine ve belirli bir darbe tekrarlama süresine sahiptir.
İkincisi sadece , ancak daha kısa bir darbe uzunluğuna ve daha hızlı bir darbe tekrarlama frekansına sahiptir.
Sonunda üçüncüsü bir ton .
Sorun, sinyal-1, sinyal-2 ve sinyal-3 arasında ayrım yapabilen bir sınıflandırıcı yazabilmem için bu soruna ne şekilde yaklaşacağım. Yani, sinyallerden birini beslerseniz, bu sinyalin böyle olduğunu söyleyebilmelidir. Hangi en iyi sınıflandırıcı bana çapraz bir karışıklık matrisi verir?
Bazı ek bağlam ve şimdiye kadar ne düşündüğümü:
Söylediğim gibi, bu bir dizi alanı birleştiriyor. Oturup bununla savaşa girmeden önce hangi metodolojilerin mevcut olabileceğini araştırmak istedim. İstemeden tekerleği yeniden icat etmek istemiyorum. Farklı bakış açılarından baktığım bazı düşünceler.
Sinyal İşleme Açısından: Baktığım bir şey, bir Cepstral Analizi yapmak ve daha sonra muhtemelen cepstrumun Gabor Bant Genişliğini , diğer 2'den sinyal-3'ü ayırt etmede kullanmak ve daha sonra ayırt edici sinyalde cepstrumun en yüksek zirvesini ölçmekti. 1 sinyal-2'den. Bu benim şimdiki sinyal işleme çalışma çözümüm.
Görüntü İşleme Açısından Bakış: Burada düşünüyorum çünkü ben spektrogramlar karşısında aslında görüntüler oluşturabilirim, belki bu alandan bir şey kaldırabilir miyim? Bu bölüme yakından aşina değilim, ama Hough Transform'u kullanarak bir 'çizgi' algılaması yapmak ve sonra bir şekilde çizgileri 'saymak' (ne olsa çizgiler ve lekeler değilse?) Ve oradan devam etmeye ne dersiniz ? Tabii ki bir spektrogram aldığım zaman herhangi bir noktada gördüğünüz tüm nabız s zaman ekseni boyunca kayabilir, bu önemli midir? Emin değil...
Müzik İşleme Bakış Açısı: Emin olmak için bir sinyal işleme alt kümesi, ancak sinyal-1'in, müzik proc'taki insanların her zaman gördüğü ve zaten çözdüğü belirli, belki de tekrarlayan (müzikal?) Bir kaliteye sahip olduğu benim için gerçekleşir. belki ayırt edici araçlar? Emin değilim, ama düşünce benim başıma geldi. Belki de bu duruş noktası ona bakmak için en iyi yoldur, zaman alanından bir parça almak ve bu adım oranlarını alay etmek? Yine, bu benim alanım değil, ama bunun daha önce görülmüş bir şey olduğundan çok şüpheliyim ... 3 sinyale farklı müzik aletleri türleri olarak bakabilir miyiz?
Ayrıca, eğitim verilerinin iyi bir miktarına sahip olduğumu da eklemeliyim, bu yüzden belki de bu yöntemlerden bazılarını kullanmak, daha sonra K-En Yakın Komşu'yu kullanabileceğim bazı özellik çıkarımı yapmama izin verebilir , ancak bu sadece bir düşünce.
Her neyse, şu an burada durduğum yer, herhangi bir yardım takdir.
Teşekkürler!
YORUMLARA DAYALI DÜZENLEMELER:
Evet, , , , önceden biliniyor. (Bazı sapmalar ama çok az. Örneğin, diyelim ki = 400 Khz, ama 401.32 Khz olarakf 3 f 4 f 1 f 2 yüzden, yüksek kıyasla 500 Khz de olabilir.) Signal- 1 HER ZAMAN bilinen 4 frekansa adım atacaktır. Sinyal-2 HER ZAMAN 1 frekansa sahip olacaktır.
Üç sinyalin sinyallerinin hepsinin nabız tekrarlama hızları ve nabız uzunlukları da önceden bilinmektedir. (Yine biraz varyans ama çok az). Yine de bazı uyarılar, sinyal tekrarlama oranları ve sinyal 1 ve 2'nin darbe uzunlukları her zaman bilinmektedir, ancak bunlar bir aralıktır. Neyse ki, bu aralıklar hiç örtüşmüyor.
Girdi, gerçek zamanlı olarak gelen sürekli bir zaman serisidir, ancak 1, 2 ve 3 sinyallerinin karşılıklı olarak münhasır olduğunu varsayabiliriz, böylece herhangi bir zamanda bunlardan sadece biri vardır. Ayrıca, herhangi bir zamanda işlemek için ne kadar zaman harcadığınız konusunda çok fazla esnekliğe sahibiz.
Veriler gürültülü olabilir evet ve bilinen f'de olmayan bantlarda sahte tonlar vb.