«audio» etiketlenmiş sorular

Ses veya sinyal işleme açısından, bir ses sinyali, tipik olarak bir elektrik voltajı olarak sesin analog veya dijital bir temsilidir.


3
Başkalarına kendimi nasıl duyduğumu göster
Pekâlâ .. Bu şeyleri düşünüyordum. Hepimiz kendi sesimizden duyduğumuzdan farklı olduğumuzu biliyoruz. Kendisini kaydedip dinleyerek başkalarının bizi nasıl duyduğunu öğrenmek kolaydır. Ama tam tersi ne olacak? Sesimizi başkalarının kendi sesimizi algılarken bizi duyabileceği şekilde dönüştürmenin bir yolu var mı? Bunun oldukça ilginç bir soru olduğunu düşünüyorum. Ne yazık ki bir …

4
Ses Etkinliği Tespiti için Kütüphaneler (Konuşma Tanıma Değil)
Önceki sorumu takip ederken , var olan herhangi bir konuşma algılama kütüphanesi olup olmadığını merak ediyordum. Konuşma algılama ile bir ses arabelleğine geçmek ve konuşmanın başladığı ve durduğu bir dizini geri almak kastediyorum. 44kHz'de 10 saniyelik ses örneklemem varsa, şöyle bir sayı dizisi beklerim: 44000 88000 123000 190334 ... Bu, …
18 audio  speech 

3
insan konuşma gürültü filtresi
Konuşmayı zayıflatan bir filtre bilen var mı? Konuşma tanıma yazılımı yazıyorum ve insan konuşması dışında her şeyi filtrelemek istiyorum. Bu, arka plan gürültüsünü, berbat bir mikrofon tarafından üretilen gürültüyü ve hatta arka plan müziğini içerir. Güç spektrumunun 6 dB'lik düşüşünü telafi eden bir birinci dereceden filtre uyguladım, ancak yine de …

1
FFT Spectrums kullanarak benzer Müzik bul
Farklı Müzik Türleri içeren bir Kütüphanede benzer Şarkıları eşleştirmenin / bulmanın bir yolunu bulmak için birkaç haftadır deniyorum. İlk denemem Tempo gibi özellikleri tespit etmek veya Gruplar oluşturmak için Şarkılar'da ne kadar Bass olduğunu tespit etmekti, ama bu yaklaşımı (Ses Değişikliklerine Dayalı Beat Algılama) çok fazla almadım çünkü Songs Beat'in …
16 audio  fft  music 

4
Ses sınıflandırması için özellik çıkarma
Bir ses dosyasından özellikleri ayıklamak ve sesi belirli bir kategoriye ait olarak sınıflandırmaya çalışıyorum (örneğin: köpek kabuğu, araç motoru vb.). Aşağıdaki konularda netlik istiyorum: 1) Bu hiç yapılabilir mi? Konuşmayı tanıyan ve farklı köpek kabuğu türleri arasında ayrım yapabilen programlar vardır. Ancak bir ses örneği alabilecek ve sadece nasıl bir …

2
Stereo ses sinyalinden vokal kısmı nasıl çıkarılır?
Şimdi MP3 dosyasını işliyorum ve bu sorunla karşılaşıyorum. MP3'im stereo kodlu. Ne yapmak istiyorum daha fazla işlem için ses parçası ayıklamak olduğunu (ne olursa olsun çıkış sinyalleri modu, mono veya stereo her ikisi de Tamam). Bildiğim kadarıyla, ses MP3'teki farklı bağlantısız alt frekans bantlarına kodlanır. Sanırım kesme frekansı doğru ayarlanmış …

4
Düşük frekanslar FFT'de daha güçlü mü?
Mikrofon girişinden FFT hesaplıyorum. Daha düşük frekansların her zaman daha yüksek frekanslardan daha fazla güce (daha yüksek dB) sahip olduğunu fark ettim. Verileri 24576 bayt (4096 * 6) kareye böldüm. Hamming penceresini uygula: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); FFTW üzerinden çalıştırın Process1D(). Karmaşık sayılardan dönüştürün: output[i] = 10.0 * …
15 audio  fft 

1
RMS ile bir parçanın ses şiddetini alma
Arabellekte sakladığım ses parçasının ses şiddetini hesaplamaya çalışıyorum. Tampon, sinyalin PCM verilerini içerir ve Kök Ortalama Karesi kullanarak ne kadar yüksek olduğunu almak istiyorum. Frekans alanına geçmek zorunda kalmadan bunu zaman alanında yapabileceğimi varsayıyorum. Bunu yapmak için sözde kod ne olurdu? Sadece bir saniye (ses [0] - ses [44099], ses …

2
Gülme izi ne zaman devreye giriyor?
Hafta sonu projelerimden biri beni sinyal işlemenin derin sularına getirdi. Bazı ağır görev matematiği gerektiren tüm kod projelerimde olduğu gibi, teorik topraklama eksikliğine rağmen bir çözüme giden yolu düzeltmekten çok mutluyum, ancak bu durumda hiçim yok ve sorunum hakkında bazı tavsiyelerde bulunmak isterim , yani: Bir TV şovu sırasında canlı …

4
Gerçek zamanlı insan hassasiyetiyle ses sinyalinin frekans bileşenlerini çıkarmanın en etkili yolu
Nasıl (mümkünse) FFT benzeri bir şekilde rasgele bir ses örneğinin (genellikle müzik) frekans bileşenlerini ayıklamak için çalışıyorum, ama FFT algoritması üzerine araştırma, ben bazı acı çekiyor öğreniyorum bu amaçla ciddi kısıtlamalar. FFT'nin sunduğu 3 sorun var: FFT bin çözünürlüğü pencere boyutunuza eşdeğer olduğundan, oldukça makul bir doğruluk elde etmek için …

4
Scipy - Ses İşleme
Ses sinyali işleme için iyi araçlar arıyorum. Konuşma ve müzik analizi, otomatik dil tanımlama vb. Scipy kütüphanesi ses işleme için fonksiyonlar sunuyor mu? Ses Sinyali işleme için iyi bir araç var mı? Bunun için bir araç önerebilir misiniz?

2
Hangi bant geçiren filtre tasarımı en kısa dürtü tepkisini verecektir?
500 Hz'lik merkezi frekansa ve 1 oktav bant genişliğine sahip basit bir 2. dereceden IIR bant geçiren Buterworth filtresi tasarlamak bana aşağıdaki frekans tepkisini verir ... Şimdi, dürtü yanıtını alıp normalleştirip dB'ye dönüştürürsem , dürtü yanıtının bozulmasını gözlemleyebiliriz . Dürtü tepkisinin bozulması, bu ölçekte çizildiğinde zamanla yaklaşık olarak doğrusaldır ve …

5
Yalnızca Ses Kaydıyla Şarkının Nereden Başladığını Belirleme
Ben bir kullanıcı her satır arasında bir saniye boşluk, bir şarkının 4 satır söylüyor küçük bir karaoke tarzı bir uygulama var. Destek müziği yok, bu yüzden sadece ses, umarım problemi çözmeyi kolaylaştırır. Kayıt sırasında kullanıcının şarkı 1 no'lu hattı başladığı ve bittiği, 2 no'lu şarkı satırı 2'yi başlattığı ve bittiği …

2
Bir ses sisteminden yankıyı tanımlamak ve kaldırmak için hangi yöntemler kullanılabilir?
Arka fon Bir telefon tipi ayarında kullanmak için tek bir küçük mikrofona ve hoparlörlere sahip bir sistem tasarlıyorum. Verebileceğim en kolay örnek, bilgisayar hoparlörlerinizi ve bir masaüstü mikrofonunu kullandığınız bir Skype görüşmesidir. Hoparlörlerden gelen sesin mikrofon tarafından alınmasından ve orijinal kişiye geri gönderilmesinden endişeliyim. Bunun VoIP konuşmalarının ilk günlerinde her …
14 audio 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.