Düz FFT büyüklük spektrumu yerine PSD'yi ne zaman hesaplamalıyım?


12

44.1 kHz'de örneklenmiş otuz saniyelik bir konuşma sinyalim var. Şimdi konuşmanın hangi frekanslarda olduğunu göstermek istiyorum. Ancak, bunu yapmanın en iyi yolunun ne olacağından emin değilim. Bazen bir Fourier dönüşümünün mutlak değerini ve bazen de güç spektral yoğunluğunu hesaplar. Doğru anlarsam, ikincisi sinyalimi parçalara bölerim, FFT'yi parça parça yapar ve bir şekilde bunları toplarım. Pencere fonksiyonları bir şekilde söz konusudur. Bunu benim için biraz açıklayabilir misiniz? DSP'de yeniyim.


1
Sinyali parçalara ayırmak, her birinin spektrumunu bulmak ve daha sonra spektrumların ortalamasını almak gürültüyü azaltmaya yardımcı olabilir, ancak çözünürlüğü de azaltır. bkz. en.wikipedia.org/wiki/Welch%27s_method
endolit

Yanıtlar:


8

Şimdi konuşmanın hangi frekanslarda olduğunu göstermek istiyorum. Ancak, bunu yapmanın en iyi yolunun ne olacağından emin değilim. Bazen bir Fourier dönüşümünün mutlak değerini ve bazen de güç spektral yoğunluğunu hesaplar.

Analizinize fiziksel anlam eklemek istiyorsanız, güç spektral yoğunluğu (PSD) ile devam edin. Bunun nedeni, bunun her bir frekans bandında size sinyalin gücünü vermesidir. Öte yandan, fiziksel bir anlam istemiyorsanız / umursamıyorsanız, ancak her bir bandın dört büyüklüğünün birbirine göre nasıl değiştiğini bilmek istiyorsanız, mutlak büyüklüğe bağlı kalabilirsiniz.

x[n]X(f)|X(f)||X(f)|2

Doğru anlarsam, ikincisi sinyalimi parçalara bölerim, FFT'yi parça parça yapar ve bir şekilde bunları toplarım. Pencere fonksiyonları bir şekilde söz konusudur. Bunu benim için biraz açıklayabilir misiniz? DSP'de yeniyim.

Hayır, bu doğru değil. Burada bahsettiğiniz şey Kısa Süreli Fourier Dönüşümü (STFT). Bu sadece zaman alanı sinyalinizi doğramak, dul etmek ve daha sonra dörtlü trnasform almaktır. Günün sonunda yine de karmaşık bir matrisiniz olacak. Mutlak büyüklüğünü almayı seçerseniz, mutlak büyüklükte bir fourier dönüşüm matrisine sahip olursunuz. Mutlak büyüklüğünün karesini alırsanız, bir güç spektral yoğunluk matrisine sahip olursunuz.


3

Bir konuşma sinyali gibi bir şey hakkında anlaşılması gereken önemli şey, frekans bileşenlerinin zamanla değişmesidir . Frekans alanında konuşmayı temsil etmek için, genellikle konuşmanın spektrumunun önemli ölçüde değişmediğini (tipik olarak 10 ms) varsayabileceğimiz sinyalin yeterince kısa bir penceresini alırız. Bu nedenle, STFT'yi (genellikle pencereler arasında bir miktar örtüşmeyle) kullanarak her ardışık 10 ms'lik pencere için güç spektrumunu hesaplıyoruz ve her ardışık spektrumu söz konusu zamanda konuşmanın frekans bileşenlerinin "anlık görüntüsü" olarak ele alıyoruz . Genellikle ardışık spektrumlar, spektrogram gibi bir 3D grafikte çizilir., X eksenindeki zaman, Y eksenindeki frekans ve her X, Y konumunda yanlış renk veya gri tonlama yoğunluğu olarak çizilen büyüklük.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.