Bir DCT, DFT yerine bir ses büyüklüğü spektrumu için kullanılabilir mi?


13

Anladığım kadarıyla, DCT aynı boyutta N olan bir DFT olarak kutu boyutunun yarısına sahiptir. DFT ayrıca faz bilgisi içerir, ancak genellikle sadece büyüklük spektrumu istendiğinde buna gerek yoktur.

  • DCT, DFT'nin iki katı yoğunluğa (kutu aralığının yarısı) sahip bir büyüklük spektrumu sağlamak için kullanılabilir mi, yoksa faz dışı bilgiler kaybedilir mi?
  • % 50 örtüşmeye ne dersiniz?

4
DCT'nin faz bilgilerini de içerdiğine inanıyorum, sadece karmaşık sayılar kullanmıyor. "Gerçek FFT" aynı negatif frekansları atarak hafızanın yarısını ve aynı bilgi için hesaplama süresinin yarısını kullanır. "Çift uzunluklu bir FFT'nin gerçek kısmı, sinüzoidal temel fonksiyonlarda yarı örnek faz kayması hariç DCT ile aynıdır"
endolith

Gerçekten de, en azından bir katsayı işareti fakir bir insanın evresi olarak kabul edilebilir
Laurent Duval

Yanıtlar:


3

Evet, DCT yoğunluğun iki katı büyüklük spektrumu sağlamak için kullanılabilir. Çakışmayı tam olarak anlamıyorum, ancak DCT'nin daha az kapsadığı için bir çakışma olacağını düşündünüz. Soruya uygun bir cevap vermek için, çoğunlukla görüntü işlemede DCT kullanımı için hızlı bir inceleme yapmama izin verin.

İlk olarak, bazı varsayımlar yapmamız gerekiyor. DCT'yi kullanmak için gerçek bir sinyale sahip olmanız gerekir. Bu tanım gereği. DCT, N boyutundaki DFT'ye kıyasla kutu boyutunun yarısına sahip olduğunu söylerken, sinyalin düşük frekanslı sinyal olduğunu varsayıyorsunuz. Aksi halde, çok fazla değil.

Sıkıştırmada DCT kullanımı için, görüntünün DFT'si simetrik olacağından, gereksiz bilgi üretir (bir yan ayna sinyali yeniden üretmek için yeterli olacaktır). Bu nedenle, DFT'ye kıyasla daha yoğun bilgi üretmek için DCT çekirdeği kullanılır. Bu aynı zamanda düşük frekanslı ses sinyalleri için de geçerlidir, aynı şekilde kullanılabilir. Yoğunlaştırırken, DCT çekirdeği sinyalin her iki tarafını (gerçek ve hayali parçalar) kapladığından katsayılar büyür.

Benim büyük görüntü işleme olduğunu, bu yüzden görüntü işleme DCT ve DFT kavram ve açıklamalar eşlemeye çalıştım. Görüntü ve ses arasındaki bir fark, boyutlar olabilir. Görüntü işlemede boyutları bilirsiniz (FFT ve diğer işleme amaçları için satır ve sütunlar). Daha fazla işlem yapmak için ses verilerinin vektörünü bir şekilde bölmeniz gerektiğini düşünüyorum. Verileri bilmeden, bu zahmetli olabilir (emin değilim).

İşte web'den alınan bir görüntü, ama onu aldığım yere yazmadım, wikipedia olabilir;

Görüntü işleme

Gördüğünüz gibi, dönüştürülmüş görüntü DCT'de büyüklük spektrumu ile sorunsuz olarak temsil edilmektedir. Daha kompakt ve daha yoğun bir şekilde ve katsayıların büyüklüğüne bakın. DFT'den iki kat daha büyük. DFT simetriktir, sadece ikiye bölebilirsiniz. Bir kısım yedeklidir. Ve bir şey daha, DCT bilgileri DFT'nin sadece yarısı değil, DFT'nin yaklaşık dörtte biri kadar saklayabilir. Bu genellikle görüntülerde DFT'nin üstesinden gelen DCT örneğidir.


Hem X hem de Y boyutlarında gereksiz olduğu için FFT dördüncü bölümlere bölünemez mi?
endolit

Neden FFT daha fazla bilgi içeriyor ve DCT daha fazla sıfır içeriyor?
endolit

İlk soru, tam olarak anlamıyorum, X ve Y boyutları ile ne demek istiyorsun? İkinci soru, çekirdeklerindeki farktan kaynaklanıyor. DCT daha fazla sıfır içeriyor gibi görünmüyor, aslında normal Fourier Dönüşümü'nden (DFT) daha fazla sıfır içeriyor. Bu yine çekirdeklerindeki farklarından kaynaklanmaktadır.
Hephaestus

Demek istediğim, görüntü gerçek bir sinyal, bu nedenle FFT yedek bilgi içeriyor. FFT'nin negatif yarısı her iki boyutta da pozitif yarımın sadece bir aynasıdır.
Endolit

0
  • % 50 örtüşmeye ne dersiniz?

Bu sorudan, yerel, blok işleme, Fourier veya spektrogramın kayması şeklinde gerçekleştirmeyi düşündüğünüzü anlıyorum.

  • DCT, DFT'nin iki katı yoğunluğa (kutu aralığının yarısı) sahip bir büyüklük spektrumu sağlamak için kullanılabilir mi, yoksa faz dışı bilgiler kaybedilir mi?

Büyüklük spektrumu hakkında konuşursanız, elbette fazın bir kısmı (karmaşık bir Fourier katsayısının argümanı veya bir DCT katsayısının işareti olsun) yine de kaybolacaktır .

Elbette kısa vadeli Fourier formülasyonunun içindeki pencereli Fourier dönüşümü yerine yalnızca çok sayıda çekirdek ekleyebilirsiniz. Çeşitli DCT ırkları, üst üste binen versiyonları (LOT, MDCT), güzel ortogonal ve pencere özelliklerine sahip, ters çevrilebilir (sentez).

Ses, (karmaşık olmayan) DCT veya örtüşen versiyonlar genellikle analiz, başlangıç ​​ve hatve tespiti için kullanılır (kör kaynak ayrımı) örneğin A. Liutkus tarafından STFT, MDCT ve Matlab araç kutusunu tersine çevirir. Geniş zamanlı frekans analizi araç (LTFAT) da sahiptir:

  • Doğrusal zaman frekans ölçeği ile hızlı TF dönüşümleri: Gabor (STFT), Wilson ve pencereli MDCT
  • Gabor ve WMDCT alanında seyrek gerileme

Sesi çok iyi bilmiyorum. Ancak, % 50 veya% 75 çakışma çok yaygındır ve çok az kişi başka ayarları kullanır. Bununla birlikte, "tek pencereli" zaman-frekans sınırlamasının üstesinden gelmeye yardımcı olmak için en az iki pencere boyutu , uzun bir sabit parça, geçici bir kısa bir pencere kullanılması çok yaygındır .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.