Bazı yerlerde, müziğin çoğunlukla 44.1 kHz'de örneklendiğini, ancak yalnızca 20 kHz'e kadar dinleyebildiğimizi okudum. Neden o?
Bazı yerlerde, müziğin çoğunlukla 44.1 kHz'de örneklendiğini, ancak yalnızca 20 kHz'e kadar dinleyebildiğimizi okudum. Neden o?
Yanıtlar:
Mantığın birçok yerde yayınlandığını unutmayın: Wikipedia: Neden 44,1 kHz?
44,100 Sony tarafından seçildi çünkü ilk dört asal sayının karelerinin ürünü. Bu, dijital örneklemede yararlı bir özellik olan birçok diğer tüm numaralarla bölünebilir olmasını sağlar .
44100 = 2^2 * 3^2 * 5^2 * 7^2
Sizin de fark ettiğiniz gibi, 44100, insan işitme sınırının hemen üstünde iki katına çıktı. Sadece yukarıdaki kısım nedenle (daha az cips reddedilen) onları daha az pahalı hale filtreleri biraz daha pay verir.
As Russell yorumlarda işaret, diğer birçok tam sayılar ile bölünebilir yönüyle örnek oranı seçildi anda hemen bir parası vardı. Bölgeye bağlı olarak NTSC veya PAL video özelliklerini destekleyen mevcut analog video kayıt ortamına erken dijital ses kaydedildi . NTSC ve PAL, LCM'nin (Hat başına Örneklerle birlikte) 44100 olduğu Alan başına Farklı Hatlara ve Saniyedeki Alanlara oranlarına sahiptir .
Nyquist oranı, belirsizlik olmadan yakalamak istediğiniz temel bant sinyalinin bant sınırının iki katının üzerindedir (ör. Takma).
20kHz'in iki katından daha düşük bir hızda numune alın, ve çok yüksek ve çok düşük frekanslar arasındaki farkı sadece örneklere bakmaktan, takma işleminden dolayı söyleyemezsiniz.
Eklendi: Herhangi bir sonlu uzunluk sinyalinin frekans alanında sonsuz bir desteğe sahip olduğunu, bu nedenle kesinlikle bant sınırlaması olmadığını unutmayın. Bu, sınırsız herhangi bir ses kaynağının , en yüksek frekans spektrumunun (bir temel bant sinyalinde) iki katının biraz üzerinde) örneklemesinin , önemli takma işlemlerini önlemek için (sadece sonlu filtre geçişi yuvarlama sebeplerinin ötesinde) gerekli olmasının bir başka nedenidir .
Temel olarak, iki kez bant genişliği sinyal örneklemesi için ortak bir gereksinimdir, bu nedenle kHz minimumdur. Ardından, kusurlu filtreleme ve miktar belirleme ile baş etmek için biraz daha faydalıdır . Detaylar takip ediyor.
Teoride ihtiyacınız olan şey pratikte ihtiyaç duyulan şey değildir. Bu (çoğu kişiye atfedilen) alıntı boyunca devam eder:
Teoride teori ile pratik arasında bir fark yoktur. Uygulamada var.
Ses konusunda uzman değilim, ancak yüksek kaliteli ses örnekleme / sıkıştırma uzmanları tarafından eğitildim. Bilgim paslanmış olabilir, dikkatle alın.
İlk olarak, standart örnekleme teorisi bazı varsayımlar altında çalışır: doğrusal sistemler ve zamanla değişmezlik. Ardından, teorik olarak, kayıpsız olarak bant genişliğinin yaklaşık iki katı (veya temel bant sinyalleri için maksimum frekansın iki katı) olarak örneklenebileceği sürekli bir bant sınırsız fenomeni bilinmektedir. "Nyquist oranı" genellikle şöyle tanımlanır:
bir sinyal hangi minimum hızı edilebilir hataları tanıtan olmadan örneklenmiş
Bu, "örnekleme teoremi" nin analiz kısmıdır. "Olabilir" önemlidir. Bir sentez bölümü vardır: sürekli sinyal , kardinal sinüsler kullanılarak benzer şekilde "yeniden oluşturulabilir". Tek teknik bu değildir ve düşük geçişli ön filtreleme, doğrusal olmayan (niceleme, doygunluk gibi) ve diğer zaman-değişken faktörlerini hesaba katmaz.
İnsani duymak basit bir konu değil. İnsanların 20 Hz'den 20.000 Hz'e kadar frekansları duyduğu kabul edilir. Ancak Hertz'deki bu kesin sınırlar tüm insanlar için doğanın bir özelliği değildir. Yaşla birlikte, daha yüksek frekanslara kademeli olarak hassasiyet kaybı yaşar. Diğer tarafta:
İdeal laboratuvar koşullarında, insanlar 12 Hz kadar düşük ve 28 kHz kadar yüksek sesler duyabilir, ancak eşik yetişkinlerde 15 kHz'de keskin bir şekilde artar
İşitme doğrusal değildir: seçmeler ve acı çeken eşikler vardır . Zamanla değişmez. Hem zaman hem de frekansta maskeleme efektleri vardır.
Eğer 20 Hz ila 20.000 Hz bandına kadar ortak bir aralık ise ve 40.000 Hz teorik olarak yeterli ise, ekstra bozulma ile başa çıkmak için biraz ekstra gerekir. Bir kural,% 10 daha fazlasının tamam olduğunu ( sinyal bant genişliğinin) ve 44,100 Hz'nin sadece bunu yaptığını söylüyor . 1970'lerin sonlarına kadar uzanır. Neden 44,000 Hz kullanılmıyor? Esas olarak, teknolojisi her zaman olduğu gibi değişime dayanan CD'lerin popülaritesi tarafından belirlenen standartlar nedeniyle. Ayrıca, 44.100, ilk dört asal sayıdaki karelerin ürünüdür ( ), bu nedenle hesaplamalar için yararlı olan küçük faktörler vardır (FFT gibi).
Bu yüzden ile (ve katları) güvenlik, niceleme, kullanılabilirlik, hesaplamalar ve standartlar arasında bir dengemiz var.
Diğer seçenekler var: örneğin DAT formatı başlangıçta zor dönüşümle birlikte 48 kHz örneklemeyle yayınlandı. 96 kHz, niceleme (veya bit derinliği) açısından hangi örnekleme hızını ve bit derinliğini kullanmalıyım? Bu tartışmalı bir konudur, 24 bit 96kHz ve 24 bit 48kHz'e bakınız . Örneğin Audacity örnekleme oranlarını kontrol edebilirsiniz .
Neden tam olarak 44,1 kHz olduğu zaten cevaplandı - ancak sorunuzu insan algısı sınırına ilişkin yönüne odaklamak için sebep oldukça basit.
Zaman içindeki çözünürlük, algılanabilir sınırlara kadar tüm olası dalga formlarını üretebilecek kadar iyi olmalıdır. Örnekleme teoremine göre , çözünürlük örnekleme frekansının bu frekansın en az iki katı olacağı şekilde olmalıdır. Sezgisel olarak, en yüksek frekansta, sinyalinizin maksimumunu ve minimumunu temsil etmek için en az 2 noktaya ihtiyacınız vardır - bu Ascii-art kare dalgasını verir:
_ _
|_| |_
Bir sinyali güvenilir bir şekilde çoğaltmak için, örnekleme hızı ne kadar yüksekse o kadar iyidir. ~ 40 kHz seçildi, çünkü çoğu insan için (yeniden yapılandığında) farkı söyleyemediği düşük bir örnekleme oranıydı. Ses örneklemesi yapıldığında, bellek ve depolama pahalıydı ve daha yüksek örnekleme oranları ucuza mümkün değildi.
İnsanın işitme duyusunun üst sınırının iki katında, döngü başına iki örnek, yeniden örnekleme sinyalleri için Nyquist kriterlerini karşılasa bile, yeniden yapılanma çok düşüktür, döngü başına iki örnek içeren bir sinüs dalgasını gösteren döngüsel örnek gösteren basit bir çizelge bir dalga biçimini çoğaltırken. Kelimenin tam anlamıyla bir sinüs dalgasını kare dalgaya dönüştürebilirsiniz; 20 kHz'de kimsenin söyleyemediği bir şey. Bahse girerim bir köpek yapabilir.