Kayıt örnekleme oranı olarak neden 44,1 kHz seçiyoruz?


21

İnsanların kulakları, frekansları 20 Hz ile 20 kHz arasında değişen sesleri duyabilir. Nyquist teoremine dayanarak, kayıt oranı en az 40 kHz olmalıdır. 44.1 kHz'i seçmenizin nedeni mi?


4
Video kare hızlarıyla uyumluluk için seçildi. Bkz. En.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F
endolit

Yaklaşık 12-15k üzerindeki frekanslar çok az değer katar veya hiç değer katmaz. 40 yaşın üzerindeki çoğu insan çok az faydalı olacaktır. Bu seviyenin üzerindeki duyulabilirlik.
Chris Heath

Yanıtlar:


32

Her kongre gibi 44.1 kHz seçiminin bir tür tarihsel kaza olduğu doğrudur. Birkaç tarihi neden daha var.

Tabii ki, 20 kHz bant genişliğine sahip yüksek kaliteli ses istiyorsanız, örnekleme hızı 40 kHz'i geçmelidir.

48.0 kHz (24 kare / saniye film ve Kuzey Amerika TV'sinde görünüşte 30 kare / saniye ile güzel uyumlu) yapma tartışması vardı, ancak 120 mm'lik fiziksel boyut göz önüne alındığında, ne kadar veri için bir sınır vardı CD tutabilir ve bir hata algılama ve düzeltme şemasına ihtiyaç duyulduğu ve verilerde biraz fazlalık gerektirdiği göz önüne alındığında , CD'nin depolayabileceği mantıksal veri miktarı (yaklaşık 700 MB) fiziksel veri miktarının yaklaşık yarısı kadardır. 48 kHz oranında, bütün bunlar göz önüne alındığında, bunun Beethoven'in 9. tümünü tutamadım, ama söylendi olabilir biraz daha yavaş bir hızda bir disk üzerindeki tüm 9. tutun. Yani 48 kHz çıktı.

Yine de neden 44.0 ya da 45.0 kHz ya da güzel bir yuvarlak sayı değil?

O zamanlar, 1970'lerin sonlarında , dijital sesin kolayca kullanılabilen video kasete (VHS değil Betamax) kaydedilmesi için tasarlanmış Sony F1 adı verilen bir ürün vardı . Bu 44.1 kHz (ya da daha doğrusu 44.056 kHz) idi. Böylece bu, yeniden örnekleme ve enterpolasyon olmadan kayıtların F1'den CD'ye veya diğer yöne aktarılmasını kolaylaştıracaktır.

Oraya nasıl geldiğine dair anlayışım, NTSC TV'nin yatay tarama hızının 15.750 kHz ve 44.1 kHz'nin tam olarak 2.8 katı olduğu. Tamamen emin değilim, ama bunun anlamı, yatay çizgi başına üç stereo örnek çiftine sahip olabileceğinize ve normalde 15 örneğiniz olacağı her 5 satır için, 14 örnek artı bazıları için ek bir örnek olduğuna inanıyorum. F1'de eşlik denetimi veya artıklık. 5 satır için 14 örnek, yatay satır başına 2.8 örnek ile aynıdır ve saniyede 15.750 satır ile saniyede 44.100 örnek olarak ortaya çıkar.

Şimdi, renkli TV tanıtıldığından beri yatay çizgi hızını saniyede 15734 satıra düşürmek zorunda kaldılar. Bu ayarlama, Sony F1'de saniyede 44.056 örneğe yol açar.


8

Örneğin http://www1.cs.columbia.edu/~hgs/audio/44.1.html adresine bakın . Kenar yumuşatma filtreleri nedeniyle örnekleme hızını 40 kHz'den fazla kullanmalısınız. Filtrenin yanıt eğiminden dolayı sinyal bozulmasını önlemek için bazı frekans rezervleriniz olmalıdır. Ses kaydı standardı 1979'da tartışılırken 44,1 kHz gerçek değeri Sony corp tarafından önerildi. Bu hızı o an için yaygın olarak kullandılar.

Bu genellikle tarihi bir nedendir.


6

Dijital formatlara geçişte ses, siyah veya beyaz olarak görülebilen (ikili formatı temsil eden) sahte video dalga formunda saklandı.

Televizyon standardının kullandığı alan hızı ve yapısı 60 Hz video için aşağıdaki gibidir: alan başına 245 satır (ilk 35 boş satır hariç). Satır başına üç örnek ile 60 x 245 x 3 = 44100 = 44,1 KHz yapar.

Bu kural, daha sonra ekipman uyumluluğu kaygıları nedeniyle CD formatı için kullanılmıştır (CD çoğaltması için kullanılan CD master'ları üretmek için kullanılan ilk ekipman video tabanlıdır).

Kaynak: Ses Üreme Sanatı, s. 228


F1'in yaptığı şey ise "düzeltilmiş duruyorum" demeliyim. F1'in boş satırlar kullandığını farz ettim.
robert bristow-johnson

merhaba, ben sadece burada "NTSC renk kodlaması saniyede 30 / 1.001 (yaklaşık 29.97) titreşimli video karelerinden oluşan System M televizyon sinyali ile birlikte kullanıldığını okudum . Her kare 262.5 oluşan iki alandan oluşur toplam 525 tarama çizgisi için tarama çizgileri. 483 tarama çizgisi görünür rasterleri oluşturur.
490 satır bile bazı (orijinal NTSC) boş satırlar kullanır.
robert bristow-johnson

0

Tipik statik sinüzoidal dalgalardan ziyade "dinamik" zaman çözünürlüğü perspektifinden bakıldığında insanlar için yürürlük sınırının 20 kHz'den çok daha yüksek olabileceği görülmektedir. Ayrıca yeniden yapılandırma filtrelemesi için 20kHz ve 22kHz arasındaki marj hakkında ilginç yorumlar. Aslında, Peter Craven'in hi-fi oynatımı için en az 96kHz olduğunu savunan zaman alanlı optimize filtreleme üzerinde ilginç bir çalışma oldu.

Pawel


Bunu öğrenmenin bir yolu var. buna Blind AB Testing deniyor . olması gerekmez Çift-kör (ama normalde). ve AB testi bence ABX testinden daha iyidir.
robert bristow-johnson

0

https://en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F Nyquist – Shannon örnekleme teoremi, örnekleme frekansının çoğaltmak istediği maksimum frekansın iki katından fazla olması gerektiğini söylüyor. İnsan işitme aralığı kabaca 20 Hz ila 20.000 Hz olduğundan, örnekleme hızının 40 kHz'den yüksek olması gerekiyordu.

Ayrıca, örtüşme önlemek için örneklemeden önce sinyallerin düşük geçişli filtrelenmesi gerekir. İdeal bir düşük geçiş filtresi 20 kHz altındaki frekansları mükemmel bir şekilde geçirirken (onları azaltmadan) ve 20 kHz üzerindeki frekansları mükemmel bir şekilde keserken, böyle bir ideal filtre teorik olarak imkansızdır (nedensel değildir), bu yüzden pratikte bir geçiş bandı gereklidir, burada frekanslar kısmen zayıflatılır. Bu geçiş bandı ne kadar geniş olursa, bir kenar yumuşatma filtresi yapmak o kadar kolay ve ekonomiktir. 44,1 kHz örnekleme frekansı 2,05 kHz geçiş bandına izin verir.

Buna ek olarak, 44.100 ilk dört asal sayının (2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2) karelerinin ürünüdür ve bu nedenle birçok yararlı küçük faktöre sahiptir.


yani birim zamanımızı ikinci saatten 1.001 saniye olan "farg" e değiştirirsek , bu 44100 ve birçok yararlı küçük faktöre ne yapar?
robert bristow-johnson

-2

Açıklama için [ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphone adresine bakın . Nyquist örnekleme teoremi adı verilen bir teorem, önemli bir kalite kaybı olmadan X Hz sinyalini örneklemek için frekansı 2X'de örneklemeniz gerektiğini belirtir. İnsan işitme sınırı yaklaşık 20kHz'dir, bu nedenle yaklaşık 40Khz'lik bir örnekleme hızı gerektirir. Bu yüzden CD'ler 44 Khz'da örneklenmiştir. yani bir CD'ye kaydın her saniyesi kayıtta mümkün olan en yüksek frekansın 44.000 ölçümünü içerir.


Aslında, bu yüzden değil ...
jojek

Kısmen bu yüzden. bir insanın 20k'nin üzerinde duyması nadirdir, bu nedenle bir audiophile aralığı makul bir şekilde 40kHz'in üzerindedir, yani 42, 43, 44. 22k'de büyük sinüs dalgaları olan birini patlatırsanız, sadece bir çocuğun duyma şansı vardır. yarasalar 115kHz ve bazı yunuslar 150kHz'de. Yüksek frekans algınızı çevrimiçi kayıtlarla test edin ... yani burada audiocheck.net/audiotests_frequencycheckhigh.php
com.prehensible
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.