Doğrusal Öngörülü Kodlamanın (LPC) Arkasındaki Teori


9
  • LPC'nin arkasındaki teori nedir?
  • LPC'nin bazı uygulamalarının neden diğer sıkıştırılmış ses kodlama şemalarından daha iletim veya kodlama hataları nicelemesine daha toleranslı olduğu söyleniyor ?

  • LPC yöntemleri, Kalman filtre yöntemlerinin kullanımına benzer şekilde düzleştirme veya kısa vadeli "tahmin" için de kullanılabilir mi?

  • Hangi koşullar veya kısıtlamalar altında LPC kullanımı geçerlidir?

"LPC'nin iletim ve kodlama hatalarına neden diğer bazı sıkıştırılmış ses kodlama şemalarından daha toleranslı olduğu söyleniyordu?" Bunu kim söyledi? LPC'yi çok iyi bilmiyorum, ama bunun ters etki yaratacak olan fazlalığı azaltmakla ilgili olduğunu düşündüm.
endolit

Bu soru olduğunu yanıltıcı yanlış öncül olduğu gibi. Lütfen bunu kapatın ve düzeltin.
Dipan Mehta

Burada birden fazla soru ve tesis var. Hangisinin onarılması gerektiğini düşünüyorsunuz?
hotpaw2

1
İfadesi Why are(were) certain implementations of LPC said to be more tolerant of transmission or encoding errors quantization than other compressed voice encoding schemes?oldukça yanlıştır. Özellikle diğerinden daha iyi olanı belirten herhangi bir referans gösterebilir misiniz?
Dipan Mehta

1
Aslında bu benim sorum. Bunu bir yerde duydum, ama bunun neden ifade edilmiş olabileceğini bilmiyorum.
hotpaw2

Yanıtlar:


14

Birincisi, doğrusal öngörücü kodlamanın (LPC) "iletim veya kodlama hatalarına daha toleranslı" olduğunu söylemek tamamen doğru değildir. Katsayıların iletildiği form büyük bir fark yaratır. Örneğin, doğrusal tahmin katsayıları çözülürse, yüksek dereceli IIR filtre katsayılarına çok benzer şekilde nicelleştirmeye çok duyarlı olabilirler (bunun nedeni sentez filtresinin IIR olması, ancak daha sonra bunun üzerinde olması). Bununla birlikte, başka bir şekilde bulaşırlarsa, bu sorun kolayca hafifletilebilir.

Bunun bir yolu yansıma katsayılarını aktarmaktır. Bir k-sıra sıra doğrusal tahmin filtresi için özyinelemeli olarak çözerseniz, her aşamadaki en yüksek sıra katsayısına yansıma katsayısı denir. Bunlar sistemi (Levinson özyinelemesinden kolayca görülebilen) tamamen karakterize etmek için birlikte kullanılabilir. Aslında, hepsini bir kafes filtresi oluşturmak için birlikte kullanabilirsiniz. Bu filtreler, nicemleme bir sorun olduğunda, düşük bit sayımlarına göre çok daha sağlam oldukları için kullanılır. Buna ek olarak, bu yansıma katsayılarının büyüklüğü birlik tarafından sınırlandırılırsa, filtrenin sinyalinizi sentezlemek için kullanıldığı LPC için kritik olan bir BIBO kararlı filtrenin garantisini alırsınız. Çizgi spektral çiftleri gibi, sık kullanılan, ancak kullanılan diğer yöntemler de vardır.

Şimdi, ilk soruyu ele almak için, LPC teorisi vokal kanalı modellemesi etrafında dönmektedir. Esasen, konuşmayı hava titreşimli olarak, bazı yapıların bir tüpüne girdi olarak modelliyoruz. Bu modeli (tüplerin uzunluğu, hava yoğunluğu, yapı vb.) Etmek için çok daha fazla ayrıntıya giren bazı kaynakları arayabilirsiniz. Bu kaynaklar, bu yapıları doğrudan, örneğin çeşitli uyaranlara, beyaz gürültüye yanıt veren IIR filtreleriyle ilişkilendirir.

Dolayısıyla, doğrusal tahmin katsayılarını çözdüğümüzde, katsayıları arıyoruz, böylece sinyalimizi (örneğin ses) katsayılardan oluşturulan bir FIR filtresine girersek, çıktı olarak beyaz gürültü elde ederiz. Bunun ne anlama geldiğini düşünün. Yüksek oranda giriyoruzkorelasyonlu sinyal ve bir beyaz gürültü dizisi çıkışı. Aslında, bu sinyalin tüm doğrusal bağımlılığını ortadan kaldırıyoruz. Buna bakmanın bir başka yolu, tüm anlamlı bilgilerin, bu doğrusal bağımlılığı ortadan kaldıran katsayılarda yer almasıdır. Bu nedenle, bu katsayıları (veya yukarıdaki gibi bir formunu) aktarabiliriz ve alıcı uç sinyali yeniden oluşturabilir. Bu, bir IIR filtresi oluşturmak için doğrusal tahminli FIR filtresini ters çevirerek ve beyaz parazit girerek yapılır. Böylece sıkıştırma, bu doğrusal bağımlılığın giderilmesinden ve katsayıların aktarılmasından kaynaklanır. Bu nedenle Burg yöntemine bazen doğrusal tahmin filtresindeki çıkış gürültüsünün "rasgeleliğini" veya beyazlığını en üst düzeye çıkarmayı amaçladığı için maksimum entropi yöntemi de denir. Buna bakmanın başka bir yolu,

Son sorunuza cevap vermek için, tamamen ne sorduğunuzdan emin değilim. LPC veya doğrusal kestirimci kodlama, daha önce tartışıldığı gibi verimli bir şekilde modellenebileceğini varsayarak sinyali "sıkıştırmak" anlamına gelir. Bahsettiğiniz gibi "kısa vadeli tahmin" yapmak için kesinlikle doğrusal tahmin kullanabilirsiniz. Bu, güç spektral yoğunluk tahmini için kullanılan yüksek çözünürlüklü AR yöntemlerinin ardındaki örtülü temeldir. Otokorelasyon sekansı, penceresiz sekansın teorik otokorelasyon sekansı olarak sınırlı veri kaydından sonsuza kadar sonlu formundan özyinelemeli olarak genişletilebilir. Bu nedenle PSD tahmininin AR yöntemleri yan lob fenomeni sergilememektedir.


1
"LPC teorisi vokal kanalı modellemesi etrafında dönüyor" Bu her zaman doğru mu? FLAC, yalnızca ses değil, genel ses dalga formlarında LPC kullanır.
endolit

3
Özür dilerim, ilk olarak vokal akorlarının analojisini, nereden geldiğini fiziksel bir model olarak öğrendim. Dediğim gibi, bu kadar derinlemesine inceledikleri yerler var. Doğru, LPC genel ses dalga formları için uygundur. Bahsettiğim gibi, herhangi bir dürtüsel spektrumda iyi çalışır. Sonuç olarak, spektrumun daha az dürtüsel olduğu gürültülü sinyaller üzerinde zayıf çalışır (bunun nedeni gürültülü sinyallerin ARMA süreçleri olarak daha iyi modellenmesidir).
Bryan
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.