Ortogonal dönüşümler Gauss ortadan kaldırılmasını ne zaman geride bırakıyor?


22

Bildiğimiz gibi, lineer denklem sistemleri için ortogonal dönüşüm yöntemleri (Givens rotasyonları ve Housholder yansımaları) Gauss eleme işleminden daha pahalıdır, ancak teorik olarak sistemin durum sayısını değiştirmeyecek şekilde daha iyi stabilite özelliklerine sahiptir. Her ne kadar Gauss'un ortadan kaldırılmasıyla kısmi dönme ile bozulan bir matrisin sadece bir akademik örneğini biliyorum . Ve bu tür davranışları pratikte yerine getirmenin pek mümkün olmadığı konusunda ortak bir görüş vardır ( bu ders notlarına bakınız [pdf] ).

Peki konuyla ilgili cevabı nerede arayacağız? Paralel uygulamalar? Güncelleniyor? ..

Yanıtlar:


24

doğruluk

Trefethen ve Schreiber , sorunuzun doğruluğunu tartışan, Gauss Eliminasyonunun Ortalama Durum Kararlılığı üzerine mükemmel bir makale yazdı . İşte sonuçlarından bazıları:

  1. "Ya da sütun pivotlanmadan QR çarpanlara için, artık matrisin ortalama maksimal elemanıdır Gauss ortadan kaldırılması için bu ise, O ( n ) . Bu karşılaştırma Gauss yok hafif kararsız olduğunu ortaya koymaktadır, ancak kararsızlık sadece düşük hassasiyette çözülmüş çok büyük matris problemleri için tespit edilebilir. Çoğu pratik problem için Gauss eleme ortalama olarak oldukça stabildir. ”(Vurgu madeni)O(n1/2)O(n)

  2. “Gauss elemesinin ilk birkaç adımından sonra, kalan matris elemanları, bu şekilde başlayıp başlamadıklarına bakılmaksızın yaklaşık olarak normal şekilde dağıldı.”

Burada ele alamayacağım çok fazla şey var, bahsettiğiniz en kötü durum matrisinin tartışılması da dahil, bu yüzden okumanızı şiddetle tavsiye ediyorum.

performans

Kare reel matrisler için, kısmi dönme ile LU yaklaşık gerektirir Householder tabanlı QR kabaca gerektirir, oysa flop 4 / 3 , n 3 flop. Bu nedenle, oldukça büyük kare matrisler için QR faktoringi, LU faktoringin sadece iki katı kadar pahalı olacaktır.2/3n34/3n3

İçin matrisler, m n , kısmi dönme ile LU gerektirir m , n 2 - n, 3 / 3 , karşı flop QR en 2 m , n 2 - 2 , n 3 / 3 (iki kez halen geçerli olduğu bu LU faktörleştirme). Bununla birlikte , bu uygulamaların çok uzun sıska matrisleri (üretmek için şaşırtıcı derecede yaygındır m » n ) ve Demmel ve diğ. güzel bir makaleye sahip, İletişimden kaçınan paralel ve sıralı QR faktoringim×nmnmn2-n3/32mn2-2n3/3m»n(4. bölümde) , geleneksel yaklaşımların n log p mesajları yerine , p işlemciler kullanıldığında sadece mesajlarının gönderilmesini gerektiren akıllı bir algoritmayı tartışmaktadır . Gider yani O ( n, 3 günlük p ) ilave flop gerçekleştirilir, ama çok küçük için , n , bu çoğu zaman (en azından tek bir QR çarpanlara ihtiyaçları yapılması gereken zaman) daha fazla mesaj göndermek gecikme maliyeti açısından tercih edilmektedir.günlükppngünlükpO(n3günlükp)n


10

Hiç kimsenin bilimsel hesaplamada sık rastlanan doğrusal en küçük kareler problemlerinden bahsetmediğine şaşırdım . Gauss ortadan kaldırılmasını kullanmak istiyorsanız, aşağıdaki gibi görünen normal denklemleri oluşturmalı ve çözmelisiniz:

birTbirx=birTb,

burada bağımsız değişken gözlemlerine gelen veri noktaları bir matris, X parametrelerinin bir vektör bulunabilir, ve b bağımlı bir değişkenin gözlem tekabül eden veri noktaları bir vektördür.birxb

Jack Poulson’un sık sık işaret ettiği gibi, koşul sayısı A koşul sayısının karesidir , bu nedenle normal denklemler feci bir şekilde şartlandırılmayabilir. Bu gibi durumlarda, QR ve SVD tabanlı yaklaşımlar daha yavaş olmasına rağmen, çok daha doğru sonuçlar vermektedir.birTbirbir


2
Gereksiz düşünüldüğünde Upvoted ancak QR aslında LU ile aynı düzeyde olmalıdır oluşturmak üzere gerekli işlemleri A H A (QR sadece gerektirir 2 / 3 , n 3 daha LU daha flop). SVD yaklaşım hala (bir kabaca olarak maliyet düşünebiliriz olsa yavaş olmalıdır 6 n 3 ). n3bir'Hbir2/3n36n3
Jack Poulson,

1
Ortogonal dönüşümlerin kullanılmasıyla garanti edilen stabiliteye ek olarak, SVD'nin en büyük avantajı, ayrıştırmanın kendi durum kontrolünü sağlamasıdır, çünkü en büyüğünün en küçük tekil değere oranı kesin olarak (2-norm) koşul sayısıdır. Diğer ayrışmalar için, bir koşul tahmin edicinin (örneğin Hager-Higham) kullanımı, ayrışma uygun olduğu kadar pahalı olmasa da, bir miktar "üzerine çekilmiştir".
JM

1
@JackPoulson Merak etmeyin, SVD için flop sayınıza bir referansınız var mı? Golub & Van Loan'daki (s. 254 3. baskı) kısa bir bakıştan anlayabildiğim kadarıyla, sabit, en küçük kareler problemlerini çözmede SVD'yi kullanmak için daha yüksek görünebilir, ancak hatalı olabilirdim. Şimdiden teşekkürler.
OscarB

1
@OscarB: Başımın üst kısmında, tam SVD'yi oluşturmaktan daha düşük olan çok kaba bir rakamdı (çünkü geri dönüşüm maliyetlerini önleyebiliriz). iş bidiagonal forma indirgenmesi için gerekli olan (örneğin, bir = F B G , H ), işin bir miktar, ki C , bidiagonal SVD için gerekli olan ( B = U Σ V H ) ve daha sonra x : = ( G ( V ( i n v ( Σ ) ( U 'H (8/3n3bir=FBG,'HCB=UΣV'H , ihtiyaç hangi O ( n, 2 ) çalışır. Bu yüzden, C'nin ne kadar büyükolduğumeselesi... MRRR burada çalışıyorsa O ( n 2 ) olacak , ama o zamana kadar kübik ve soruna bağlı. x: =(G,(V(bennv(Σ)(U'H(F'Hb)))))O(n2)CO(n2)
Jack Poulson

1
@JM En az kareler probleminin durum sayısının σ "klasik" koşul numarası olmadığını unutmayın. 1 bir matris; daha karmaşık bir miktardır. σ1σn
Federico Poloni

3

Performansı nasıl ölçersiniz? Hız? Doğruluk? İstikrar? Matlab'da yapılan hızlı bir test aşağıdakileri verir:

>> N = 100;
>> A = randn(N); b = randn(N,1);
>> tic, for k=1:10000, [L,U,p] = lu(A,'vector'); x = U\(L\b(p)); end; norm(A*x-b), toc
ans =
   1.4303e-13
Elapsed time is 2.232487 seconds.
>> tic, for k=1:10000, [Q,R] = qr(A); x = R\(Q'*b); end; norm(A*x-b), toc             
ans =
   5.0311e-14
Elapsed time is 7.563242 seconds.

Tek bir sistemin LU dekompozisyonu ile çözülmesi, bir QR dekompozisyonuyla çözmenin yaklaşık üç katıdır, ondalık bir ondalık basamağa kadar (bu örnek!).


Önerdiğiniz değerlerden herhangi biri hoş geldiniz.
faleichik

3

Alıntı ettiğiniz yazı, Gauss Eliminasyonunu sayısal olarak dengesiz olmasına rağmen rastgele matrislerde iyi yapma eğiliminde olduğunu ve çoğu matrisin rastgele matrisler gibi olduğunu düşündüğümüzü söyleyerek savunuyor. Bu aynı ifadenin sayısal olarak dengesiz birçok yöntemden söz edilebilir.

Tüm matrislerin uzayını düşünün. Bu yöntemler hemen hemen her yerde iyi sonuç verir. Yani 99.999 ... bir yarattığı tüm matrislerin% 'si kararsız yöntemlerle hiç problem yaşamayacak. GE ve diğerlerinin zorluk yaşayacağı sadece çok küçük bir matris kesri var.

Araştırmacıların ilgilendiği problemler bu küçük kesirde olma eğilimindedir.

Matrisleri rastgele oluşturmuyoruz. Çok özel, rastgele olmayan sistemlere karşılık gelen çok özel özelliklere sahip matrisler inşa ediyoruz. Bu matrisler çoğu zaman şartsızdır.

Geometrik olarak tüm matrislerin lineer uzayını düşünebilirsiniz. Bu boşlukta kesilen tekil matrislerin sıfır hacim / ölçü alt alanı var. İnşa ettiğimiz birçok sorun bu alt alan etrafında toplanmıştır. Rasgele dağıtılmazlar.

Örnek olarak, ısı denklemini veya dağılımını düşünün. Bu sistemler sistemden bilgi çıkarma eğilimindedir (tüm başlangıç ​​durumları tek bir son duruma çeker) ve sonuç olarak bu denklemleri tanımlayan matrisler son derece tekildir. Bu işlem, rastgele bir durumda, fiziksel sistemlerde her yerde bulunmaz.


2
Doğrusal sistem başlangıçta şartlandırılmamışsa, hangi yöntemi kullanırsanız kullanın: LU ve QR ayrıştırması yanlış sonuçlar verecektir. QR ancak Gauss eleme sürecinin iyi bir matrisi "bozduğu" durumlarda kazanabilir. Asıl mesele, bu tür davranışların pratik vakalarının bilinmemesidir.
faleichik

Çoğu bilimsel uygulama için, genellikle seyrek, simetrik, pozitif kesin ve / veya çapraz olarak baskın olan matrisler elde ederiz. Çok az istisna dışında, matriste, geleneksel gauss eleme üzerinde belirli tekniklerden yararlanmamızı sağlayan bir yapı var.
Paul

@ Paul: Öte yandan, yoğun Gauss ortadan kaldırılması, çoğu zaman seyrek simetrik olmayan matrisler için multifrontal yöntemde harcandığı yerdir.
Jack Poulson

6
@Paul "Çoğu uygulamanın SPD / çapraz olarak baskın matrisler ürettiği" doğru değil. Evet, genellikle bir çeşit sömürülebilir yapı vardır, ancak simetrik olmayan ve belirsiz sorunlar son derece yaygındır.
Jed Brown

4
"Elli yıllık hesaplamalarda, patlayıcı kararsızlığı heyecanlandıran hiçbir matris sorununun doğal şartlar altında ortaya çıktığı bilinmemektedir." - LN Trefethen ve D. Bau Kitaplarında ilginç bir olasılık analizi yapıyorlar.
JM
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.