Varsayılan matris normu neden Frobenius normu değil, spektral normdur?


17

Vektör normu için L2 normu veya "Öklid mesafesi" yaygın olarak kullanılan ve sezgisel bir tanımdır. Ama neden bir matris için "en çok kullanılan" veya "varsayılan" norm tanımı spektral normdur , fakat Frobenius normu değildir (vektörler için L2 normuna benzer)?

Bunun yinelemeli algoritmalar / matris güçleri ile bir ilgisi var mı (spektral yarıçap 1'den küçükse, algoritma birleşecektir)?


  1. Her zaman "en çok kullanılan", "varsayılan" gibi kelimeler için tartışılabilir. Yukarıda belirtilen "varsayılan" kelimesi Matlabişlevdeki varsayılan dönüş türünden geliyor norm. In Rmatris için varsayılan norm L1 norm. Her iki bana "doğal olmayan" (a matris için, bunu yapmak daha "doğal" görünüyor i,jai,j2 vektördeki gibi). (@ Usεr11852 ve @ whuber'ın yorumları için teşekkürler ve karışıklık için özür dilerim.)

  2. Matris normunun kullanımını genişletmek daha fazla anlamama yardımcı olur mu?


4
Spektral normun en yaygın olarak kullanıldığından emin değilim. Örneğin, Frobenius normu, NNMF için ve genellikle Pos.Def olmayan matrisleri düzeltmek / kovaryans matrisini düzeltmek için çözeltiye yaklaşırken kullanılır. ve Pos. Def. Genel olarak Forbenius normu "element-wise" normudur, spektral norm özdeğerlere dayanır, bu yüzden biraz daha "evrenseldir" ancak bu bir görüş meselesidir. Örneğin, Gentle'nin " Matrix Cebiri " tam anlamıyla " Frobenius Normu -" Olağan "Norm " adlı bir bölüme sahiptir . Açıkça, spektral norm herkes için varsayılan norm değildir .
usεr11852 diyor Reinstate Monic

2
@ hxd1011: spektral normu aslında, çünkü MATLAB, en az bu yapılır L2 matris normu. L2 matris normu bu Öklid vektör normu tarafından indüklenen çünkü Öklid tipi norm burada ||A||2=max||x||2=1||Ax||2 . Matrisler için normları indüklemeyle ilgili yakalamanın , bir vektör normu tarafından indüklendiği. Sanırım R'nin arkasındaki fikir de bu. "Varsayılan" normkomutun her zaman aynı normu döndürmesi mantıklıdır .
usεr11852 diyor Reinstate Monic

3
Temerrütün Öklid olduğuna ve en yaygın kullanılanının Spektral olduğuna katılmıyorum.
Aksakal

5
Bu sorudan şaşkına döndüm çünkü matris normlarının nasıl tercih veya kullanım meselesi olduğunu göremiyorum. Belirli bir norm bir problemle ilgili ise, o zaman kullanılır; başka bir tane varsa, o zaman kullanılır. Açık bir sorun veya uygulama göz önünde bulundurulmadan, bu sorunun nasıl cevaplandığını göremiyorum.
whuber

5
@ usεr11852 Bunu işaret ettiğiniz için teşekkür ederiz. Soru metninin bu tür tüm bilgileri içermesi önemlidir . Özellikle birçoğu olduğunda, yorumları okuyan insanlara güvenmeyin. Bu arada, kopyamdaki "norm {base}" için yardım sayfasında L 1 normu varsayılan olarak Rlistelenir , spektral norm listelenmez . L1
whuber

Yanıtlar:


13

Genel olarak, spektral normun en yaygın olarak kullanıldığından emin değilim. Örneğin, Frobenius normu, negatif olmayan matris çarpanlarına ayırma veya korelasyon / kovaryans matris düzenlenmesi üzerindeki çözeltiyi yaklaşık olarak belirlemek için kullanılır . Bu sorunun bir kısmının, bazı insanların Frobenius normundan Öklid matris normu olarak söz ederken yaptıkları terminoloji kabahatlerinden kaynaklandığını düşünüyorum . Aslında olmamalıdır, çünkü L2 matris normu (yani. Spektral normu) kullanıldığında matrislere indüklenir biri L2 vektör normu. Frobenius normu bu element açısından akıllıca: ,L2matris normu (||A||2=||A||F=i,jai,j2L2) tekil değerlere dayanır, dolayısıyla daha "tek yönlü" olur. (? daha iyi bir dönem şans için)L2matris normu bu Öklid vektör normu, burada tarafından indüklenen bu yana Öklid tipi norm| | A| | 2=maks | | x | | 2 = 1 | | Ax| | 2. Bu nedenle biruyarılmış normmatrisleri için çünküuyarılana göre||A||2=λmax(ATA))L2||A||2=max||x||2=1||Ax||2vektör normu , bu durumda vektör normu.L2

Muhtemelen MATLAB amaçları sağlamak için komutunu kullanarak varsayılan olarak normunu ; Bunun bir sonucu olarak bu içerir Öklid vektör normu değil, aynı zamanda L 2 matris normu, yani. spektral matris normu (yerine yanlış alıntı " Frobemino / Öklid matris normu "). Son olarak, varsayılan normun ne olduğunu bir ölçüde genişletmek için bir görüş meselesi olduğunu not edeyim : Örneğin JE Gentle'nin " Matris Cebiri - Teori, Hesaplamalar ve İstatistikteki Uygulamalar " kelimesi tam anlamıyla " Frobenius " adlı bir bölüme (3.9.2) sahiptir. Norm - “Olağan” NormL2normL2"; açık bir şekilde spektral norm, dikkate alınan tüm taraflar için varsayılan norm değildir! :) @amoeba tarafından yorumlandığı gibi, farklı toplulukların farklı terminoloji sözleşmeleri olabilir. Gentle'nin kitabının, İstatistikler Lin cebir uygulaması ve ben daha fazla bakmak istemek istiyorum!


1
mükemmel cevap!! bana çok yardımcı oldu! A2=maxx2=1Ax2
Haitao Du

Yardımcı olabileceğim için mutluyum. Lütfen verilen diğer cevapları da dikkate alın. Onlar oldukça anlayışlılar.
usεr11852 diyor Reinstate Monic

8

Yanıtın bir kısmı sayısal hesaplama ile ilgili olabilir.

Ax=b
x~ due to the constraints of finite arithmetics, so that Ax~b, in some suitable sense. What is it that your solution represents, then? Well, it may well be an exact solution to some other system like
A~x~=b~
So for x~ to have utility, the tilde-system must be close to the original system:
A~A,b~b
A~Ab~bA~Ab~b. For some analyses, the l1 norm (max column sum) is the easiest one to push through, for others, the l norm (max row sum) is the easiest to push through (for components of the solution in the linear system case, for instance), and for yet others, the l2 spectral norm is the most appropriate one (induced by the traditional l2 vector norm, as pointed out in another answer). For the work horse of statistical computing in symmetric p.s.d. matrix inversion, Cholesky decomposition (trivia: the first sound is a [x] as in Greek letter "chi", not [tʃ] as in "chase"), the most convenient norm to keep track of the error bounds is the l2 norm... although the Frobenius norm also pops up in some results e.g. on partitioned matrix inversion.


3
+1, in particular for the trivia. I have always thought it starts with [k]. I looked it up now and apparently André-Louis Cholesky was of Polish decent (born in France though). Shouldn't it be "sh" sound then, like in Chopin? However, in Russian Cholesky is indeed traditionally written as Холецкий.
amoeba says Reinstate Monica

3
I take it back. Turns out Chopin's father was French, hence the French pronunciation of the surname. But Cholesky's parents were Polish and in Polish it should have been pronounced with [χ]. Cheers.
amoeba says Reinstate Monica

Yeah... I'd thought that as a Russian with a Polish first name, and having first read that Russian spelling a decade or so before first seeing it spelled in Latin letters, I'd have some idea how to pronounce it ;)
StasK

2
Who cares how to pronounce it, just use the damn thing.
Mark L. Stone

7

The answer to this depends on the field you're in. If you're a mathematician, then all norms in finite dimensions are equivalent: for any two norms a and b, there exist constants C1,C2, which depend only on dimension (and a,b) such that:

C1xbxaC2xb.

This implies that norms in finite dimensions are quite boring and there is essentially no difference between them except in how they scale. This usually means that you can choose the most convenient norm for the problem you're trying to solve. Usually you want to answer questions like "is this operator or procedure bounded" or "does this numerical process converge." With boundedness, you only usually care that something is finite. With convergence, by sacrificing the rate at which you have convergence, you can opt to use a more convenient norm.

For example, in numerical linear algebra, the Frobenius norm is sometimes preferred because it's a lot easier to calculate than the euclidean norm, and also that it naturally connects with a wider class of Hilbert Schmidt operators. Also, like the Euclidean norm, it's submultiplictive: ABFAFBF, unlike say, the max norm, so it allows you to easily talk about operator multiplication in whatever space you're working in. People tend to really like both the p=2 norm and the Frobenius norm because they have natural relations to both the eigenvalues and singular values of matrices, along with being submultiplictive.

For practical purposes, the differences between norms become more pronounced because we live in a world of dimensions and it usually matters how big a certain quantity is, and how it's measured. Those constants C1,C2 above are not exactly tight, so it becomes important just how much more or less a certain norm xa is compared to xb.


7
Unfortunately, the term "equivalence", as in norms, can and has been misinterpreted, including by people with Ph.D.s in Computer Science. I needed to implement a certain non-trivial calculation using a 2-norm, and this guy produced a solution using a 1-norm, because that was much easier, and after all, he had heard that all norms are equivalent. Well, being off by a factor of (up to) n was not adequate for me. In that application, I could only afford to be off by a factor of 1.
Mark L. Stone

@MarkL.Stone: Right, hence the distinction between theoretical (really: topological) and practical.
Alex R.

@MarkL.Stone: +1 Clearly he was not unit-testing his code. :) (Nice anecdote! I will definitely use it when talking about miscommunications in technical computing!)
usεr11852 says Reinstate Monic

@usεr11852 ha ha, no, it's worse than that. He did "unit-test" the code as correctly implementing the calculation based on the 1-norm. It failed my system-level examination because it used the wrong norm.
Mark L. Stone

@MarkL.Stone: Oh... that's a pity! Having said that, I don't know if you were using an particular hardware configuration or something but to begin with coding a norm calculation from scratch is no-no; there are mathematics libraries one should use to avoid such issues altogether.
usεr11852 says Reinstate Monic
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.