Sanırım cevap evet olmalı, ama hala bir şeyin doğru olmadığını hissediyorum. Literatürde bazı genel sonuçlar olmalı, biri bana yardımcı olabilir mi?
Sanırım cevap evet olmalı, ama hala bir şeyin doğru olmadığını hissediyorum. Literatürde bazı genel sonuçlar olmalı, biri bana yardımcı olabilir mi?
Yanıtlar:
Hayır.
Üç değişken, göz önünde , ve . Kovaryans matrisleri , pozitif kesin değildir, çünkü pozitif olmayan bir vektör ( ) vardır .Y, Z = X + Y M z = ( 1 , 1 , - 1 ) ' z ' M z
Popülasyon kovaryansı matrisleri pozitif yarı kesindir.
( Burada özellik 2'ye bakınız .)
Aynısı genel olarak tam numunelerin kovaryans matrislerine de uygulanmalıdır (eksik değerler yok), çünkü bunlar ayrıca ayrı bir popülasyon kovaryansı olarak da görülebilirler.
Bununla birlikte, kayan nokta sayısal hesaplamalarının yetersizliğinden dolayı, cebirsel olarak pozitif olan belirli durumlar bile bazen pozitif yarı-kesin olmayacak şekilde hesaplanabilir; algoritmaların iyi bir seçim bu konuda yardımcı olabilir.
Daha genel olarak, örnek kovaryans matrisleri - bazı değişkenlerde eksik değerlerle nasıl başa çıktıklarına bağlı olarak - teoride bile pozitif yarı kesin olabilir veya olmayabilir. Örneğin ikili silme kullanılırsa, pozitif yarı-kesinlik garantisi yoktur. Dahası, biriken sayısal hata, yarı-kesin olarak kesin olmamak için pozitif pozitif olması gereken örnek kovaryans matrislerine neden olabilir.
Gibi:
x <- rnorm(30)
y <- rnorm(30) - x/10 # it doesn't matter for this if x and y are correlated or not
z <- x+y
M <- cov(data.frame(x=x,y=y,z=z))
z <- rbind(1,1,-1)
t(z)%*%M%*%z
[,1]
[1,] -1.110223e-16
Bu, denediğim ilk örnekte oldu (muhtemelen bir tohum tedarik etmeliyim, ancak bir tane almadan önce pek çok örnek denemeniz gerekecek kadar nadir değil).
Sonuç cebirsel olarak sıfır olmasına rağmen negatif çıktı . Farklı bir sayı kümesi, pozitif bir sayı veya "kesin" bir sıfır verebilir.
-
İkili silme ile pozitif yarı-kesinliğin kaybına yol açan ılımlı eksiklik örneği:
z <- x + y + rnorm(30)/50 # same x and y as before.
xyz1 <- data.frame(x=x,y=y,z=z) # high correlation but definitely of full rank
xyz1$x[sample(1:30,5)] <- NA # make 5 x's missing
xyz1$y[sample(1:30,5)] <- NA # make 5 y's missing
xyz1$z[sample(1:30,5)] <- NA # make 5 z's missing
cov(xyz1,use="pairwise") # the individual pairwise covars are fine ...
x y z
x 1.2107760 -0.2552947 1.255868
y -0.2552947 1.2728156 1.037446
z 1.2558683 1.0374456 2.367978
chol(cov(xyz1,use="pairwise")) # ... but leave the matrix not positive semi-definite
Error in chol.default(cov(xyz1, use = "pairwise")) :
the leading minor of order 3 is not positive definite
chol(cov(xyz1,use="complete")) # but deleting even more rows leaves it PSD
x y z
x 0.8760209 -0.2253484 0.64303448
y 0.0000000 1.1088741 1.11270078
z 0.0000000 0.0000000 0.01345364
Peki, neden bir popülasyonun kovaryans matrisinin her zaman pozitif yarı-kesin olduğunu anlamak için şunu not edin: burada bazı gerçek sayılardır ve bazı gerçek değerli rastgele değişkenlerdir.
Bu aynı zamanda Glen_b tarafından verilen örnekte kovaryans matrisinin neden pozitif olmadığını da açıklar. Biz , ve , yani ve Sabit olan rastgele bir değişkenin varyansı .X 1 = X , X 2 = Y , X 3 = Z = X + Y ∑ 3 i = 1 y i X i = 0 0