Keyfi bir kovaryans matrisi nasıl oluşturulur

21

Örneğin, içinde R, MASS::mvrnorm()işlev istatistiklerde çeşitli şeyleri göstermek için veri üretmek için kullanışlıdır. SigmaDeğişkenlerin kovaryans matrisini belirten simetrik bir matris olan zorunlu bir argüman alır . Rasgele girişlerle simetrik bir $n\times n$ matrisi nasıl oluştururum ?

r random-generation covariance-matrix

— rsl
kaynak

3

Bu sorunun "keyfi bir kovaryans matrisi nasıl oluşturabilirim" ve daha az kodlama yönüne odaklanmak için düzenlenmesinden fayda sağlayacağını düşünüyorum. Cevabın gösterdiği gibi, burada kesinlikle konuya ilişkin istatistiksel bir sorun var.

— Gümüş Balık

2

İlgili: Rasgele pozitif-semidefinite korelasyon matrisleri nasıl verimli bir şekilde üretilir?

— amip, Reinstate Monica

22

Rasgele değerlerle bir $n\times n$ matrisi $A$ oluşturun

ve sonra kovaryans matrisiniz olarak kullanın $\Sigma = A^T A$ .

Örneğin

n <- 4  
A <- matrix(runif(n^2)*2-1, ncol=n) 
Sigma <- t(A) %*% A

— Henry
kaynak

Aynı şekilde Sigma <- A + t(A),.

— rsl

6

@MoazzemHossen: Öneriniz simetrik bir matris üretecek, ancak her zaman pozitif semidefinit olmayabilir (örneğin, öneriniz negatif özdeğerlere sahip bir matris üretebilir) ve bu nedenle bir kovaryans matrisi olarak uygun olmayabilir

— Henry

Evet, önerilen yolumun uygun olmayan matris üretmesi durumunda R'nin hata verdiğini fark ettim.

— rsl

4

Daha iyi yorumlanabilirlik için bir korelasyon matrisi tercih ederseniz , daha sonra uygulanabilecek ? Cov2cor fonksiyonunun olduğunu unutmayın.

— gung - Monica'yı eski

1

@ B11b: Pozitif yarı-kesin olmak için kovaryans matrisinize ihtiyacınız var. Bu kovaryans değerleri üzerinde bazı sınırlar getirecektir,

n > 2

$n \gt 2$

— Henry

24

Keyfi olsalar bile, oluşturduğum nesneler üzerinde kontrol sahibi olmayı seviyorum.

O halde, tüm olası kovaryans matrislerinin formunda ifade edilebileceğini düşünün $n\times n$ $\Sigma$

Σ = P^{'} Diagonal (σ_{1}, σ_{2}, \dots, σ_{n}) P

$\Sigma= P^\prime\ \text{Diagonal}(\sigma_1,\sigma_2,\ldots, \sigma_n)\ P$

burada dik bir matris ve . $P$ $\sigma_1 \ge \sigma_2 \ge \cdots \ge \sigma_n \ge 0$

Geometrik olarak bu, boyutlarında bir dizi temel bileşen içeren bir kovaryans yapısını tarif eder . Bu bileşenler, sıralarının yönlerini gösterir . olan örnekler için Temel bileşen analizini, özvektörleri ve özdeğerlerini anlama konusundaki şekillere bakın . Ayar ve böylece arzu edilen herhangi bir elips şeklini belirlemek, covariances ve göreli boyutları büyüklüğünü ayarlayacaktır. satırları şeklin eksenlerini tercih ettiğiniz şekilde yönlendirir. $\sigma_i$ $P$ $n=3$ $\sigma_i$ $P$

Bu yaklaşımın bir cebirsel ve hesaplama yararı, , kolayca ters çevrilmiş olmasıdır (bu kovaryans matrislerinde ortak bir işlemdir): $\sigma_n \gt 0$ $\Sigma$

Σ^{- 1} = P^{'} Diagonal (1 / σ_{1}, 1 / σ_{2}, \dots, 1 / σ_{n}) P .

$\Sigma^{-1} = P^\prime\ \text{Diagonal}(1/\sigma_1, 1/\sigma_2, \ldots, 1/\sigma_n)\ P.$

Yönleri umurumda değil, sadece boyut aralıkları hakkında ? Bu iyi: kolayca rastgele bir dik matris oluşturabilirsiniz. Standart Normal değerleri iid kare şeklinde bir matrise sarın ve dikleştirin. Neredeyse kesinlikle işe yarayacak ( büyük değilse). QR ayrışması bunu bu kodda olduğu gibi yapacak $\sigma_i$ $n^2$ $n$

n <- 5
p <- qr.Q(qr(matrix(rnorm(n^2), n)))

Bu, bu şekilde üretilen değişken çok-dağılımlı "eliptik" olduğu için çalışır: tüm dönüşler ve yansımalar (başlangıç noktası boyunca) altında değişmez. Böylece, tüm ortogonal matrisler , 3-d birim kürenin yüzeyi üzerinde düzgün dağılmış noktalar nasıl oluşturulur? . $n$

Hızlı bir yolu elde etmek gelen ve bunları belirtilen veya oluşturduktan sonra, kullanır ve istismarlara ile bu örnekte olduğu gibi aritmetik operasyonlarda Dizilerin 'ın yeniden kullanımı : $\Sigma$ $P$ $\sigma_i$ crossprodR $\sigma=(\sigma_1, \ldots, \sigma_5) = (5,4,3,2,1)$

Sigma <- crossprod(p, p*(5:1))

Çek olarak Tekil Değer ayrışma hem dönmelidir ve . Bunu komutla inceleyebilirsiniz. $\sigma$ $P^\prime$

svd(Sigma)

SigmaElbette tersi, sadece çarpımı bir bölüme değiştirerek elde edilir : $\sigma$

Tau <- crossprod(p, p/(5:1))

Bunu kimlik matrisi zapsmall(Sigma %*% Tau)olması gerekenleri görüntüleyerek doğrulayabilirsiniz . Bir genelleştirilmiş ters (regresyon hesaplamaları için gerekli) bir değiştirilmesi ile elde edilir ile olarak yukarıdaki, ama arasında herhangi bir sıfır tutmak de olduğu gibi. $n\times n$ $\sigma_i \ne 0$ $1/\sigma_i$ $\sigma_i$

— whuber
kaynak

Eksenleri tercih edildiği gibi yönlendirmek için

sıralarının nasıl kullanılacağını göstermeye yardımcı olabilir .

P

$P$

— gung - Monica'yı eski

1

İçindeki tekil değerlerin svd(Sigma)yeniden sıralanacağından bahsetmeye değer olabilir - bu beni bir dakika karıştırdı.

— FrankD

1

Yaygın olarak kullanılan "istatistik" paketindeki "rWishart" işlevini kullanarak Wishart dağılımından rasgele pozitif belirli matrisleri simüle edebilirsiniz.

n <- 4
rWishart(1,n,diag(n))

— Carlos Llosa
kaynak

1

Bunun için özel bir paket var, clusterGeneration(Harry Joe tarafından yazılmış, bu alanda büyük bir isim).

İki ana işlev vardır:

genPositiveDefMat bir kovaryans matrisi üretme, 4 farklı yöntem
rcorrmatrix : bir korelasyon matrisi üret

Hızlı örnek:

library(clusterGeneration)
#> Loading required package: MASS
genPositiveDefMat("unifcorrmat",dim=3)
#> $egvalues
#> [1] 15.408962  5.673916  1.228842
#> 
#> $Sigma
#>          [,1]     [,2]     [,3]
#> [1,] 6.714871 1.643449 6.530493
#> [2,] 1.643449 6.568033 2.312455
#> [3,] 6.530493 2.312455 9.028815
genPositiveDefMat("eigen",dim=3)
#> $egvalues
#> [1] 8.409136 4.076442 2.256715
#> 
#> $Sigma
#>            [,1]       [,2]      [,3]
#> [1,]  2.3217300 -0.1467812 0.5220522
#> [2,] -0.1467812  4.1126757 0.5049819
#> [3,]  0.5220522  0.5049819 8.3078880

^{2019-10-27 tarihinde reprex paketi tarafından oluşturuldu (v0.3.0)}

Son olarak, alternatif bir yaklaşımın ilk denemeyi sıfırdan Matrix::nearPD()yapmak olduğunu , ardından matrisinizi pozitif-kesin yapmak için kullanın .

— Matifou
kaynak