Üç rastgele değişkenin korelasyonuna bağlı


28

Üç rastgele değişken vardır, x,y,z . Üç değişken arasındaki üç korelasyon aynıdır. Yani,

ρ=cor(x,y)=cor(x,z)=cor(y,z)

için verebileceğiniz en sıkı sınır nedir ?ρ


1
Muhtemelen "pho" ile, rho ( ) demek istiyorsun . Ancak, sorunuz net değil. "Verebileceğin en sıkı sınır nedir" derken ne demek istiyorsun? ρ
gung - Monica'yı yeniden yerleştirme

Peki değişkenin adı sadece bir kukla. En sıkı sınırlama ile, bir korelasyon için [-1, 1] gibi bir anlam ifade ediyorum, ama bu açıkça mümkün olan en sıkı sınır değil.
user1352399

Bunu demek istiyorsun ki, rho = cor (x, y) = cor (x, z) = cor (y, z) ve rho için sınırlar nelerdir?
user31264,

Evet, rho = cor (x, y) = cor (x, z) = cor (y, z) ve rho limitleri nedir demek istiyorum. Dilip, rho'nun negatif olmamasını, yani> = 0 olması gerektiğini söyler misiniz?
user1352399 15:13

1
Bunun için alıntı yapacak bir ders kitabı Seber & Lee "Linear Regression Analysis" (En azından ilk baskıda ...)
kjetil b halvorsen

Yanıtlar:


29

Ortak ilişki değerine sahip olabilir değil . Eğer , daha sonra can eşit olmayan ama aslında . Üç rastgele değişkenin ortak korelasyonunun en küçük değeri . Daha genel olarak, en az ortak ilişki rastgele değişken olduğu vektörleri olarak, bunlar (boyutta bir simplex köşelerinde olan olarak) boyutlu alan.ρ+11ρX,Y=ρX,Z=1ρY,Z1+112n1n1n1n

birim varyans toplamı rasgele değişkenleri toplamının varyansını göz önünde bulundurun . Biz bunu burada olan ortalama değeri arasında korelasyon katsayıları. Ancak bu yana , kolaylıkla elde bu X i var ( n i = 1 X i )nXi ˉ ρ

var(i=1nXi)=i=1nvar(Xi)+i=1njincov(Xi,Xj)=n+i=1njinρXi,Xj(1)=n+n(n1)ρ¯
ρ¯(n2)var(iXi)0(1)
ρ¯1n1.

Dolayısıyla, bir korelasyon katsayısının ortalama değeri en azından . Eğer tüm korelasyon katsayıları var aynı değere , daha sonra ortalama da eşittir ve biz buna sahip böylece ortak korelasyon değerinin eşittir rastgele değişkenlere sahip olmak mümkün müdür ? Evet. Varsayalım ki olan ilintisiz birim varyans rastgele değişkenler ve set . O zaman, iken 1n1ρρ

ρ1n1.
ρ 1n1XiYi=Xi1nj=1nXj=XiX¯E[Yi]=0
var(Yi)=(n1n)2+(n1)(1n)2=n1n
ve vererek Dolayısıyla , in minimum ortak korelasyon değerini elde eden rasgele değişkenlerdir . Not, bu arada, bu , ve bu yüzden, vektörler olarak, rastgele değişkenler yalan ait boyutlu hiper
cov(Yi,Yj)=2(n1n)(1n)+(n2)(1n)2=1n
ρYi,Yj=cov(Yi,Yj)var(Yi)var(Yj)=1/n(n1)/n=1n1.
Yi1n1iYi=0(n1)nboyutlu uzay.

25

Mümkün olan en sıkı sınır . 1/2ρ1 Tüm bu değerler aslında görünebilir - hiçbiri imkansız değildir.

Sonuçta özellikle derin veya gizemli bir şey olmadığını göstermek için, bu cevap ilk önce tamamen temel bir çözüm sunar, yalnızca varyansların - karelerin beklenen değerleri olduğu - negatif olmamasının gerektiği açık bir gerçeği gerektirir. Bunu (biraz daha sofistike cebirsel gerçekleri kullanan) genel bir çözüm izler.

İlkel çözüm

Herhangi bir doğrusal kombinasyonunun varyansı negatif olmamalıdır. x,y,z Bu değişkenlerin varyanslarının sırasıyla ve olmasına izin verin . Hepsi sıfır değildir (aksi halde korelasyonların bazıları tanımlanmayacaktır). Temel varyans özelliklerini kullanarak hesaplayabilirizσ2,τ2,υ2

0Var(αx/σ+βy/τ+γz/υ)=α2+β2+γ2+2ρ(αβ+βγ+γα)

Tüm gerçek sayılar için .(α,β,γ)

olduğu varsayılırsa , küçük bir cebirsel manipülasyon buna eşdeğerdir.α+β+γ0

ρ1ρ13((α2+β2+γ2)/3(α+β+γ)/3)2.

Sağ taraftaki kare terimi, iki güç aracının oranıdır . Temel güç ortalama eşitsizlik (ağırlıkları ile ) bu oran geçemez iddia (ve eşit olacaktır olduğunda ). Biraz daha fazla cebir daha sonra(α,β,γ)(1/3,1/3,1/3)11α=β=γ0

ρ1/2.

Aşağıdaki açık örneği (trivariate Normal değişkenleri ), tüm bu değerlerin değerlerinin aslında korelasyon olarak ortaya çıktığını gösterir. Bu örnek, yalnızca çok değişkenli Normlar tanımını kullanır, ancak aksi takdirde Calculus veya Linear Cebir sonuçlarına neden olmaz.n=3(x,y,z)1/2ρ1

Genel çözüm

genel bakış

Herhangi bir korelasyon matrisi, standartlaştırılmış rastgele değişkenlerin kovaryans matrisidir, bu nedenle - tüm korelasyon matrislerinde olduğu gibi - yarı kesin pozitif olmalıdır. Eşdeğer olarak, özdeğerleri negatif değildir. Bu yüklemektedir basit koşul : herhangi az olmamalıdır (geçemez ve tabii ). Tersine, bu tür aslında bu sınırları dar mümkündür kanıtlayan bazı trivariate dağılımı arasındaki ilişki matrisine karşılık gelir.ρ1/21ρ


Koşullarınρ

Göz önünde ile her diyagonal değerlerle korelasyon matrisine eşit(Soru olayıyla ilgilidir ancak bu genellemenin analiz edilmesi artık zor değil.) Hadi buna diyelim Tanım olarak, sıfır olmayan bir vektör olması koşuluyla bir özdeğerdir .nnρ.n=3,C(ρ,n).λxλ

C(ρ,n)xλ=λxλ.

Bu özdeğerleri bu durumda bulmak kolaydır, çünkü

  1. İzin vermek , işlem bu1=(1,1,,1)

    C(ρ,n)1=(1+(n1)ρ)1.
  2. İzin vermek , bir ile sadece için (yer ), işlem buyj=(1,0,,0,1,0,,0)1jthj=2,3,,n

    C(ρ,n)yj=(1ρ)yj.

Çünkü özvektörler bugüne kadar bulunmuş tam yayılan boyutlu uzay (kanıt: onların belirleyici mutlak değeri eşittir kolay bir satır azaltma gösterileri , sıfırdan farklı olan), bunlar bir dayanak teşkil bütün özvektörler. Bu nedenle, tüm özdeğerleri bulduk ve bunların veya (çokluğu olan ikincisi) olduklarını belirledik . Tüm korelasyonların sağladığı bilinen eşitsizliğe ek olarak, ilk özdeğerin olumsuz olmayışı ayrıca ima edernnn1+(n1)ρ1ρn11ρ1

ρ1n1

ikinci özdeğerin olumsuz olmayışı yeni şartlar getirmez.


Koşulların yeterlilik kanıtı

Sonuçları her iki yönde çalışır: Resim matris , pozitif-kesin ve dolayısıyla geçerli bir korelasyon matrisidir. Örneğin, çok normalli bir dağılım için korelasyon matrisidir. Özellikle yaz1/(n1)ρ1,C(ρ,n)

Σ(ρ,n)=(1+(n1)ρ)Inρ(1ρ)(1+(n1)ρ)11

, tersi için. Örneğin, olduğundaC(ρ,n)1/(n1)<ρ<1.n=3

Σ(ρ,3)=1(1ρ)(1+2ρ)(ρ+1ρρρρ+1ρρρρ+1).

Rastgele değişkenlerin vektörünün dağıtım işlevine sahip olmasına izin verin(X1,X2,,Xn)

fρ,n(x)=exp(12xΣ(ρ,n)x)(2π)n/2((1ρ)n1(1+(n1)ρ))1/2

burada . Örneğin, olduğunda bu eşittirx=(x1,x2,,xn)n=3

1(2π)3(1ρ)2(1+2ρ)exp((1+ρ)(x2+y2+z2)2ρ(xy+yz+zx)2(1ρ)(1+2ρ)).

Bu rastgele değişken için korelasyon matrisinC(ρ,n).

şekil

Yoğunluk fonksiyonlarının konturları Soldan sağa, . Yoğunluğun, düzleminin yakınında yoğunlaşmasından nasıl çizgisinin yakınında yoğunlaşacağına dikkat edin .fρ,3.ρ=4/10,0,4/10,8/10x+y+z=0x=y=z

ve özel durumları dejenere dağılımlarla da gerçekleştirilebilir ; Önceki durumda, dağılımın aynı şekilde dağıtılmış ortalamanın toplamı olduğu, hiper desteklenebileceğini belirtmek dışında ayrıntılara girmeyeceğim Normal dağılım, ikinci durumda (mükemmel pozitif korelasyon), tarafından üretilen satırda desteklenir , burada ortalama Normal dağılım vardır.ρ=1/(n1)ρ=1x.1=0010


Dejenerasyon dışı hakkında daha fazla bilgi

Bu analizin bir gözden bu ilişki matrisi olduğunu açıkça ortaya koymaktadır bir sırası vardır ve bir sıra vardır ve (sadece bir özvektör sahip olduğu için, sıfır olmayan özdeğer). İçin , bu her iki durumda da ilişki matrisi dejenere yapar. Aksi takdirde, ters nin varlığı dejenere olmadığını kanıtlar.C(1/(n1),n)n1C(1,n)1n2Σ(ρ,n)


20

Korelasyon matrisin

(1ρρρ1ρρρ1)

Önde gelen ana küçüklerin tümü negatif değilse, matris pozitif yarı yarıyıldır. Asıl küçükler, matrisin "kuzey-batı" bloklarının belirleyicileridir;

(1ρρ1)

ve korelasyon matrisinin kendisinin belirleyicisidir.

1 açıkça olumlu, ikinci ana küçük olan , herhangi bir kabul edilebilir korelasyon için negatif olmayan bir, . Tüm korelasyon matrisinin determinantı1ρ2ρ[1,1]

2ρ33ρ2+1.

Grafik, kabul edilebilir korelasyon aralığının üzerindeki fonksiyonun determinantını göstermektedir . [1,1]görüntü tanımını buraya girin

Fonksiyonun @stochazesthai tarafından verilen aralıkta olumsuz olmadığını görüyorsunuz (aynı zamanda determinant denkleminin köklerini bularak da kontrol edebilirsiniz).


Cevabınızda olduğunu varsaymıyor muyuz ? Neden yapabiliriz? Var()=1
Denizdeki yaşlı bir adam.

1
@Anold "Korelasyon" un yazıldığı "kovaryans" okuyor gibisiniz.
whuber

6

Rastgele değişken vardır biri , ve ikili korelasyonları ile eğer korelasyon matrisi pozitif yarı kesin ise. Bu sadece için olur .XYZρXY=ρYZ=ρXZ=ρρ[12,1]


2
Bunu çok basit bir şekilde açıklayabilir misiniz?
Elizabeth Susan Joseph

1
Matris cebir bilgisini gerektirmeyen bir açıklama olduğunu sanmıyorum. Vikipedi sayfasına bakmanızı öneririm ( en.wikipedia.org/wiki/… ).
stochazesthai

4
Sadece temel (lise düzeyinde) cebir gerektiren bir açıklama buldum ve cevabımı da buna dahil ettim.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.