İlişkili rasgele değişkenler üretme formülü nasıl çalışır?


19

2 normal, ilişkisiz rastgele değişkenimiz ise, formülle ilişkili 2 rasgele değişken oluşturabilirizX1,X2

Y=ρX1+1ρ2X2

ve sonra bir korelasyon olacak ile .ρ X 1YρX1

Birisi bu formülün nereden geldiğini açıklayabilir mi?


1
Bu ve bununla ilgili sorunların kapsamlı bir tartışması stats.stackexchange.com/a/71303 adresindeki yanıtımda görünür . Diğer şeylerin yanı sıra, bu (1) Normallik varsayımı alakasız ve (2) ek varsayımda bulunmak gerektiğini düz yapar: ait sapmalar ve korelasyon için sırayla eşit olmalıdır ile olmaya . X 2 Y X 1 ρX1X2YX1ρ
whuber

Çok ilginç bir bağlantı. Normalliğin alakasız olması ile ne demek istediğinizi anladığımdan emin değilim. Eğer veya normal değildir ve yoğunluğunu kontrol etmek için daha sert hale Kaiser-Dickman algoritma üzerinden. Bu, normal olmayan ilişkili veriler üretmek için özel algoritmaların bütün sebebidir (örn. Headrick, 2002; Ruscio ve Kaczetow, 2008; Vale ve Maurelli, 1983) Örneğin, hedefinizin ~ normal, ~ üniforma oluşturmak olduğunu hayal edin , = .5 ile. Kullanma ~ bir tekdüze sonuçları aynı değildir ( normal ve tek biçimli bir lineer birleşimi olan biter). X 2 Y X Y ρ X 2 Y YX1X2YXYρX2YY
Anthony

@Anthony Soru sadece , yalnızca birinci ve ikinci anların bir fonksiyonu olan korelasyon hakkında sorular sorar . Cevap, dağılımların diğer özelliklerine bağlı değildir. Tartıştığınız şey tamamen farklı bir konudur.
whuber

Yanıtlar:


17

Eğer doğrusal bir kombinasyonunu bulmak istediğinizi varsayalım ve böyleX 2X1X2

corr(αX1+βX2,X1)=ρ

ve aynı (sıfır olmayan) sabitle çarparsanız , korelasyonun değişmeyeceğine dikkat edin. Bu nedenle, varyansı korumak için bir koşul ekleyeceğiz:β var ( α X 1 + β X 2 ) = var ( X 1 )αβvar(αX1+βX2)=var(X1)

Bu şuna eşdeğerdir:

ρ=cov(αX1+βX2,X1)var(αX1+βX2)var(X1)=αcov(X1,X1)=var(X1)+βcov(X2,X1)=0var(αX1+βX2)var(X1)=αvar(X1)α2var(X1)+β2var(X2)

Her iki rastgele değişkenin de aynı varyansa sahip olduğunu varsayarsak (bu çok önemli bir varsayımdır!) ( )var(X1)=var(X2)

ρα2+β2=α

Bu denklemin birçok çözümü vardır, bu nedenle varyans koruma koşulunu hatırlama zamanı:

var(X1)=var(αX1+βX2)=α2var(X1)+β2var(X2)α2+β2=1

Ve bu bizi

α=ρβ=±1ρ2

UPD . İkinci soru ile ilgili olarak: evet, bu beyazlatma olarak bilinir .


9

Denklem, Cholesky ayrışmasının basitleştirilmiş iki değişkenli bir şeklidir . Bu basitleştirilmiş denkleme bazen Kaiser-Dickman algoritması denir (Kaiser ve Dickman, 1962).

Bu algoritmanın düzgün çalışması için ve aynı varyansa sahip olması gerektiğini unutmayın . Ayrıca, algoritma normalde normal değişkenlerle kullanılır. Eğer veya normal değildir, ile aynı dağılımın olmayabilir .X 2 X 1 X 2 Y X 2X1X2X1X2YX2

Referanslar:

Kaiser, HF ve Dickman, K. (1962). Keyfi bir popülasyon korelasyon matrisinden örnek ve popülasyon skor matrisleri ve örnek korelasyon matrisleri. Psikometrika, 27 (2), 179-182.


2
Sanırım standart normal değişkenlere ihtiyacınız yok, sadece aynı varyansa sahip olmak yeterli olmalı.
Artem Sobolev

2
Resim, dağılımı ise olup , bir karışım Eğer İstem olarak dağılımı. Y
Dilip Sarwate

Nokta alındı, @ Silip Sarwate. Ya Eğer veya normal olmayan, daha sonra istenen dağılımına neden olmayabilir iki değişken arasındaki bir doğrusal kombinasyonu olur. Bu, normal olmayan ilişkili veri için özelleştirilmiş algoritmaların (Kaiser-Dickman yerine) nedenidir. X 2 YX1X2Y
Anthony

3

Korelasyon katsayısı, vektörler olarak ele alınırsa iki seri arasındaki ( veri noktası bir vektörün boyutu olmak üzere). Yukarıdaki formül, bir vektörün , bileşenlerinde ( ile ilgili olarak ) ayrıştırılmasını sağlar . eğer , daha sonra .n t h n t h cos θ s i n θ X 1 , X 2 ρ = c o s θ cosnthnthcosθsinθX1,X2
ρ=cosθ1ρ2=±sinθ

Çünkü ilişkisiz ise, aralarındaki açı dik açıdır (yani, normalleştirilmemiş olsa da, dik vektörler olarak düşünülebilir).X1,X2


2
Sitemize hoşgeldiniz! Matematiksel ifadeleri kullanarak işaretlerseniz postanızın daha fazla dikkat çekeceğine inanıyorum : Dolar işaretleri arasına alın. Düzenlerken yardım var. TEX
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.