Eklem dağılımının Gauss olmayan olmadığı bir çift Gauss rastgele değişkeni olması mümkün mü?


91

Biri bana bu soruyu bir iş görüşmesinde sordu ve ortak dağıtımlarının her zaman Gauss olduğunu söyledi. Ben her zaman bir iki değişkenli Gaussian'ı araçları, varyansları ve kovaryanslarıyla yazabileceğimi düşündüm. İki Gaussian'ın ortak ihtimalinin Gauss olmadığı bir durum olup olmadığını merak ediyorum.


4
Wikipedia'dan başka bir örnek . Elbette, değişkenler bağımsız ve marjinal olarak Gausslu ise, ortak Gauss'ludurlar.

Yanıtlar:


138

İki değişkenli normal dağılım istisnadır , kural değil!

Normal marjinallere sahip "hemen hemen tüm" eklem dağılımlarının iki değişkenli normal dağılım olmadığını bilmek önemlidir . Yani, iki değişkenli normal olmayan normal marjinallerle eklem dağılımlarının bir şekilde "patolojik" olduğu ortak bakış açısı biraz yanlış yönlendirilmiş durumda.

Kuşkusuz, çok değişkenli normal, lineer dönüşümler altındaki kararlılığı nedeniyle son derece önemlidir ve bu nedenle uygulamalardaki dikkat yoğunluğunu alır.

Örnekler

Bazı örneklerle başlamakta fayda var. Aşağıdaki şekilde, hepsi standart normal marjinallere sahip olan altı çift değişkenli dağılımın ısı haritaları bulunmaktadır . Üst sıradaki sol ve orta olanlar iki değişkenli normallerdir, geri kalanlar değildir (göründüğü gibi). Aşağıda daha ayrıntılı olarak açıklanmaktadırlar.

Standart normal marjinallerle iki değişkenli dağılım örnekleri.

Copulaların çıplak kemikleri

Bağımlılığın özellikleri sıklıkla copulalar kullanılarak verimli bir şekilde analiz edilir . Bir iki değişkenli bağ birim karede bir olasılık dağılımı için bir fantezi adıdır ile homojen marjinal.[0,1]2

Diyelim ki iki değişkenli bir kopuladır. Sonra, yukarıdan hemen, örneğin C ( u , v ) 0 , C ( u , 1 ) = u ve C ( 1 , v ) = v olduğunu biliyoruz .C(u,v)C(u,v)0C(u,1)=uC(1,v)=v

İki değişkenli kopulaların basit bir dönüşümü ile önceden belirlenmiş marjinallerle Öklid düzlemi üzerinde iki değişkenli rasgele değişkenler oluşturabiliriz . Let ve F 2 rastgele değişkenin bir çift kenar dağılımları reçete ( X , Y ) . Daha sonra, eğer C ( u , v ) iki değişkenli bir copula ise, , ve marjinalleri ile iki değişkenli bir dağıtım fonksiyonudur . Bu son gerçeği görmek için, sadece not alın F1F2(X,Y)C(u,v)F 1 F 2 P ( x x ) = P ( x X , Y, < ) = C ( F 1 ( x ) , F 2 ( ) ) = C ( F

F(x,y)=C(F1(x),F2(y))
F1F2
P(Xx)=P(Xx,Y<)=C(F1(x),F2())=C(F1(x),1)=F1(x).
Aynı argüman için de .F2

Sürekli ve , Sklar teoremi , benzersizliği ima eden bir sohbeti ileri sürer. Yani, sürekli marjinaller , ile iki değişkenli bir dağılım , karşılık gelen benzersizdir (uygun aralık aralığında).F1F2F(x,y)F1F2

İki değişkenli normal olağanüstü

Sklar teoremi bize (esasen) iki değişkenli normal dağılım üreten tek bir kopula olduğunu söyler. Bu, uygun bir şekilde olduğu bir bileşiği, Gauss copula üzerinde yoğunluğa sahip pay ilişki ile iki değişkenli normal dağılım olduğu değerlendirildi ve .[0,1]2

cρ(u,v):=2uvCρ(u,v)=φ2,ρ(Φ1(u),Φ1(v))φ(Φ1(u))φ(Φ1(v)),
ρΦ1(u)Φ1(v)

Ancak, çok sayıda başka kopulas var ve bunların hepsi , önceki bölümde açıklanan dönüşümü kullanarak iki değişkenli normal olmayan normal marjinallerle iki değişkenli bir dağılım verecektir .

Örneklerle ilgili bazı detaylar

Not eğer am rasgele yoğunluk ile bağ , dönüşüm altında standart normal marjinal karşılık gelen iki değişkenli yoğunluğu olan C(u,v)c(u,v)F(x,y)=C(Φ(x),Φ(y))

f(x,y)=φ(x)φ(y)c(Φ(x),Φ(y)).

Gaussian copula'yı yukarıdaki denklemde uygulayarak, iki değişkenli normal yoğunluğu geri kazandığımızı unutmayın. Ancak, başka herhangi bir seçeneği için yapmayacağız.c(u,v)

Şekildeki örnekler aşağıdaki gibi inşa edildi (her sıra boyunca devam ediyor, her seferinde bir sütun):

  1. Bağımsız bileşenleri olan iki değişkenli normal.
  2. İki değişkenli ile normal .ρ=0.4
  3. Örnek bu cevapta verilen bir Dilip Sarwate . yoğunluğunun ile indüklendiği kolayca görülebilir. .C(u,v)c(u,v)=2(1(0u1/2,0v1/2)+1(1/2<u1,1/2<v1))
  4. Yaratılan Frank copula parametresi ile .θ=2
  5. Yaratılan Clayton copula parametresi ile .θ=1
  6. Clayton copula'nın asimetrik bir modifikasyonundan, parametresiyle üretilir .θ=3

7
İki değişkenli normal yoğunluğun istisnai durum olduğunu belirtmek için +1!
Dilip Sarwate

Belki bir şeyleri özlüyorum, ancak başlarsak , eklem dağıtımı otomatik olarak, herhangi bir copula yapımından bağımsız olarak tanımlanır ve Gaussian copula inşaatlarını CDF'lerine verdiğimiz doğrudur, Gauss olmayan bir CDF elde edeceğimiz doğrudur , ancak genel olarak bu işlev, başladığımız rasgele değişken çiftinin CDF'si olmayacaktır , doğru ? X1,X2N(0,1)(X1,X2)F(x1,x2)X,X2
RandomGuy

Sağ alt paneldeki gibi nasıl benzetim yapılacağına örnek:library(copula) kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE))) # force normal margins evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1))) contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
yarı geçiş

1
@RandomGuy, olduğuna dair gösterilmemiş bir varsayımı kaçırıyorsunuz . Bağımsız olduklarını varsayarsanız, evet, ortak dağıtımı zaten biliyorsunuzdur. Bağımsızlık varsayımı olmadan, marjinal dağılımları bilmek, ortak dağılımı belirtmek için yeterli bilgi vermez. X1,X2independentN(0,1)
MentatOfDune

25

Çok değişkenli normal bir vektörün her bir elemanının kendisinin normal olarak dağıldığı ve onların araçlarını ve varyanslarını çıkarabildiğiniz doğrudur. Bununla birlikte, iki Guassian rastgele değişkeninin birlikte normal olarak dağıldığı doğru değildir. İşte bir örnek:

Düzenleme: Bir nokta kütlesi olan rastgele bir değişkenin ile normal dağılımsal bir değişken olarak düşünülebileceği görüş birliğine cevaben , örneğimi değiştiriyorum.σ2=0


Let ve izin a, rastgele değişken. Yani, her biri olasılık .XN(0,1)Y=X(2B1)BBernoulli(1/2)Y=±X1/2

Önce standart bir normal dağılıma sahip olduğunu gösterdik . YBy toplam olasılık yasası ,

P(Yy)=12(P(Yy|B=1)+P(Yy|B=0))

Sonraki,

P(Yy|B=0)=P(Xy)=1P(Xy)=1Φ(y)=Φ(y)

burada standart normal CDF'dir . Benzer şekilde,Φ

P(Yy|B=1)=P(Xy)=Φ(y)

Bu nedenle,

P(Yy)=12(Φ(y)+Φ(y))=Φ(y)

bu nedenle, KTL olan , bu şekilde .YΦ()YN(0,1)

Şimdi birlikte normal dağılmadığını gösterdik. X,Y@ Cardinal'in işaret ettiği gibi, çok değişkenli normalin bir karakterizasyonu, elementlerinin her lineer kombinasyonunun normal olarak dağılmış olmasıdır. , bu özellik yok çünküX,Y

Y+X={2Xif B=10if B=0.

Bu nedenle , rasgele değişkeninin karışımı ve 0'da nokta kütlesidir, bu nedenle normal olarak dağıtılamaz.Y+X50/50N(0,4)


4
Bu cevaba katılmıyorum. Bir dejenere nokta kütle de genellikle sıfır varyans ile dejenere Gauss rastgele değişken olarak kabul edilir. Ayrıca, , marjinal olarak sürekli olmalarına rağmen müştereken sürekli değildir. Marjinal olarak Gaussian olan ancak ortak Gauss olmayan iki ortak sürekli rastgele değişkenin bir örneği için, örneğin bu cevabın ikinci yarısına bakınız . 1μ(X,X)
Dilip Sarwate 0

4
@DilipSarwate, soru normalde dağıtılan iki değişkene (varsa) bir örnek vermekti fakat eklem dağılımları çok değişkenli normal değildi. Bu bir örnektir. Normal dağılımın çoğu standart tanımı (örneğin wikipedia en.wikipedia.org/wiki/Normal_distribution ) varyansın kesinlikle pozitif olmasını gerektirir, bu nedenle normal dağılım ailesinin bir parçası olarak bir nokta kütlesi içermez.
Makro

4
Çok değişkenli Gaussian'ın standart bir karakterizasyonu, in çok değişkenli Gaussian olmasıdır ve eğer sadece tüm . @Dilip'in işaret ettiği gibi, bunun sizin için doğru olup olmadığını düşünmeye değer. XRnaTXaRn
kardinal,

6
Görünüşe göre rasyonelliğe itirazdan hoşlanmadığın için ;-), otoriteye itiraz etmeye ne dersin? (Görünüşe göre bu bir şakaydı.) Bu konuda sadece kazara gördüm, başka bir şey ararken: Örnek 2.4 , GAF Seber ve AJ Lee'nin 22. sayfası, Doğrusal Regresyon Analizi , 2.. ed., Wiley. " yazalım ve koyalım ... Böylece çok değişkenli normal dağılıma sahiptir." YN(μ,σ2)Y=(Y,Y)Y
kardinal,

5
Tartışma tanımlarla ilgilidir. Açıkça, kovaryans matrisinin tanım gereği tekil olmayan Makro olması gerekiyorsa , bir örnek sağlar, ancak bu, @Kardinal'in de ifade ettiği daha liberal tanımlamaya göre bir örnek değildir. Daha liberal tanımı tercih etmenin iyi bir nedeni , normal değişkenlerin tüm lineer dönüşümlerinin normal olmasıdır. Özellikle normal hatalara sahip lineer regresyonda artıklar ortak bir normal dağılıma sahiptir, ancak kovaryans matrisi tekildir.
NRH

5

Aşağıdaki yazı , sadece ana fikirleri vermek ve başlamanızı sağlamak için bir kanıt taslağını içerir.

Let iki bağımsız Gauss rastgele değişkenler ve izin olabilir z=(Z1,Z2)x=(X1,X2)

x=(X1X2)=(α11Z1+α12Z2α21Z1+α22Z2)=(α11α12α21α22)(Z1Z2)=Az.

Her bir , ancak her ikisi de aynı bağımsız r.vs'nin lineer kombinasyonları olduğundan, birbirlerine bağımlıdırlar.XiN(μi,σi2)

Tanım Bir çift r.vs normalde iki değişkenli olduğu bağımsız normal r.vs doğrusal bir kombinasyonu olarak yazılabilir .x=(X1,X2)x=Azz=(Z1,Z2)

Lemma Eğer iki değişkenli bir Gauss ise, o zaman diğer doğrusal kombinasyonları yine normal bir rasgele değişkendir.x=(X1,X2)

Kanıt . Önemsiz, kimseyi rahatsız etmemek için atlandı.

Özellik Eğer ilişkisizse, o zaman bağımsız ve tam tersidir.X1,X2

DağılımıX1|X2

Varsayalım önceki gibi ama en pozitif varyans ve sıfır basitlik için ortalama varsayalım aynı Gauss r.vs bulunmaktadır.X1,X2

Eğer tarafından yayılmış alt uzay olan , izin ve .SX2X1S=ρσX1σX2X2X1S=X1X1S

X1 ve , doğrusal kombinasyonlarıdır , bu nedenle de vardır. Ortak Gauss'lar, ilişkisiz (ispat) ve bağımsızlar.X2zX2,X1S

Ayrışma ile tutar

X1=X1S+X1S
E[X1|X2]=ρσX1σX2X2=X1S

V[X1|X2]=V[X1S]=E[X1ρσX1σX2X2]2=(1ρ)2σX12.

O zaman

X1|X2N(X1S,(1ρ)2σX12).

İki tek değişkenli Gauss rastgele değişkeni , eğer şart koşullan ise ortaklaşa Gauss'tur. ve de Gauss'lu.X | Y Y | XX,YX|YY|X


2
Bu gözlemin soruyu nasıl cevapladığı belli değil. Ürün kuralı pratik olarak koşullu dağılımın tanımı olduğundan, binormal dağılımlar için özel değildir. Bundan sonra "sonra sırayla ..." ifadesi herhangi bir sebep sağlamaz: şartlı dağılımlar neden normal olmalı?
whuber

Ben şu ana soruya cevap veriyorum: "İki Gaussian'ın ortak ihtimalinin Gauss olmadığı bir durumun olup olmadığını merak ediyorum." Yani, cevap: şartlı normal olmadığı zaman. - Yardımcı
yardımcı

2
Bu gösteriyi tamamlayabilir misin? Şu anda bu sadece senin kanıtın kanıtı olmayan bir iddia. Doğru olduğu hiç belli değil. Aynı zamanda eksiktir, çünkü varoluş kurmanız gerekir: yani, bir ortak dağıtımın normal marjinallere sahip olduğunu ancak bunun için koşullu olmayan en az bir koşulun mümkün olduğunu kanıtlamanız gerekir . Şimdi aslında bu çok doğru, çünkü marjinallerini değiştirmeden sıfır değerindeki bir binormalin her koşullu dağılımını serbestçe değiştirebilirsiniz - ancak bu olasılık sizin iddialarınıza aykırı görünüyor.
whuber

Merhaba @whuber, Bu daha fazla yardımcı olur umarım. Yapmanız gereken herhangi bir öneriniz veya düzenlemeniz var mı? Bunu çok çabuk yazdım şu anda çok fazla boş vaktim olmadı :-) ama yapabileceğiniz herhangi bir öneri veya iyileştirmeye değer veririm. En iyi
yardımcı

(1) Neyi kanıtlamaya çalışıyorsun? (2) Soru, Gauss marjinalleriyle bir dağıtımın ne zaman ortak Gauss olmadığını sorduğunu sorduğundan , bu argümanın alakalı herhangi bir şeye nasıl yol açtığını anlamıyorum.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.