Neden iki normal dağılım değişkeninin bir karışımı sadece ortalamaları standart standart sapmanın en az iki katı kadar farklı ise iki modludur?


28

İki normal dağılımın karışımı altında:

https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions

"İki normal dağılımın bir karışımını tahmin etmek için beş parametreye sahiptir: iki araç, iki değişken ve karışım parametresi. Eşit standart sapmalara sahip iki normal dağılımın bir karışımı, ortalamaları ortalama standart sapmanın en az iki katı farklı ise iki modludur. ."

Bunun neden doğru olduğuna dair bir türetme veya sezgisel açıklama arıyorum. İki örneklem t testi şeklinde açıklanabileceğine inanıyorum:

μ1μ2σp

burada toplanmış standart sapmadır.σp


1
sezgi, araçların çok yakın olması durumunda, 2 yoğunluğun kütlesinde çok fazla örtüşmenin olacağı, böylece araçlardaki farkın görülmeyeceği, çünkü farkın sadece iki kütle ile çarpışacağını; yoğunlukları. İki araç yeterince farklıysa, iki yoğunluğun kütleleri o kadar üst üste binmez ve araçlardaki fark fark edilir olacaktır. Fakat bunun matematiksel bir kanıtını görmek isterim. Bu ilginç bir ifade. Daha önce hiç görmedim.
mlofton

2
Daha resmi olarak, aynı SD ile iki normal dağılımın 50:50 karışımı için eğer yoğunluğu parametrelerini tam olarak , parametreleri İkinci türev değişiminin, araçlar arasındaki mesafe altına yükseldiği zaman, iki araç arasındaki orta noktada işarete sahip olduğunu görün . f ( x ) = 0.5 g 1 ( x ) + 0.5 g 2 ( x ) 2 σσ,f(x)=0.5g1(x)+0.5g2(x)2σ
BruceET

Yanıtlar:


53

Bu wiki makalesinde yer alan yazıdan çıkan rakam güzel bir örnek: görüntü tanımını buraya girin

Sağladıkları kanıt, normal dağılımların, ortalamalarının bir SD'sinde içbükey olduğu gerçeğine dayanmaktadır (SD, içbükeyden dışbükeye giden normal pdf'in çarpma noktasıdır). Bu nedenle, iki normal pdfs'i bir araya (eşit oranlarda) eklerseniz, araçları iki SD'den daha az farklılık gösterdiği sürece, toplam-pdf (yani karışım), iki araç arasındaki bölgede içbükey olur ve bu nedenle küresel maksimum, tam olarak iki araç arasındaki noktada olmalıdır.

Kaynak: Schilling, MF, Watkins, AE ve Watkins, W. (2002). İnsan Boyu Bimodal mı? Amerikan İstatistiği, 56 (3), 223-222. DOI: 10,1198 / 00031300265


11
+1 Bu güzel, unutulmaz bir argümandır.
whuber

2
Şekil başlığı aynı zamanda “bükülme” de yanlış çevrilen “fl” bağının güzel bir gösterimini sunar :-P
nekomatic

2
@Axeman: Bu referansı eklediğiniz için teşekkür ederiz - bu biraz dağıldığından beri, kendimi eklemeyi planlamıştım, çünkü sadece tartışmalarını yineliyorum ve bunun için çok fazla kredi almak istemiyorum.
Ruben van Bergen

14

Bu, resimlerin aldatıcı olabileceği bir durumdur, çünkü bu sonuç normal karışımların özel bir özelliğidir : bileşenler simetrik unimodal dağılımlar olsa bile, bir analogun diğer karışımlar için mutlaka tutması gerekmez! Örneğin, ortak standart sapmalarının iki katından biraz daha az bir miktarla ayrılan iki Student t dağılımının eşit bir karışımı çift modlu olacaktır. O zaman gerçek bir kavrayış için, Normal dağılımların özel özelliklerine bir miktar matematik ya da itirazda bulunmak zorundayız.


Bileşen dağıtım araçlarını ve ortak değişkenlik birliğini sağlamak için ölçüm birimlerini seçin (gerektiği gibi yeniden ölçekleyerek) . Let karışım içinde daha büyük ortalama bileşen miktarı olabilir. Bu, karışım yoğunluğunu genel olarak tam olarak ifade etmemizi sağlar.±μ, μ0,p, 0<p<1,

2πf(x;μ,p)=pexp((xμ)22)+(1p)exp((x+μ)22).

Her iki bileşen yoğunluğu, artacağı ve azaldığı için mümkün olan tek mod Farklılaşarak Onları bulun göre ve sıfıra ayarlama. Elde ettiğimiz pozitif katsayıları temizlex<μx>μ,μxμ.fx

0=e2xμp(xμ)+(1p)(x+μ).

İkinci türevi ile benzer işlemleri yapmak ve değiştirilmesi Yukarıdaki denklem tarafından belirlenen değerin bize kritik noktada ikinci türevinin işareti anlatır işaretidirfe2xμ

f(x;μ,p)(1+x2μ2)xμ.

Payda negatif olduğu zaman işareti olduğu bir , işaretin negatif olması gerektiği açıktır . Bununla birlikte, bir çok modlu dağılımda (yoğunluk sürekli olduğu için), işaretin negatif olmadığı herhangi iki mod arasında bir antimod bulunmalıdır . Bu nedenle, (SD) az olduğunda , dağıtım tekdüze olmalıdır.μ<x<μ,f(1μ2+x2).μ1,μ 1μ1

Ortalamaların ayrılması bu analizin sonucu2μ,

Normal dağılımların bir karışımı, araçlar ortak standart sapmanın iki katından daha fazla olmayan bir şekilde ayrıldığında tekdüze değildir.

Bu, mantıken söz konusu ifadeye eşdeğerdir.


12

Süreklilik için buraya yapıştırılan yukarıdan yorum :

"[F] normalde, aynı SD σ ile iki normal dağılımın 50:50 karışımı için, eğer yoğunluğu parametrelerini tam olarak , İkinci türev değişiminin, araçlar arasındaki mesafe 2σ'nin altına yükseldiğinde, iki araç arasındaki orta noktada işaretini göreceksiniz. "

f(x)=0.5g1(x)+0.5g2(x)

Yorum devam etti:

Her durumda 'karışık' olan iki normal eğri sahiptirSoldan sağa, araçlar arasındaki mesafeler sırasıyla ve . Karışım yoğunluğunun orta noktadaki (1.5) kıvamı, araçlar arasında negatifden sıfıra, pozitif olarak değişmektedir.σ=1.3σ,2σ,σ,

görüntü tanımını buraya girin

Şekil için R kodu:

par(mfrow=c(1,3))
  curve(dnorm(x, 0, 1)+dnorm(x,3,1), -3, 7, col="green3", 
    lwd=2,n=1001, ylab="PDF", main="3 SD: Dip")
  curve(dnorm(x, .5, 1)+dnorm(x,2.5,1), -4, 7, col="orange", 
    lwd=2, n=1001,ylab="PDF", main="2 SD: Flat")
  curve(dnorm(x, 1, 1)+dnorm(x,2,1), -4, 7, col="violet", 
    lwd=2, n=1001, ylab="PDF", main="1 SD: Peak")
par(mfrow=c(1,3))

1
tüm cevaplar harikaydı. Teşekkürler.
mlofton

3
2/30.001.

1
0.1% fx0)
f(x0)f(x)0.001f(x0)  |xx0|0.333433,
0.0010.95832
f(x0)f(x)0.001  |xx0|0.47916.

Güzel nokta. Aslında kısaltılmış dilden kastettiğim 'düz' tam orta noktada sıfır 2. türevdi.
BruceET
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.