Bir dizi bağımsız, aynı şekilde dağıtılmış tek değişkenli gözlem ve nasıl oluşturulduğu hakkında iki hipotezim olduğunu varsayalım :
: , bilinmeyen ortalama ve varyansa sahip tek bir Gauss dağılımından çizilir.
: ortalama, varyans ve karışım katsayısı bilinmeyen iki Gaussian karışımından alınmıştır.
Doğru anladıysam, bu o modele beri iç içe modellerdir açısından tarif edilebilir temsil Eğer aynı olması ya da iki Gauss biri için sıfır olması karıştırma katsayısı sınırlamak için iki Gauss parametreleri sınırlamak durumunda.
Bu nedenle, H_A parametrelerini tahmin etmek için EM algoritmasını kullanabilmeniz ve daha sonra H_A altındaki verilerin olasılığının H_0 altındakinden daha büyük olup olmadığını belirlemek için Wilks Teoremini kullanabilmeniz . EM algoritmasının burada maksimum olasılığa yaklaşacağı varsayımına küçük bir inanç atılımı var, ancak yapmaya istekli olduğum varsayım.
Bunu monte edilmiş bir carlo simülasyonunda denedim, H_A'nın H_0'dan (ikinci Gauss ve karıştırma parametresi için ortalama ve varyans) daha fazla 3 serbestlik derecesi olduğunu varsayarak . H_0'dan veri simüle ettiğimde , büyük ölçüde düzgün olmayan ve küçük P değerleri için zenginleştirilmiş bir P-değeri dağılımı elde ettim. (EM gerçek maksimum olasılığa yaklaşmasaydı, bunun tam tersi beklenirdi.) Wilks'in bu önyargıyı yaratan teoremini uygulamamda sorun nedir?