Belirli bir doğrusal olmayan modelin uyum iyiliği nasıl değerlendirilir? [kapalı]


10

Doğrusal olmayan bir modelim var , burada standart normal dağılımın cdf'si ve f doğrusal değildir (aşağıya bakınız). Ben parametre ile bu modelin uyum iyiliğini test etmek istiyorum Verilerime , bulmak için kullanılan en yüksek olabilirlik tahmini yaptıktan sonra . Uygun bir test ne olurdu? Bu testi kötü bir uyum olarak kötü olarak etiketlemek ve daha fazla veri toplanıp toplanmayacağını belirlemek için kullanmak istiyorum.Φ a ( x 1 , y 1 ) , ( x 2 , y 2 ) , , ( x n , y n ) ay=Φ(f(x,a))+εΦa(x1,y1),(x2,y2),,(xn,yn)a

dağılımını kullanarak uygunluk iyiliği testi ile bu modeli doymuş modelle karşılaştıran sapma kullanarak baktım . Bu uygun olur mu? Sapkınlık hakkında okuduğum şeylerin çoğu onu GLM'lere uygular, ki bu benim sahip olmadığım şey değil. Sapma testi uygunsa, testi geçerli kılmak için hangi varsayımların yapılması gerekir?χn12

Güncelleme: için durumunda bu yardımcı olur. x>1,a>0f=x1ax2+1x>1,a>0


1
Cevap, analizin amacına ve kullandığınız temel olasılık modeline bağlıdır; benzersiz ya da en iyi matematiksel cevap yoktur. Örneğin, farklı bir şekilde bir model için uyum iyiliğini ölçerdiniz formu biri için daha (iid hatalarıyla ). y=Φ(f(x,a)+ε)y=Φ(f(x,a))+εε
whuber

Teşekkürler. Sorumu açıkladım. En iyi yanıtın olmadığının farkındayım, ancak yine de sapmanın burada uygunluğu test etmek için uygun olup olmadığını bilmek istiyorum ve eğer değilse, uygun olarak işaretlemek için uygun başka bir test nedir? çok zayıftır ve daha fazla veri toplanması (modelin doğru olduğu varsayılarak) veya modelin verileri tanımlamadığını söylemek gerekir.
spadequack

1
Hedef değişkeniniz mı yoksa sürekli mi? Eski, o zaman olarak modeli çerçeve olabilir bunun yerine ilave bir hata terimi sahip ve gerçek ile tahmin karşılaştırmak ve için doğru ve yanlış pozitif oranlar veya veya sapma veya başka alternatiflerin bulunduğu bir temel modelle karşılaştırın . İkincisi ise, artık için varsaydığınız dağılım nedir? y0,1p(y=1)=Φ(f(x,a))y=0y=1p(y=1)=y¯
jbowman

1
Kapatma için oylama talebi cevapsız olduğu için oylama sona erdi.
whuber

Yanıtlar:


1

R platformunu kullanıyorsanız "NP" kütüphanesindeki "npcmstest" paketini kullanın. Uyarı: İşlevin modelinizi değerlendirmesi birkaç dakika sürebilir.

Ayrıca, yanıt dağılımı ile öngörücü dağılımın (teorik olarak KL sapması, çapraz entropi, vb.) Bilgi teorik bir karşılaştırmasını da düşünebilirsiniz.


Yöntem, ya bir model gerektirir görünüyor lmya glm. Bu doğrusal olmayan bir model için nasıl çalışır? (Evet, R kullanıyorum.) olması durumunda soruma ne olduğunu ekledim . f
spadequack

@ gamveya benzeri ( mgcvpaket) kullanıyor musunuz? Değilse, kontrol etmelisiniz.
suncoolsu

1

İşte bunu nasıl yapacağım, temelde bir olasılık oranı testi. Ancak unutmayın ki uyum testinin iyiliğini anlamanın “anahtarı”, test ettiğiniz alternatiflerin sınıfını anlamaktır. Şimdi her bir veri noktası için aşağıdaki gibi bir ihtimalimiz var:

p(yi|xi,a,I)=g(ϵi)=g(yifi)

Burada , modelinizdeki hata teriminin olasılığıdır ve , verilen veri noktası için model öngörüsüdür. ve . Şimdi her veri noktası için biz seçebilir şekilde "doymuş modeli" Senin dediğin gibi -. Sen çok yalnızca aynı hata olasılığı, olanların sınıf içindeki alternatifler teste istiyorsanız testi, burada uygun olan yani bilerek (ve likelihoods her bağımsızlığını var başka bir tahmin yardımcıg(ϵ) xia(xi,yi)afi=yiχ2g(ϵ)xj,yjyiafi=xi1axi2+1xia(xi,yi)afi=yiχ2g(ϵ)xj,yjyi, verilen ). a


1
Bu işe yaramayacaktır, çünkü olasılık oranı testinin serbestlik dereceleri doymuş model için olarak büyür . O(n)
StasK

0

Doğrusal regresyon bağlamında, uyum iyiliği testi genellikle daha karmaşık bir alternatife karşı yapılır. Doğrusal bir regresyonunuz var - doğrusal formun yeterli olup olmadığını test etmek için bazı polinom terimleriyle atın. Zaten doğrusal olmayan bir fonksiyonel formunuz olduğundan, dikkate almanız gereken karmaşık alternatif parametrik olmayan regresyonun olması gerekir . Kendi zihniyetini gerektirdiği ve ayrı bir uygun girişe değer olduğu için konuya giriş yapmaya çalışmayacağım. Parametrik ve parametrik olmayan regresyonların testi için Wooldridge (1992) veya Hardle ve Mammen (1993) , çok benzer şeyler yaparlar. Hardle ayrıca konuyla ilgili harika bir kitap yazdı .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.