Dağıtım seçimimi doğruladığını belirtmek için çok mu uzak olacak?
Bu tam olarak 'doğrulamak' ile ne demek istediğinize bağlıdır, ama ben “evet, bu çok ileri gider” diyebilirim ki “boşun gerçek olduğu gösterilmiştir” diyemezsiniz (özellikle nokta null'larla, ancak en azından bir anlamda daha genel olarak). Sadece "iyi, bunun yanlış olduğuna dair güçlü kanıtlarımız yok" diyebilirsiniz. Ancak her durumda modellerimizin mükemmel olmasını beklemiyoruz, onlar model . Box & Draper'ın dediği gibi " yararlı olmamaları ne kadar yanlış olmalı? "
Önceki iki cümleden herhangi biri:
Bu, bana göre, bir Gauss dağılımı seçiminin oldukça makul olduğunu gösteriyor. Ya da en azından, artıklar modelimde kullandığım dağılımla tutarlı.
teşhisinizin ne gösterdiğini çok daha doğru bir şekilde açıklayın - günlük bağlantısına sahip bir Gauss modelinin doğru olmadığını - ancak makul veya verilerle tutarlı olduğunu tanımlayın .
Yanıt değişkenim her zaman pozitif olduğundan bir günlük bağlantı işlevi seçtim, ancak bunun iyi bir seçim olduğunu onaylamak istiyorum.
Eğer bunun pozitif olması gerektiğini biliyorsanız, o zaman ortalaması pozitif olmalıdır. En azından bununla tutarlı bir model seçmek mantıklı. İyi bir seçim olup olmadığını bilmiyorum (çok daha iyi seçenekler olabilir), ama yapmak için makul bir şey; benim başlangıç noktam olabilir. [Ancak, değişkenin kendisi mutlaka pozitifse, ilk düşüncem Gaussian'dan ziyade log-linkli Gamma olma eğilimindedir. "Mutlaka pozitif", ortalama ile değişen hem çarpıklığı hem de sapmayı gösterir.
S2: Bağlantı seçimi seçimimi destekleyebilecek kalıntıların dağıtım seçimi için kontrol edilmesi gibi testler var mı?
Görünüşe göre "resmi hipotez testinde" olduğu gibi "test" anlamına gelmez, "teşhis kontrolü" olarak adlandırılır.
Her iki durumda da, cevap evettir.
Resmi bir hipotez testi Pregibon'un Bağlantı İyiliği testidir [1].
Bu, Box-Cox parametresinin hipotez testini yapmak için link fonksiyonunun bir Box-Cox ailesine gömülmesine dayanır.
Ayrıca Breslow içinde Pregibon testinin kısa bir tartışma (1996) [2] (bkz s 14'e bakınız ).
Bununla birlikte, teşhis yoluna bağlı kalmanızı şiddetle tavsiye ederim. Bir bağlantı işlevini kontrol etmek istiyorsanız, temel olarak bağlantı ölçeğinde, modelin 'lerinde doğrusal olduğunu, dolayısıyla temel bir değerlendirmenin belirleyicilere karşı kalıntıların çizimi. Örneğin,η=g(μ)x
çalışma artıklarırWi=(yi−μ^i)(∂η∂μ)
(bu değerlendirme için eğildiğim) veya belki de her bir tahmin için bir arsa ile kısmi artıklarda doğrusallıktan sapmalara bakarak (bkz. örneğin, Hardin ve Hilbe, Genelleştirilmiş doğrusal modeller ve uzantılar, 2. baskı sn 4.5) .4 p54, tanım için),
rTki=(yi−μ^i)(∂η∂μ)+xikβ^k
=rWi+xikβ^k
Verilerin link fonksiyonu ile dönüşümü kabul ettiği durumlarda, lineerliği doğrusal regresyon ile aynı şekilde arayabilirsiniz (siz benim eğriliğime ve muhtemelen heteroskedastisiteye sahip olsanız da).
Kategorik öngörücüler söz konusu olduğunda, bağlantı fonksiyonunun seçimi daha kolay veya yorumlanabilir bir konudur, uyum aynı olmalıdır (bu yüzden onlar için değerlendirmeye gerek yoktur).
Bir tanıyı Pregibo'nun yaklaşımına dayandırabilirsiniz.
Bunlar ayrıntılı bir liste oluşturmaz; tartışılan diğer teşhisleri bulabilirsiniz.
[Bununla birlikte, gung'un bağlantı işlevi seçiminin başlangıçta mümkün olduğunda teorik değerlendirmeler gibi şeylere dayandırılması gerektiğine ilişkin değerlendirmesine katılıyorum.]
En azından kısmen alakalı olan bu yayındaki tartışmaya da bakınız .
[1]: Pregibon, D. (1980),
"Genelleştirilmiş Doğrusal Modeller için Bağlantı Testlerinin İyiliği,"
Kraliyet İstatistik Kurumu Dergisi. Seri C (Uygulamalı İstatistik) ,
Cilt. 1, sayfa 15-23.
[2]: Breslow NE (1996),
"Genelleştirilmiş doğrusal modeller: Varsayımların kontrolü ve sonuçların güçlendirilmesi,"
Statistica Applicata 8 , 23-41.
pdf