Burada birkaç sorun var.
(1) Modelin açıkça olasılıklı olması gerekir . Neredeyse her durumda olacak hiçbir lhs tüm verileriniz için rhs maçları hangi parametrelerin set: artıklar olacaktır. Bu artıklar hakkında varsayımlar yapmanız gerekiyor. Ortalama olarak sıfır olmalarını mı bekliyorsunuz? Simetrik olarak dağıtılacak mı? Yaklaşık olarak normal dağıtılacak mı?
Aşağıda belirtilen model ile aynı fikirde olan ancak büyük ölçüde farklı kalıntı davranışlara izin veren iki model bulunmaktadır (ve bu nedenle genellikle farklı parametre tahminleriyle sonuçlanacaktır). Bu modelleri nin ortak dağılımı hakkındaki varsayımları değiştirerek değiştirebilirsiniz :ϵi
B: y i = β 0 exp ( β 1 x 1 i + … + β k x k i ) + ϵ i .
A: y ben= β0tecrübe( β1x1 ben+ … + Βkxk i+ ϵben)
B: y ben= β0tecrübe( β1x1 ben+ … + Βkxk i) + ϵben.
(Bunların verileri için modeller olduğunu ; genellikle tahmini veri değeri diye bir şey yoktur .)^ y iybenyben^
(2) y değerleri için sıfır değerlerinin ele alınması ihtiyacı , belirtilen model (A) 'nın hem yanlış hem de yetersiz olduğunu ima eder , çünkü rastgele hatanın değeri ne olursa olsun sıfır değeri üretemez. (B) 'nin üzerindeki ikinci model, y'lerin sıfır (hatta negatif) değerlerine izin verir. Ancak, sadece böyle bir temelde bir model seçilmemelidir. 1'i tekrarlamak için: hataları makul bir şekilde modellemek önemlidir.
(3) Doğrusallaştırma modeli değiştirir . Tipik olarak, (A) gibi, ancak (B) gibi olmayan modellerle sonuçlanır. Bu değişikliğin parametre tahminlerini önemli ölçüde etkilemeyeceğini bilmek için verilerini analiz eden kişiler ve neler olduğunu bilmeyen kişiler tarafından kullanılır. (Farkı söylemek birçok kez zordur.)
(4) Sıfır değerinin olasılığını ele almanın yaygın bir yolu , (ya da karekök gibi bir miktar yeniden ifadesinin) kesinlikle pozitif olarak eşit sıfır şansına sahip olmasını önermektir . Matematiksel olarak, bir nokta kütlesini (bir "delta fonksiyonu") başka bir dağılımla karıştırıyoruz. Bu modeller şöyle görünür:y
f( yben)θj∼ F( θ ) ;= βj 0+ βj 1x1 ben+ ⋯ + βj kxk i
burada , vektöründe örtük parametrelerden biridir , , parametrelendirilmiş bazı dağıtım ailesidir tarafından ve yeniden ekspresyonuna olan (: giderebilirsiniz yanıtını bakın genelleştirilmiş lineer modelin 'bağlantı' fonksiyonu) 'in. (Tabi ki, daha sonra, = zaman ). Örnekler sıfır şişirilmiş Poisson ve Negatif Binom modelleri .PrFθ[ f( Y) = 0 ] = θj + 1> 0θFθ1, … , ΘjfyPrFθ[ f( Y) ≤ t ]( 1 - θj + 1) Fθ( t )t ≠ 0
(5) Bir model oluşturma ve uydurma konuları birbiriyle ilişkilidir ancak farklıdır . Basit bir örnek olarak, sıradan bir regresyon modeli bile en az kareler (Maksimum Olabilirlik ve neredeyse aynı standart hatalarla aynı parametre tahminlerini veren) birçok yönden sığabilir, iteratif en küçük kareler yeniden ağırlıklandırmalı , çeşitli diğer formları " sağlam azından kareler " vb uydurma seçimi genellikle rahatlık çıkar dayanmaktadır ( örn , yazılımın kullanılabilirliği), aşinalık, alışkanlık veya kongre, fakat en azından bazı düşünce olmalıdır hata terimlerinin varsayılan dağılımı için neyin uygun olduğuna,ϵ iY= β0+ β1X+ ϵεbensorun için kayıp fonksiyonu makul olabilir ve ek bilgilerden yararlanma olasılığı ( parametreler için önceki dağıtım gibi ) olabilir.