Doğrusal regresyonda gözlemlerin, yordayıcı değerlerine koşullu ortalama bir parametreye sahip bir Gauss dağılımını takip ettiği varsayılmaktadır. Gözlemlerden ortalamayı çıkarırsanız, hatayı alırsınız. : ortalama sıfıra sahip bir Gauss dağılımı, & tahmin değerlerinden bağımsız - herhangi bir tahmin değeri kümesindeki hatalar aynı dağılımı izler.
Lojistik regresyon gözlemlerinde , tahmin değerlerine bağlı olan ortalama bir parametre (olasılık) olan bir Bernoulli dağılımını † takip ettiği varsayılır . Yani ortalama belirleyen herhangi bir belirleyicisi değerleri için TT : orada sadece iki olası hatalardır 1 - π olasılığı ile meydana gelen tt , ve 0 - π olasılık ile ortaya çıkan 1 - tt . Diğer tahmini değerleri için hatalar olacaktır 1 - π ' olasılık ile ortaya çıkan tt 'y∈{0,1}π1−ππ0−π1−π1−π′π', & olasılıkla birlikte ortaya çıkan 1 - π ′0 - π'1 - π' . Dolayısıyla, yordayıcı değerlerinden bağımsız olarak ortak bir hata dağılımı yoktur, bu yüzden insanlar "hata terimi yoktur" der (1).
"Hata terimi binom dağılımına sahiptir" (2) sadece dikkatsizliktir - "Gauss modellerinde Gauss hataları vardır, ergo binom modellerinde binom hataları var". (Veya @whuber'ın işaret ettiği gibi, "gözlem ile beklenti arasındaki farkın beklenti tarafından çevrilmiş binom dağılımına sahip olduğu" anlamına gelebilir.)
"Hata terimi bir lojistik dağılıma sahiptir" (3), bir lojistik dağılımın ardından hatalı bir gizli değişkenin bir eşik değeri aşıp aşmadığını gözlemlemek için modelden lojistik regresyonunun türetilmesinden kaynaklanmaktadır. Yani yukarıda tanımlanan aynı hata değil. (IMO'yu bu bağlamın dışında veya gizli değişkene açıkça atıfta bulunmadan söylemek garip bir şey olabilir.)
Eğer varsa † aynı olasılık vererek aynı belirleyici değerlerle gözlemleri tt her biri için, o zaman bunların toplamı Σ y olasılık ile bir binom dağılımını izler tt ve hayır. denemeler k . Düşünüldüğünde Σ y - k tt aynı sonuca hata potansiyel müşteriler gibi.kπ∑ yπk∑ y- k π