Lojistik regresyon modeli, tahmin edicideki birim fark başına sonuç riskindeki nispi değişiklikleri karşılaştırmak için doğal parametre (log-odds oranı) kullanılarak maksimum olasılıktır. Bu, elbette, sonuç için binom olasılık olasılığını varsayar. Bu, lojistik regresyonun tutarlılık ve sağlamlık özelliklerinin doğrudan maksimum ihtimalden kaynaklandığı anlamına gelir: rastgele verilerde eksiklik, kök tutarlılık, denklemlerin tahmin edilmesinde çözümlerin varlığı ve benzersizliği. Bu, çözümlerin parametre uzayının sınırları üzerinde olmadığı varsayılmaktadır (log oranlarının olduğu yerlerde ). Lojistik regresyon maksimum olasılık olduğundan, kayıp fonksiyonu, denk optimizasyon problemleri olduğu için olasılıkla ilgilidir.±∞
Yarı değerli olma veya tahmin denklemleriyle (yarı parametrik çıkarım), varoluş, benzersizlik özellikleri hala geçerli olmakla birlikte, ortalama modelin tuttuğu varsayımının ilgili olmadığı ve çıkarım ve standart hataların model yanlışlığına bakılmaksızın tutarlı olduğu varsayılmaktadır. Bu durumda, bu sigmoidin doğru fonksiyon olup olmadığı değil, bize inanabileceğimiz bir trend veren ve genişletilebilir bir yorumu olan parametrelerle parametreleştirilen bir meseledir.
Bununla birlikte sigmoid, etrafındaki tek ikili modelleme işlevi değildir. En sık kontrastlı probit fonksiyonu benzer özelliklere sahiptir. Log-oran oranlarını tahmin etmiyor, ancak işlevsel olarak çok benzer görünüyorlar ve aynı şeye çok benzer yaklaşımlar verme eğiliminde . Bir de ortalama model işlevinde sınırlık özelliklerini kullanmak gerekmez. Basitçe, bir binom değişkenliği işlevine sahip bir log eğrisi kullanmak, göreceli risk regresyonu verir, binom değişkenliğine sahip bir kimlik bağı, ilave risk modelleri verir. Bütün bunlar kullanıcı tarafından belirlenir. Lojistik regresyonun popülaritesi, ne yazık ki, neden bu kadar yaygın kullanıldığı. Bununla birlikte, neden birçok ikili sonuç modelleme koşulunda kullanılmasının haklı olduğunu düşündüğüm nedenlerimi (belirttiğim gibi) sahibim.
Çıkarım dünyasında, nadir sonuçlar için, oran oranı kabaca "göreceli risk", yani "X + 1 ile X'i karşılaştıran sonuç riskinde yüzde göreceli değişim" olarak yorumlanabilir. Bu her zaman böyle değildir ve genel olarak, oran oranı böyle yorumlanamaz ve yorumlanmamalıdır. Bununla birlikte, bu parametrelerin yorumu vardır ve diğer araştırmacılara kolayca iletilebilir, makine öğrenenlerinin didaktik materyallerinde ne yazık ki eksik olan önemli bir noktadır.
Lojistik regresyon modeli ayrıca hiyerarşik modelleme gibi daha karmaşık yaklaşımların yanı sıra katlanarak artan rahatsızlık parametrelerine tutarlı ve sağlam olan karma modelleme ve koşullu olasılık yaklaşımları için kavramsal temeller sağlar. GLMM'ler ve şartlı lojistik regresyon, yüksek boyutlu istatistiklerde çok önemli kavramlardır.