Lojistik regresyonun web'deki tıklama oranlarını tahmin etmek için sıklıkla kullanılmasının nedenlerinden birinin, iyi kalibre edilmiş modeller üretmesi olduğunu anlıyorum. Bunun için iyi bir matematiksel açıklama var mı?
Lojistik regresyonun web'deki tıklama oranlarını tahmin etmek için sıklıkla kullanılmasının nedenlerinden birinin, iyi kalibre edilmiş modeller üretmesi olduğunu anlıyorum. Bunun için iyi bir matematiksel açıklama var mı?
Yanıtlar:
Evet.
Lojistik regresyondan tahmin edilen olasılık vektörü matris denklemini karşılar
Burada , tasarım matrisi ve , yanıt vektörüdür. Bu, tasarım matrisinin her bir sütunundan kaynaklanan bir lineer denklem koleksiyonu olarak görülebilir .
Kesişme sütununa (transpoze edilen matristeki bir satır olan) uzmanlaşmış, ilişkili doğrusal denklem
dolayısıyla, ortalama ortalama tahmin edilen olasılık, yanıtın ortalamasına eşittir.
Daha genel olarak, ikili özellik sütunu için ilişkili doğrusal denklem
dolayısıyla, tahmin edilen olasılıkların toplamı (ve dolayısıyla ortalama), olan kayıtlar için uzmanlaşırken bile yanıtın toplamına eşittir .
Sanırım aşağıdaki gibi anlaşılması kolay bir açıklama sağlayabilirim:
Biz biliyoruz bunun kaybı işlevi aşağıdaki fonksiyonu olarak ifade edilebilir: Tüm eğitim örneklerinin sayısını temsil ettiği
yerde , i örneğinin etiketi, i örneğinin tahmini olasılığı: . ( burada önyargıya dikkat edin )
m
Eğitimin amacı kayıp fonksiyonunu en aza indirgemek olduğundan, kısmi türevini her parametre (detaylı türev burada bulunabilir ) ile değerlendirelim:
Ve sıfıra sıfıra ayarlar:
Bu, eğer model tamamen eğitilmişse, eğitim seti için elde ettiğimiz tahmini olasılıklar her bir özellik için o özelliğin ağırlıklı (tüm) değerlerinin toplamının o özelliğin değerlerinin toplamına eşit olacağı anlamına gelir. pozitif örneklerin.
Yukarıdakiler bias gibi her özelliğe uyar . Ayar 1 olarak ve kadar yeilds:
Sonra şunu elde ederiz:
Burada , i. örnek için tamamen eğitilmiş modelin tahmini olasılığıdır. Ve işlevi kompakt bir şekilde yazabiliriz:
Lojistik regresyonun iyi kalibre edildiğini açıkça görebiliriz .
Referans: Log-lineer Modeller ve Koşullu Rastgele Alanlar - Charles Elkan