Lojistik regresyon (ve daha genel olarak GLM) Makine Öğrenimine ait DEĞİLDİR ! Aksine, bu yöntemler parametrik modellemeye .
Hem parametrik hem de algoritmik (ML) modeller, verileri farklı şekillerde kullanır. Algoritmik modeller verilerden yordayıcıların öngörüye nasıl eşlendiğini öğrenir, ancak gözlemleri üreten süreç hakkında (aslında başka bir varsayım) herhangi bir varsayımda bulunmazlar. Girdi ve çıktı değişkenleri arasındaki temel ilişkilerin karmaşık ve bilinmeyen olduğunu düşünürler ve bu nedenle, resmi bir denklem uygulamaktan ziyade neler olduğunu anlamak için veriye dayalı bir yaklaşım benimserler.
Öte yandan, parametrik modellere, incelenen sürecin bazı bilgilerine dayanarak bir önsel reçete edilir , verileri parametrelerini tahmin etmek için kullanır ve uygulamada nadiren tutulan çok gerçekçi olmayan varsayımlar yapar (bağımsızlık, eşit varyans ve Hataların normal dağılımı).
Ayrıca parametrik modeller (lojistik regresyon gibi) küresel modellerdir. Verilerdeki yerel kalıpları yakalayamazlar (RF veya Yükseltilmiş Ağaçlar gibi temel modeller olarak ağaçları kullanan ML yöntemlerinin aksine). Bkz. Bu kağıt sayfası 5. Bir düzeltme stratejisi olarak, yerel (yani parametrik olmayan) GLM kullanılabilir (örneğin, locfit R paketine bakınız).
Genellikle, altta yatan fenomen hakkında çok az bilgi mevcut olduğunda, veri odaklı bir yaklaşım benimsemek ve algoritmik modelleme kullanmak daha iyidir. Örneğin, girdi ve çıktı değişkenleri arasındaki etkileşimin doğrusal olmadığı bir durumda lojistik regresyon kullanırsanız, modeliniz açıkça yetersiz olacak ve çok fazla sinyal yakalanmayacaktır. Bununla birlikte, süreç iyi anlaşıldığında, parametrik modeller, teorik açıdan güçlü olan her şeyi özetlemek için resmi bir denklem sağlama avantajına sahiptir.
Daha ayrıntılı bir tartışma için Leo Breiman'ın bu mükemmel belgesini okuyun .