Doğrusal regresyon ve lojistik regresyon arasındaki fark nedir?
Her birini ne zaman kullanırsın?
Doğrusal regresyon ve lojistik regresyon arasındaki fark nedir?
Her birini ne zaman kullanırsın?
Yanıtlar:
Doğrusal regresyon, genel denklemini kullanır; burada , sürekli bir bağımlı değişkendir ve bağımsız değişkenler , genellikle süreklidir (ancak aynı zamanda, örneğin doğrusal model bir test) veya diğer ayrık alanlar. , model tarafından açıklanmayan ve genellikle "hata" olarak adlandırılan varyans için kullanılan bir terimdir. ile gösterilen bireysel bağımlı değerler , denklemi biraz değiştirerek çözülebilir:
Lojistik regresyon, aynı temel formülü kullanan başka bir genelleştirilmiş doğrusal model (GLM) prosedürüdür, ancak sürekli yerine, kategorik bir sonucun olasılığı için gerilemektedir. En basit haliyle, bu sadece bir sonuç değişkeni ve bu değişkenin iki durumunu - 0 veya 1 olarak düşündüğümüz anlamına gelir.
olasılığı için denklem şöyle görünür:
Bağımsız değişkenleriniz sürekli veya ikili olabilir. regresyon katsayıları , size başına değişiklik olasılığını verecek şekilde , yani, ve . , oran oranı, . İngilizce'de, , birim başına faktörü ile değiştiğini .
Örnek: Vücut kitle indeksinin kan kolesterolünü (sürekli bir ölçü) nasıl öngördüğünü görmek istiyorsanız, cevabımın en üstünde anlatıldığı gibi doğrusal regresyon kullanırsınız. BMI'nin diyabetik olma ihtimalini (ikili tanı) nasıl tahmin ettiğini görmek istiyorsanız, lojistik regresyon kullanırsınız.
Lineer Regresyon , bağımlı değişkenlerden bağımsız değişken değişiminde ortaya çıkan bağımlı değişkeni tahmin etmede faydalı olan Bağımlı ve Bağımsız değişkenler arasında ilişki kurmak için kullanılır. Örneğin:
Bir Lineer Regresyon kullanarak, Yağmur (R) ve Şemsiye Satışları (U) arasındaki ilişki - U = 2R + 5000 olarak bulundu.
Bu denklem her 1 mm Yağmur için 5002 şemsiyeye talep olduğunu söylüyor. Böylece, Basit Regresyon kullanarak değişkeninizin değerini tahmin edebilirsiniz.
Öte yandan Lojistik Regresyon , bir olayın olasılığını belirlemek için kullanılır. Ve bu olay ikili formatta, yani 0 veya 1 olarak yakalanır.
Örnek - Bir müşterinin ürünümü satın alıp almayacağına karar vermek istiyorum. Bunun için, (ilgili) veriler üzerinde bir Lojistik Regresyon çalıştırırdım ve bağımlı değişkenim bir ikili değişken olur (1 = Evet; 0 = Hayır).
Grafiksel gösterim açısından, Doğrusal Regresyon, değerler grafik üzerine çizildiğinde, çıktı olarak doğrusal bir çizgi verir. Oysa, lojistik regresyon S şeklinde bir çizgi verir
Mohit Khurana'dan referans.
Farklılıklar DocBuckets ve Pardis tarafından çözüldü, ancak performanslarından bahsetmeyen performanslarını karşılaştırmak için bir yol eklemek istiyorum.
Doğrusal regresyon, genellikle modelin verilere en küçük kareler hatasını minimize ederek çözülür, bu nedenle büyük hatalar kuadrik olarak cezalandırılır. Lojistik gerileme tam tersidir. Lojistik kayıp fonksiyonunun kullanılması büyük hataların asimptotik bir sabite cezalandırılmasına neden olur.
Bunun neden bir sorun olduğunu anlamak için kategorik {0,1} sonuçlarda doğrusal regresyon düşünün. Modeliniz, sonuç 1 olduğunda, sonuç 1 olduğunda, hiçbir şey kaybetmediniz. Lineer regresyon, bu 38'i azaltmaya çalışacak, lojistik olmaz (bunun kadar).