Sonuçlar için 0 ile 1 arasında lojistik regresyonun genişletilmesi


9

Sonuçların kesinlikle 0, 1 değil, daha ziyade 0'dan 1'e kadar tüm gerçek sayılar aralığında olduğu bir regresyon problemim var .Y=[0,0.12,0.31,...,1]

Bu sorun zaten bu tartışıldı iplik Sorum biraz farklı olmasına rağmen,.

Lojistik regresyonun normalde kullanıldığı nedenlerle doğrusal regresyonu kullanamıyorum. Doğrusal regresyonda A) çok büyük IV değerleri tahmin edilen sonucu 1 ve B'ye çarptıracaktır) lineer regresyonun sonucu 0,1 sınırlarıyla sınırlı değildir.

Bu lojistik maliyet fonksiyonuna ders kitabımdan bakarak Denklemin hesaplamak için tasarlandığını düşünüyorum yalnızca ve aynı 0 veya 1 değerine sahip olmadığında 0'dan büyük bir maliyet .

Maliyet=-ygünlük(h(x))-(1-y)günlük(1-h(x))
yx

Tüm hipotez hatalarını ölçmek için maliyet fonksiyonunu değiştirerek lojistik regresyonu kullanmak mümkün müdür?

Yanıtlar:


9

Birkaç seçeneğiniz var. Bunlardan ikisi olabilir:

  1. Eğer dönüştürürsen Y içinden günlük(y1-y) lojistik dönüşüm, dönüştürülmüş tepki değişkenine sıradan en küçük kareler üzerinden doğrusal bir regresyon takmayı deneyebilirsiniz.
  2. Alternatif olarak, orijinal değişkeni, bağlantı değişkeniniz olarak lojistik dönüşümü ve arasındaki ilişkiyle genelleştirilmiş doğrusal bir modele sığdırabilirsiniz Yvaryansı ve yinelemeli yeniden ağırlıklandırılmış en küçük karelere uyan binom değişkeni gibidir. Bu temel olarak "lojistik regresyonu kullanma" ile aynıdır.

Hangisinin kullanılacağı hata yapısına bağlıdır ve karar vermenin tek yolu ikisine de uymak ve hangisinin modelin varsayımlarına en uygun kalıntı yapısına sahip olduğunu görmek. Şüphem, aralarında seçim yapmak için çok fazla şey olmaması. Elbette, bu seçeneklerden herhangi biri, dönüştürülmemiş olanlarla düz doğrusal regresyonda büyük bir gelişme olacaktır.Y, söylediğiniz nedenlerden dolayı.


2
(1) Seçenek 2: Tipik haliyle, daha sonra fazla dispersiyon ve standart hataları hesaplamak için kullanımının tahmin - a "yarı-binomial" Y varyans ve ortalama arasındaki ilişki olduğu modeli orantılı yerine ile aynı binom değişkeni.
Scortchi - Monica'yı eski durumuna döndürün

@Scortchi: glm()Sürekli tepki ile beslendiğinde R'deki işlev bu family=quasibinomialmu? Yani katsayıları tahmin edecek family=binomialve daha sonra fazladan bir adımda aşırı dağılımı dikkate alarak standart hataları hesaplayacak mı? Evetse, bu "sağlam standart hataları" hesaplamakla aynı şey midir? Bazı uygun verilerim var ve her iki aileyi de denedim glm; Aynı katsayıları alıyorum ama farklı standart hatalar alıyorum. Teşekkürler.
amip

1
@amoeba: Evet bu kadar. Ancak "sağlam standart hatalar" genellikle bir sandviç tahmincisi veya benzeri kullanılması anlamına gelir.
Scortchi - Monica'yı eski durumuna döndürün

9

Y sınırlandığında, beta regresyon genellikle mantıklıdır; "Daha İyi Bir Limon Sıkacağı" makalesine bakın

Bu, zemin ve tavan efektlerine izin verir; ayrıca ortalamanın yanı sıra varyansın modellenmesine de izin verir.


0

Y kesinlikle sıfır olmadığından veya (dediğin gibi) maliyet her zaman sıfırdan büyük olmalıdır. Yani, modeldeki modifikasyona ihtiyacınız olduğunu düşünmüyorum.


0

İki alternatif model öneriyorum:

Sonuçlarınız (y değişkenleri) sipariş edilirse, Sıralı Probit modelini deneyin.

Sonuçlarınız (y değişkenleri) sipariş edilmemişse, bir Multinomial Logit modeli deneyin.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.