Lojistik regresyonda kategorilerin etkilerini ve yaygınlıklarını görselleştirmenin en iyi yolu nedir?


11

Bir kamuoyu araştırması verilerini kullanarak bir adayın oylarının ana belirleyicileri hakkında bilgi sunmam gerekiyor. Önem verdiğim tüm değişkenleri kullanarak lojistik bir gerileme yaptım, ancak bu bilgiyi sunmanın iyi bir yolunu bulamıyorum.

Müvekkilim sadece etkinin büyüklüğünü değil, etkinin büyüklüğü ile bu nitelikteki nüfusun büyüklüğü arasındaki etkileşimi önemsiyor.

Bununla bir grafikte nasıl başa çıkabilirim? Herhangi bir öneri?

İşte bir örnek:

bağımlı değişken değil aday / oy olan değişken Sex (erkek = 1) exponentiated ve risk oranı veya olasılık olarak kabul edildikten sonra büyük bir sayı olan, 2.3 olduğunu. Ancak, bu araştırmanın yapıldığı toplumda sadece% 30 erkek vardı. Bu nedenle, insan bu adayı oldukça fazla desteklemesine rağmen, çoğunlukçu bir seçim kazanmaya çalışan bir aday için sayıları önemsizdir.β


FWIW, "etkileşim" teriminin kullanımı yanlıştır (bakınız, örneğin, burada veya burada ). Şöyle bir şey söyleyebilirim: '... ama etki büyüklüğünün büyük olduğu ve böyle bir niteliğe sahip nüfusun büyük olduğu durumların belirlenmesi hakkında'.
gung - Monica'yı eski

Yanıtlar:


10

@PeterFlom ile örneğin garip olduğunu kabul ediyorum, ancak bunu bir kenara koyarsak, açıklayıcı değişkenin kategorik olduğunu fark ediyorum. Bu sürekli olarak doğruysa, bunu büyük ölçüde basitleştirir. Bu efektleri sunmak için mozaik grafikleri kullanırdım. Bir mozaik çizim, koşullu oranları dikey olarak görüntüler, ancak her kategorinin genişliği, örnekteki marjinal (yani koşulsuz) oranına göre ölçeklenir.

İşte R kullanarak oluşturulan Titanic felaketinden elde edilen verilere bir örnek:

data(Titanic)

sex.table   = margin.table(Titanic, margin=c(2,4))
class.table = margin.table(Titanic, margin=c(1,4))
round(prop.table(t(sex.table), margin=2), digits=3)
#          Sex
# Survived  Male Female
#      No  0.788  0.268
#      Yes 0.212  0.732
round(prop.table(t(class.table), margin=2), digits=3)
#           Class
# Survived   1st   2nd   3rd  Crew
#      No  0.375 0.586 0.748 0.760
#      Yes 0.625 0.414 0.252 0.240

windows(height=3, width=6)
  par(mai=c(.5,.4,.1,0), mfrow=c(1,2))
  mosaicplot(sex.table,   main="")
  mosaicplot(class.table, main="")

resim açıklamasını buraya girin

Solda, kadınların hayatta kalma olasılığının daha yüksek olduğunu görüyoruz, ancak erkekler gemideki insanların belki de yaklaşık% 80'ini oluşturuyordu. Dolayısıyla, erkek hayatta kalanların yüzdesini artırmak, kadın hayatta kalanların yüzdesindeki daha büyük bir artıştan daha fazla hayat kurtardı demektir. Bu, örneğinize biraz benzemektedir. Sağda, mürettebat ve dümenin en büyük oranda insanı oluşturduğu, ancak hayatta kalma olasılığının en düşük olduğu başka bir örnek daha var. (Değeri ne olursa olsun, bu bu verilerin tam bir analizi değildir, çünkü sınıf ve cinsiyet de Titanik'te bağımsız değildir, ancak bu soru için fikirleri göstermek yeterlidir.)


5

Toplumun sadece% 10 erkeğe sahip olduğunu merak ediyorum ... ama ...

Yapabileceğiniz bir şey, olasılık oranlarını çizmek ve her birini örneğin boyutuyla etiketlemektir.

Her iki değişkenin de grafiksel olarak gösterilmesini istiyorsanız, y balonundaki her balonun konumu olasılık oranının boyutuyla ve balonun alanıyla örnek boyutuyla orantılı olarak bir kabarcık grafiği oluşturabilirsiniz.


7
Belki bu .
Andre Silva
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.