Exp'den (katsayılardan) Oran Oranına ve Lojistik Regresyonda faktörlerle birlikte yorumlanması


15

SAT puanlarına ve aile / etnik kökene karşı üniversiteye kabul edilme konusunda doğrusal bir gerileme yaptım. Veriler kurgusaldır. Bu, daha önce cevaplanmış olan önceki bir sorunun takibidir. Soru, SAT puanlarını basitlik için bir kenara bırakırken olasılık oranlarının toplanması ve yorumlanmasına odaklanmaktadır.

Değişkenler Accepted(0 veya 1) ve Background("kırmızı" veya "mavi") şeklindedir. Verileri, "kırmızı" arka plandaki kişilerin içeri girme olasılığının daha yüksek olacağı şekilde ayarladım:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))

                        Odds_Ratio_RedvBlue             2.5 %       97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

Sorular:

  1. 0.7 "mavi" geçmişe sahip bir kişinin garip oranı kabul ediliyor mu? Bunun Backgroundblueyerine aşağıdaki kodu çalıştırırsanız ben de " " için 0.7 olsun çünkü soruyorum :

    fit <- glm(Accepted~Background-1, data=dat, family="binomial")
    exp(cbind(OR=coef(fit), confint(fit)))
    
  2. "Kırmızı" oranlarının kabul edilmemesi gerekir ( ) sadece karşılıklı: ( )?O d d s B l u e = 1 / O d d s R e dAccepted/Red:Accepted/BlueOddsBlue=1/OddsRed


1
Ne Raçıkça çağıran katsayılarını (fonksiyonuyla coefçıktınıza "risk oranı" aradığınız). Bu , ikisi arasındaki ayrımı
whuber

Köprünüzdeki yazıyı okudum.
Antoni Parellada

Katsayılar üssel olarak verilmiştir: exp (katsayı (sığdır)).
Antoni Parellada

Evet: ve bu konudaki cevabımda açıklandığı gibi, kesişmenin üslenmesi size referans vakasının olasılığını verir .
whuber

Yanıtlar:


14

Oranları ve olasılık oranlarını manuel olarak hesaplayarak sorumu cevaplamaya çalışıyorum:

Acceptance   blue            red            Grand Total
0            158             102                260
1            112             177                289
Total        270             279                549

Yani, Kırmızı üzerinden Mavinin okula girmesinin Oran Oranı :

Odds Accept If RedOdds Acccept If Blue=177/102112/158=1.73530.7089=2.448

Ve bu Backgroundreddönüşü:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))

                      Odds_and_OR                         2.5 %      97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

Aynı zamanda, (Intercept)payındaki karşılık gelir odds oranı tam olarak, oran 'mavi' aile geçmişinin olmaktan almanın: .112/158=0.7089

Bunun yerine, ben çalıştırın:

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))

                        Odds            2.5 %      97.5 %
Backgroundblue     0.7088608        0.5553459   0.9017961
Backgroundred      1.7352941        1.3632702   2.2206569

Getiriler tam olarak 'mavi' olma olasılıkları : Backgroundblue(0.7089) ve 'kırmızı' kabul etme olasılıkları : Backgroundred(1.7353). Hiçbir Odds Oranı orada. Bu nedenle, iki dönüş değerinin karşılıklı olması beklenmez.

Son olarak, kategorik regresörde 3 faktör varsa sonuçları nasıl okuyabilirim?

[R] hesaplamasına karşı aynı kılavuz:

Aynı öncülle farklı bir hayali veri kümesi oluşturdum, ancak bu kez üç etnik köken vardı: "kırmızı", "mavi" ve "turuncu" ve aynı sırayı koştum:

İlk olarak, beklenmedik durum tablosu:

Acceptance  blue    orange  red   Total
0             86        65  130     281
1             64        42  162     268
Total        150       107  292     549

Ve her etnik grup için girmenin Oranlarını hesapladı :

  • Kırmızı ise Kabul Edilen Oranlar = 1.246154;
  • Oranlar Mavi Kabul Ediyor = 0.744186;
  • Oran Turuncu Kabul Ederse = 0.646154

Farklı Oran Oranlarının yanı sıra :

  • VEYA kırmızı v mavi = 1.674519;
  • VEYA kırmızı v turuncu = 1.928571;
  • VEYA mavi v kırmızı = 0.597186;
  • VEYA mavi v turuncu = 1.151717;
  • VEYA turuncu v kırmızı = 0.518519; ve
  • VEYA turuncu v mavi = 0.868269

Ve şimdi rutin lojistik regresyon ile devam etti ve ardından katsayıların üslenmesi:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))

                      ODDS     2.5 %   97.5 %
(Intercept)      0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred    1.6745192 1.1271430 2.497853

" Maviye " girme olasılığını(Intercept) ve Portakalın Mavi'ye Karşı Oran OranlarıBackgroundorange ve Kırmızı v Mavi içeriğinin OR oranını verir Backgroundred.

Öte yandan, kesişme olmadan gerileme öngörülebilir şekilde sadece üç bağımsız olasılığı döndürdü :

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))

                      ODDS     2.5 %    97.5 %
Backgroundblue   0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred    1.2461538 0.9900426 1.5715814

Tebrikler, bunu anlamak için iyi bir iş çıkardın.
gung - Monica'yı eski
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.