Sorunuz, ilk başta kafa karıştırıcı olan Oranlar ve Olasılıklarla uğraştığınızdan kaynaklanabilir. Lojistik model hesaplamasının doğrusal olmayan bir dönüşümü olduğundan , güven aralıkları o kadar basit değildir.βTx
Arka fon
Lojistik regresyon modeli için şunu hatırlayın
Olasılık ve :(Y=1)p=eα+β1x1+β2x21+eα+β1x1+β2x2
Oran arasında :(Y=1)(p1−p)=eα+β1x1+β2x2
in Günlük Oranları :(Y=1)log(p1−p)=α+β1x1+β2x2
değişkeninde bir birim artış ( ör. olduğu durumu düşünün, yeni oranlarx1x1+1
Odds(Y=1)=eα+β1(x1+1)+β2x2=eα+β1x1+β1+β2x2
- Odds Ratio (OR) bu nedenle vardır
Odds(x1+1)Odds(x1)=eα+β1(x1+1)+β2x2eα+β1x1+β2x2=eβ1
Yorumlama katsayıları
katsayı değerini nasıl yorumlardınız ? Diğer her şeyin sabit kaldığını varsayarsak:βj
- her birim artış için log-odds oranı .xjβj
- her birim artış için olasılık oranı .xjeβj
- Her artış için gelen için ile olasılık oranı artarxjkk+ΔeβjΔ
- Katsayı negatifse, bir artış , oran oranında bir azalmaya yol açar.xj
Tek bir parametre için güven aralıklarıβj
Sadece kullanmam gerekiyor mu? Yoksa burada tarif edilen bir yaklaşımı kullanarak SE'yi dönüştürmem gerekir mi?1.96∗SE
parametresi Maxiumum Olabilirlik Tahmini kullanılarak tahmin edildiğinden, MLE teorisi bize asimptotik olarak normal olduğunu söyler ve bu nedenle normal örnek almak için büyük örnek Wald güven aralığını kullanabilirizβj
βj±z∗SE(βj)
Hangi log-odds oranı güven aralığı verir. değişmezlik özelliğini kullanmak,
eβj±z∗SE(βj)
Bu oranlar konusunda bir güven aralığıdır. Bu aralıkların yalnızca tek bir parametre için olduğunu unutmayın.
Her iki değişken için de standart hatayı anlamak istersem bunu nasıl değerlendirebilirim?
Birkaç parametre eklerseniz Bonferroni prosedürünü kullanabilirsiniz, aksi takdirde tüm parametreler için olasılık tahminleri için güven aralığını kullanabilirsiniz
Çeşitli parametreler için Bonferroni prosedürü
Eğer parametreleri yaklaşık aile güven katsayısı ile tahmin edilecek olan , eklem Bonferroni güven sınırlarıg1−α
βg±z(1−α2g)SE(βg)
Olasılık tahminleri için güven aralıkları
Lojistik modeli, bir gözleme olasılık tahminini verir ve gerçek olasılığının bir frequentist aralığı oluşturmak amacı şekildeP r ( p L ≤ p ≤ ppPr(pL≤p≤pU)=.95
Uç nokta dönüşümü adı verilen bir yaklaşım şunları yapar:
- (Wald CI kullanarak) doğrusal kombinasyonu için güven aralığının üst ve alt sınırlarını hesaplayınxTβ
- Olasılıkları elde etmek için uç noktalarına monotonik bir dönüşüm uygulayın .F(xTβ)
Yana bir tekdüze dönüşümüPr(xTβ)=F(xTβ)xTβ
[Pr(xTβ)L≤Pr(xTβ)≤Pr(xTβ)U]=[F(xTβ)L≤F(xTβ)≤F(xTβ)U]
Somut olarak bu, hesaplanması ve ardından alt ve üst sınırları elde etmek için sonuca logit dönüşümünün uygulanması anlamına gelir :βTx±z∗SE(βTx)
[exTβ−z∗SE(xTβ)1+exTβ−z∗SE(xTβ),exTβ+z∗SE(xTβ)1+exTβ+z∗SE(xTβ),]
tahmini yaklaşık varyansı, kullanılarak regresyon katsayılarının kovaryans matrisi kullanılarak hesaplanabilirxTβ
Var(xTβ)=xTΣx
Bu yöntemin avantajı, sınırların aralık dışında olmamasıdır(0,1)
Her birinin kendi varsayımları, avantajları ve sınırları olan delta yöntemini, önyükleme vb. Kullanarak başka yaklaşımlar da vardır.
Kaynaklar ve bilgi
Bu konuda en sevdiğim kitap Kutner, Neter, Li, Bölüm 14'ün "Uygulamalı Doğrusal İstatistiksel Modeller"
Aksi takdirde birkaç çevrimiçi kaynak vardır: