Probit ve Logit modelinin marjinal etkisi


12

Probit ve Logit modelinin marjinal etkisinin layman terimleriyle nasıl hesaplanacağını herkes açıklayabilir mi?

İstatistiklerde yeniyim ve bu iki model hakkında kafam karıştı.


Probit ve Logit modellerinden çıkan rakamların, neredeyse aynı şeyi ölçüyormuş gibi göründüğünü, ancak genellikle sayısal olarak farklı olduğunu unutmayın. Onları tekrar gerçek hayata dönüştürdüğünüzde, ikisi arasındaki fark genellikle çok daha küçük olur.
Henry

Yanıtlar:


15

Belirli bir değişkenin marjinal etkisini görmenin daha iyi bir yolu olduğunu düşünüyorum, örneğin , dikey eksende öngörülen olasılığın dağılım grafiğini oluşturmak ve yatay eksende sahip . Bu, belirli bir değişkenin ne kadar etkili olduğunu göstermeyi düşünebildiğim en "layman" yoludur. Matematik yok, sadece resimler. Çok fazla veri noktanız varsa, bir kutu grafiği veya dağılım grafiği daha pürüzsüz, verilerin çoğunun nerede olduğunu görmeye yardımcı olabilir (sadece bir nokta bulutunun aksine).X jXjXj

Bir sonraki bölümün "Layman" ın nasıl olduğundan emin değilim, ama yararlı bulabilirsiniz.

Biz marjinal etkisi bakarsak, bu çağrı belirterek, , biz olsun g ( p ) = k X k β kmjg(p)=kXkβk

mj=pXj=βjg[g1(XTβ)]=βjg(p)

Dolayısıyla marjinal etki, betaya ek olarak tahmini olasılık ve bağlantı fonksiyonunun gradyanına bağlıdır. bölme , farklılaşma için zincir kuralından ve g - 1 ( z )g(p) . Bu, açıkça doğru olanz=g[g-1(z)]denkleminin her iki tarafını da ayırt ederek gösterilebilir. Ayrıcatanım gereğig-1(XTβ)=p'yesahibiz. Bir logit modeli içing(p)=log(p)-log(1-p) varg1(z)z=1g[g1(z)]z=g[g1(z)]g1(XTβ)=p ve marjinal etki:g(p)=log(p)log(1p)g(p)=1p+11p=1p(1p)

mjlogit=βjp(1p)

Ne anlama geliyor? de değerinin sıfır olduğu p = 0 ve en p = 1 ve bunun maksimum değere ulaştığı 0.25 de p = 0.5 . Bu nedenle marjinal etki olasılık 0,5'e yakın olduğunda en yüksektir ve p 0'a yakın veya 1'e yakın olduğunda en küçüktür . Bununla birlikte, p ( 1 - p ) hala X j'ye bağlıdır , bu nedenle marjinal etkiler karmaşıktır. Aslında, çünküp(1p)p=0p=10.25p=0.50.5p01p(1p)Xj , farklı X k için farklı bir marjinal etki elde edersiniz ,p değerleri. Muhtemelen bu basit dağılım grafiğini yapmak için iyi bir neden - hangi değişkenlerin hangi değerlerinin kullanılacağını seçmesine gerek yoktur.Xk,kj

Bir probit modeli için buradaΦ(.)standart normal CDF veϕ(.)standart normal pdf'dir. Yani şunu elde ederiz:g(p)=Φ1(p)g(p)=1ϕ[Φ1(p)]Φ(.)ϕ(.)

mjprobit=βjϕ[Φ1(p)]

Bunun, daha önce tartıştığım marjinal etkisinin çoğuna sahip olduğunu ve yaklaşık 0.5 (ve aklı başında, örneğin, g ( p ) = t gibi simetrik olan herhangi bir bağlantı fonksiyonu için eşit derecede doğru olduğunu unutmayın. a n ( πmjlogit0.5). Bağımlılıkpdaha karmaşık olabilir, ancak yine de (en yüksek noktası, genel "kambur" şekline sahip olan0.5de, en düşük0ve1). Bağlantı işlevi maksimum yüksekliğin boyutunu değiştirir (örneğin, probit maksimum1g(p)=tan(π2[2p1])p0.501, logit0.25) ve marjinal etkinin sıfıra doğru ne kadar hızlı azaltıldığı.12π0.40.25


effectsR paketini kolayca yatay eksende X vs dikey eksende tahmin olasılık bu araziler üretebilir. Bkz. Socserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html
landroni


5

Logit ve probit modelleri tipik olarak, bir dizi giriş değişkenine bağlı olarak y bağımlı değişkeninin 0 veya 1 olma olasılığını anlamak için kullanılır.

İngilizce: Birisinin hayatı boyunca kalp hastalığı geliştirip geliştirmeyeceği gibi ikili bir değer tahmin etmeye çalıştığınızı varsayalım. Kan basıncı, yaş, sigara içip içmedikleri, BMI'ları, yaşadıkları yerler vb. Gibi bir dizi giriş değişkeniniz var. Tüm bu değişkenler, bir şekilde kalp hastalığı geliştirme şansına katkıda bulunabilir.

Tek bir giriş değişkeninin marjinal etkisi, bu değişkeni biraz arttırırsanız, bu kalp hastalığı olma olasılığını nasıl etkiler? Kan basıncının hafif bir miktar arttığını varsayalım, bu kalp hastalığı olma şansını nasıl değiştirir? Ya da yaşı bir yıl arttırırsan?

Bu etkilerin bazıları doğrusal olmayabilir: VKİ'yi hafif miktarda arttırmak, VKİ'si çok sağlıklı olan biri için olmayan birinden çok farklı bir etkiye sahip olabilir.


1

Marjinal etki, ilgi değişkenine göre uygun bir olasılıktan türetilmiş olduğundan, meslekten olmayan kişiyi hesaplamayı bilmesini istersiniz. Takılan olasılık, takılan değerlere uygulanan bağlantı işlevi (logit, probit veya her neyse) olduğundan, hesaplamak için zincir kuralına ihtiyacınız vardır. Bu nedenle, doğrusal indeks modellerinde (parametrelerin X'b gibi bir şey olarak girdiği), parametre fonksiyonunun bağlantı fonksiyonunun türevine eşittir. Türev, regresörlerin farklı değerlerinde farklı olduğu için (doğrusal bir modelin aksine), marjinal etkinin nerede değerlendirileceğine karar vermelisiniz. Doğal bir seçim, tüm regresörlerin ortalama değerleri olacaktır. Diğer bir yaklaşım, her bir gözlemin etkisini değerlendirmek ve daha sonra bunlar üzerinde ortalama yapmak olacaktır. Yorum buna göre değişir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.