Mundlak sabit etkiler prosedürü mankenlerle lojistik regresyon için uygulanabilir mi?

12

8000 küme ve 4 milyon gözlem içeren bir veri setim var. Ne yazık ki istatistiksel yazılımım Stata, lojistik regresyon için panel veri işlevini kullanırken oldukça yavaş çalışıyor: xtlogit% 10 alt örnekle bile.

Ancak, panel dışı logitişlevi kullanıldığında sonuçlar çok daha erken görünür. Bu nedenle logit, sabit etkileri açıklayan değiştirilmiş verilerden yararlanabilirim .

Bu prosedürün "Mundlak sabit etkiler prosedürü" ile birleştirildiğine inanıyorum (Mundlak, Y. 1978. Zaman Serisi ve Kesit Verilerinin Birleştirilmesi. Econometrica, 46 (1), 69-85.)

Antonakis, J., Bendahan, S., Jacquart, P. ve Lalive, R. (2010) tarafından hazırlanan bir makalede bu prosedürün sezgisel bir açıklamasını buldum . Nedensel iddialarda bulunulması: Bir gözden geçirme ve öneriler. Üç Aylık Liderlik, 21 (6). 1086-1120. Alıntı yaparım:

Atlanan sabit etkiler sorununu aşmanın ve hala Düzey 2 değişkenlerini dahil etmenin bir yolu, tahmin edilen modele tüm Düzey 1 ortak değişkenlerinin küme araçlarını dahil etmektir (Mundlak, 1978). Küme araçları regresörler olarak dahil edilebilir veya Seviye 1 değişkeninden çıkarılabilir (yani, küme ortalaması merkezlemesi). Küme araçları küme içinde değişmezdir (ve kümeler arasında değişiklik gösterir) ve sanki sabit etkiler dahil edilmiş gibi Seviye 1 parametrelerinin tutarlı bir şekilde tahmin edilmesine izin verir (bakınız Rabe-Hesketh ve Skrondal, 2008).

Bu nedenle, kümelenme ortalamaları hesaplama problemimi çözmek için ideal ve pratik görünmektedir. Bununla birlikte, bu makaleler doğrusal regresyona (OLS) yönelik gibi görünmektedir.

Bu küme ortalaması merkezleme yöntemi, sabit etkiler ikili lojistik regresyonunu "çoğaltmak" için de uygulanabilir mi?

Aynı yanıtı vermesi gereken daha teknik bir soru şudur: xtlogit depvar indepvars, feveri logit depvar indepvarskümesi B, veri kümesi A'nın küme ortalaması merkezli sürümü olduğunda, veri kümesi A ile veri kümesi B'ye eşit mi?

Bu küme-ortalama merkezlemesinde bulduğum ek bir zorluk, aptallarla nasıl başa çıkılacağıdır. Aptallar ya 0 ya da 1 olduğundan, rastgele ve sabit etkiler regresyonunda aynı mıdır? Bunlar "merkezlenmemeli" mi?

— Tom
kaynak

9

İlk fark ya da yıkım gibi dönüşümler içinde logit gibi modellerde mevcut değildir, çünkü doğrusal olmayan modellerde bu tür hileler gözlemlenmeyen sabit etkileri ortadan kaldırmaz. Sabit etkileri doğrudan tahmin etmek için N-1 bireysel mankenleri dahil etmenin mümkün olduğu daha küçük bir veri kümeniz olsa bile, verilerinizin zaman boyutu büyük olmadığı sürece bu önyargılı tahminlere yol açacaktır. Panel logit'teki sabit etkilerin ortadan kaldırılması bu nedenle ne farklılığı ne de yıkımı takip eder ve sadece logit fonksiyonel formu nedeniyle mümkündür. Eğer ayrıntılar ilgilenen varsa Bunlara bir göz olabilir notlar PDF sayfa 30 Söderbom tarafından (/ Aşağılayıcı ilk logit içinde fark kayıt niçin açıklama / probit yardım değil) ve sayfa 42 (panel logit tahmincisi giriş).

Diğer bir problem, xtlogitpanel logit modellerinin genel olarak marjinal etkileri hesaplamak için gerekli olan sabit etkileri doğrudan tahmin etmemesidir. Bunlar olmadan, modeli saatlerce çalıştırdıktan sonra hayal kırıklığı yaratabilecek katsayılarınızı yorumlamak çok garip olacaktır.

Böyle büyük bir veri seti ve FE panel logit'in daha önce bahsedilen kavramsal zorlukları ile doğrusal olasılık modeline bağlı kalacağım. Umarım bu cevap sizi hayal kırıklığına uğratmaz, ancak bu tür tavsiyelerde bulunmak için birçok iyi neden vardır: LPM çok daha hızlıdır, katsayılar hemen yorumlanabilir (bu özellikle modelinizde etkileşim etkileri varsa, doğrusal olmayan modellerde katsayılar değişir!), sabit efektler kolayca kontrol edilir ve tahmin süreleri aklın ötesine geçmeden otokorelasyon ve kümeler için standart hataları ayarlayabilirsiniz. Umarım bu yardımcı olur.

— Andy
kaynak

1

Bu bir çözüm değil ama bir cevap. Teşekkürler :)

— Tom

1

Küçük nokta: bu slaytların p20'si sizin durumunuzu yapar, ancak bir Mundlak düzeltmesi olarak da adlandırılan 'ilişkili rasgele etkiler' modeli p47'de tanımlanmıştır ve bu tür uyarıları taşımıyor gibi görünmektedir.

— konjugateprior

1

Ben koşullu logit (Stata üzerinde "clogit" inanıyorum, bu alternatif bir sabit etkili logit panel tahmincisi.

http://www3.nd.edu/~rwilliam/stats3/Panel03-FixedEffects.pdf

— Francesco
kaynak

5

Siteye Hoşgeldiniz! Bence bu kabul edilebilir bir cevap değil, çünkü soru aslında: kestirimi hızlandırmak amacıyla değiştirilmiş kesitsel lojistik regresyon ile koşullu (sabit etkiler) lojistik regresyondan nasıl kaçınılır. Referansınızın belirttiği gibi (sayfa 3'ün üst kısmında), " sabit efekt logit analizi yapmak için Stata' clogitkomutunu veya xtlogit, fekomutunu kullanabiliriz. Her ikisi de aynı sonuçları verir. (Aslında, xtlogit, feaslında çağrıları düşünüyorum clogit.)" OP zaten xtlogit, fesondan bir önceki paragrafa dayanarak biliyordu .

— Randel

0

Allison bu sorunu Allison, (2009), "Sabit etkiler regresyon modelleri", s.32f.

Allison, koşulsuz bir modeli maksimum olasılıkla tahmin etmenin mümkün olmadığını savunuyor. Bu nedenle modelleri "tesadüfi parametreler sorunu" nedeniyle önyargılı hale gelir. Bunun yerine, koşullu bir logit modelinin kullanılmasını önerir (Chamberlain, 1980). Bu, olabilirlik fonksiyonunun her bir birey için gözlenen olay sayısı üzerinde koşullandırılmasıyla gerçekleştirilir.

— Kurabiye canavarı
kaynak