Küme SE'leri kullanmak yerine sabit efektler ne zaman kullanılır?


19

Eğer birey grupları içinde bulunduğu tek bir veri kesiti (okullar içinde örneğin öğrenci) varsa ve formun bir model tahmin etmek isteyen varsayalım bireysel düzey özellikleri ve bir vektör bir sabit.Y_i = a + B*X_iXa

Bu durumda, Bbağımsız ilgi değişkeninizle ilişkilendirildiğinden, grup arası heterojenliğin puan tahminlerinizi ve SE'lerini etkilediğini varsayalım .

Seçeneklerden biri, SE'lerinizi gruplara (okullara) göre gruplandırmaktır. Diğeri grup FE'lerini dahil etmektir. Diğeri her ikisini de kullanmaktır. Bu seçenekler arasında seçim yaparken nelere dikkat edilmelidir? Birinin SE'leri neden grup VE grup FE kullanarak kümeleyebileceği özellikle belirsizdir. Özel durumumda 35 grup ve her grupta 5.000 birey var . Bu pdf'deki tartışmayı izledim , ancak hem kümelenmiş SE'leri hem de sabit efektleri neden ve ne zaman kullanabileceği konusunda net değil.

(Lütfen çok düzeyli bir modele uyduğumu öne sürmek yerine kümelenmiş SE'lerin ve FE'lerin artılarını ve eksilerini tartışın.)

Yanıtlar:


22

Her iki yaklaşım da, grup sabit efektleri ve / veya küme ayarlı standart hatayı kullanarak kümelenmiş (veya panel) verilerle ilgili farklı konuları dikkate alır ve bunları açıkça farklı yaklaşımlar olarak görürüm. Genellikle her ikisini de kullanmak istersiniz:

Her şeyden önce, daha fazla varsayım yapmaya istekli olmadıkça, sabit etkiler tahmincisinin dikkate almadığı küme içi korelasyon veya hetero-esneklik için küme ayarlı standart hata hesabı , kısa bir tartışma için Imbens ve Wooldridge ders slaytlarına bakın ve uzun paneller ve bu sorunla ilgili çeşitli konular . Cameron ve Miller'ın bu konuyla ilgili yeni bir makalesi de var: Sizin için ilginç olabilecek bir Uygulayıcı Kümesi-Sağlam Çıkarım Kılavuzu . Varyans-kovaryans matrisini modellemek istemiyorsanız ve küme içi korelasyonun mevcut olduğundan şüpheleniyorsanız, SE'nizdeki sapma şiddetli olabilir (heteroscedastisite için olduğundan çok daha sorunlu olabilir, bkz.Bu konuyu tartışmak için Angrist & Pischke Bölüm III.8 . Ama yeterince kümeye ihtiyacınız var (Angrist ve Pischke başparmak rolü olarak 40-50 diyor). Küme ayarlı standart hata, standart hatayı dikkate alır ancak puan tahminlerinizi değiştirmeden bırakır (standart hata genellikle artar)!

Sabit etkiler tahmini, gözlemlenmeyen zamanla değişmeyen heterojenliği (belirttiğiniz gibi) dikkate alır. Bu iyi veya kötü olabilir: Eldeki tutarlı tahminler için daha az varsayım gerekir. Öte yandan, yararlı olabilecek çok fazla varyasyonu atıyorsunuz. Andrew Gelman gibi bazı insanlar hiyerarşik modellemeyi sabit etkilere tercih ederler, ancak burada görüşler farklıdır. Sabit etkiler tahmini hem nokta hem de aralık tahminlerini değiştirecektir (ayrıca burada standart hata genellikle daha yüksek olacaktır).

Özetlersek: Küme-sağlam standart hata, kümeler arası ve kümeler arası korelasyon modellemesi ile uğraşmak istemiyorsanız (ve yeterli sayıda küme varsa) kümelenmiş verilerle ilgili olası sorunları açıklamanın kolay bir yoludur. Sabit etkiler tahmini yalnızca belirli varyasyonları kullanır, bu nedenle modelinize, daha az varyasyona dayalı tahminler yapmak isteyip istemediğinize bağlıdır. Ancak, başka varsayımlar olmadan, sabit etki tahmini, varyans matrisi için küme içi korelasyon ile ilgili problemlerle ilgilenmeyecektir. Küme-sağlam standart hata, sabit etki kestirimi kullanımı ile ilgili sorunları da dikkate almayacaktır.


2
İyi yanıt. Kalan anahtar soru, neden İKİ isteyeceğidir. Imbens ve Wooldridge bunu bir dereceye kadar örtüyor.
QuestionAnswer

14

Sabit etkiler, verilerinizdeki farklı gruplar arasında gözlemlenmeyen heterojenliği kaldırmak içindir.

Kabul edilen yanıtta, bir FE modeli kullanma kararının "daha az varyasyon olsun veya olmasın" kullanmak isteyip istemediğinize bağlı olacağı konusunda aynı fikirde değilim. Bağımlı değişkeniniz, panelinizdeki gruplar arasında sistematik olarak değişen gözlemlenemeyen değişkenlerden etkileniyorsa, bu varyasyonla ilişkili herhangi bir değişkenin katsayısı yanlı olacaktır. X değişkenleriniz rastgele atanmadıkça (ve hiçbir zaman gözlem verileriyle birlikte olmayacaklarsa), atlanan değişkenler sapması için argüman oluşturmak genellikle oldukça kolaydır. Sen mayatlanan değişkenlerin bazılarını iyi bir kontrol değişkenleri listesi ile kontrol edebilirsiniz, ancak güçlü tanımlama 1 numaralı hedefinizse, kapsamlı bir kontrol listesi bile kritik okuyucuların sonuçlarınızdan şüphe etmesine yer açabilir. Bu durumlarda, sabit efektli bir model kullanmak genellikle iyi bir fikirdir.

Kümelenmiş standart hatalar, her grubun İÇİNDEKİ gözlemlerin karara bağlanmadığı durumları (bağımsız ve özdeş olarak dağılmış) açıklamak içindir.

Klasik bir örnek, zaman içinde bir firma paneli için birçok gözleminiz varsa. Firma düzeyinde sabit etkileri hesaba katabilirsiniz, ancak bağımlı değişkeninizde zamanla ilişkili açıklanamayan bazı değişiklikler olabilir. Genel olarak, zaman serisi verileriyle çalışırken, gruplarınızdaki hata terimlerinde geçici seri korelasyon varsaymak genellikle güvenlidir. Bu durumlar kümelenmiş SE'ler için en belirgin kullanım durumlarıdır.

Bazı açıklayıcı örnekler:

Tedavileri rastgele atadığınız deneysel verileriniz varsa, ancak zaman içinde her bir birey / grup için tekrarlanan gözlemler yaparsanız, sabit etkileri atlamakta haklı olursunuz, ancak SE'lerinizi kümelemek istersiniz.

Alternatif olarak, deneysel olmayan veriler için grup başına çok sayıda gözleminiz varsa, ancak her grup içi gözlem daha büyük gruplarından bir iid çekişi olarak düşünülebilir (örneğin, birçok okuldan gözlemleriniz var, ancak her grup rastgele çizilmiş bir alt kümedir öğrencilerinden sabit etkiler eklemek isteyeceksiniz, ancak kümelenmiş SE'lere ihtiyacınız olmayacak.


2

Bu cevaplar iyidir, ancak en son ve en iyi cevap Abadie ve ark. (2019) "Kümeleme için Standart Hataları Ne Zaman Ayarlamalısınız?" Sabit etkilerle, kümelenmenin ana nedeni, kümeler boyunca tedavi etkilerinde heterojenliğe sahip olmanızdır. Örneğin, kümeler (örneğin firmalar, ülkeler) popülasyondaki kümelerin bir alt kümesiyse (yaklaşık olarak çıkarım yaptığınız) başka nedenler de vardır. Kümeleme bir tasarım meselesidir, makalenin ana mesajıdır. Körü körüne yapma.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.