Grup karşılaştırması için etkileşim terimleriyle ayrı regresyonlara sahip ortak model


13

Önceki sorulardan ve tartışmalardan değerli geri bildirimler topladıktan sonra şu soruyu buldum: Hedefin, örneğin erkek ve kadın olmak üzere iki grup arasındaki etki farklılıklarını tespit etmek olduğunu varsayalım. Bunu yapmanın iki yolu vardır:

  1. iki grup için iki ayrı regresyon çalışan ve istihdam Wald testi Boş hipotez reddetme (ya da değil) için : , erkek regresyon bir IV katsayısıdır ve aynı katsayısı Kadın regresyonunda IV.H0b1b2=0b1b2

  2. iki grubu bir araya toplar ve toplumsal cinsiyet mankeni ve etkileşim terimi (IV * cinsellik diyeti) ekleyerek ortak bir model yürütür. Daha sonra grup etkisinin tespiti, etkileşim işareti ve anlamlılık için t-testine dayanacaktır.

(1) durumunda Ho reddedilirse, yani grup farkı önemlidir, ancak (2) durumunda etkileşim terimi katsayısı istatistiksel olarak anlamsızsa, yani grup farkı önemsizdir. Ya da tam tersi, Ho (1) durumunda reddedilmez ve (2) durumunda etkileşim terimi önemlidir. Bu sonuca birkaç kez ulaştım ve sonucun daha güvenilir olacağını ve bu çelişkinin ardındaki nedenin ne olduğunu merak ediyordum.

Çok teşekkürler!


1
prosedürler arasındaki fark, kişinin her iki grup için de aynı varyansı almasıdır. Ayrı analiz farklı varyanslar varsayar.
olasılık

Farklı modelleri karşılaştırırken varyans konusunu tartışan herhangi bir referansın farkında mısınız?
Bill718

Yanıtlar:


7

İlk model, cinsiyeti modeldeki diğer tüm değişkenlerle tamamen etkileşime sokacaktır. Esasen, her bir değişkenin etkisi (b2, b3 ... bn). İkinci modelde, cinsiyetin etkisi sadece IV'nizle etkileşime girer. Yani, sadece IV ve cinsiyetten daha fazla ortak değişkeniniz olduğunu varsayarsak, bu biraz farklı sonuçlar doğurabilir.

Sadece iki ortak değişkeniniz varsa, Wald testi ile Olabilirlik oranı testi arasındaki maksimizasyon farkının farklı yanıtlara yol açtığı belgelenmiş durumlar vardır ( wikipedia'da daha fazla bilgi edinin ).

Kendi tecrübelerime göre, teori tarafından yönlendirilmeye çalışıyorum. Cinsiyetin sadece IV ile etkileşime gireceğini, ancak diğer ortak değişkenlerle etkileşime girmeyeceğini öne süren baskın bir teori varsa, kısmi etkileşim ile giderdim.


Teşekkürler! Evet, aslında çeşitli ortak değişkenler var, sadece bir IV değil, basitlik için bir IV'den bahsetmiştim. Mesele şu ki, cinsiyet ve bazı ortak değişkenler arasındaki etkileşimi destekleyebilecek güçlü bir teori yok, keşif analizi, bu yüzden birçok etkileşim ve model uyumu denemem gerekiyor; İlk model 30 öngörücü içeriyor ...
Bill718

@ Bill718 Ayrıca cinsiyetin ek bir IV olarak (sadece etkileşim olarak değil) tek başına belirtilmediği sürece, ayrı modellerin farklı bir kesişim noktası olacaktır.
Robert Kubrick

5

Belirli bir hipotezi test etmek için her zaman iki farklı prosedür kullanılır. Farklı p değerleri olacaktır. Birinin önemli olduğunu ve diğerinin olmadığını söylemek, 0.05 düzeyinde siyah beyaz bir karar vermek olabilir. Bir test 0.03 p değeri verirse diğeri 0.07 diyorsa sonuçları çelişkili olarak adlandırmam. Eğer önem hakkında düşünme konusunda bu kadar katı olursanız, yatılı anlamlılık söz konusu olduğunda (i) ya da (ii) durumlarının ortaya çıkması kolaydır.

Bir önceki soruya yanıt olarak belirttiğim gibi, bir etkileşim arama tercihim birleştirilmiş bir regresyon yapmaktır.


Evet, kombine regresyonun en azından benim durumumda daha iyi performans gösterdiği doğru ve bu çok esnek bir yöntem, çünkü birileri farklı etkileşimler ve model uyumları deneyebileceği doğrudur. , bir şekilde farklı sonuçların arkasındaki sebebin ne olduğunu bulmak için. P-değerleri ile ilgili olarak, bazı insanların sadece =% 0,5 veya daha düşük bir düzeyde önem kabul ettiğini duydum. =% 1 seviyesi kullanarak daha esnekim, ancak büyük baş ağrısı p değerleri tamamen farklı olduğunda ortaya çıkar.
Bill718

Örneğin, sıralı bir logit modet kullanıldığında bir IV'ün çok önemli olduğu, aynı IV bir OLS uygulandığında önemsiz hale gelen çalışmalar gördüm. Yani, bu durumda, sonuçların açıklaması biraz zor olabilir. Yorumlarınız ve görüşleriniz için çok teşekkürler!
Bill718

+1, yaklaşık noktası mükemmel bir noktadır . 0.070.03
gung - Monica'yı eski durumuna getirin

2

İkinci durumda, standart yazılım size t-öğrenci değerlerine sahip bir t-stat önerirken, ilk durumda Wald testlerinin iki seçeneği olabilir. Hatalar altında normallik varsayımı Wald istatistiği kesin bir Fisher istatistiğini takip eder (bu, hata normallikini kabul ettiği için t-statüne eşdeğerdir). Asimptotik normallik altında Wald istatistiği bir Chi2 dağılımını takip eder (asimptotik olarak normal bir dağılımın ardından t-stat'üne benzer) Hangi dağılımı varsayıyorsunuz? Buna bağlı olarak p değerleriniz size farklı sonuçlar verme riski taşır.

Ders Kitaplarında, ikili tek testler için (bir parametre) hem t-student hem de Fisher istatistiklerinin eşdeğer olduğunu göreceksiniz .

Numuneniz büyük değilse, chi2 ve t-stat değerlerini karşılaştırmak kesin olarak farklı sonuçlar verir. Bu durumda, asimptotik bir dağılımın kabul edilmesi makul olmayacaktır. Numuneniz oldukça küçükse, normalliğin daha makul göründüğünü varsayarsak, durum sırasıyla 2 ve 1 için t-stat ve Fisher değerlerini ifade eder.


Aslında, eşit olmayan boyutta iki örneğim var, birincisi 3000 gözlem var, ikincisi nispeten küçük, 500 gözlem. Yazılım Wald istatistiklerini hesaplarken ki-kareyi rapor eder. Yani, bu tutarsızlığın sebebi gibi görünüyor. Her iki örnek de, özellikle büyük örnek durumunda, normal olarak dağıtılır. Çok teşekkürler!
Bill718

1
Sizi kandırdığım için üzgünüm ama eşit olmayan alt örnek boyutları sorun değil. Üstelik seninki benim için büyük bir örnek gibi görünüyor. bu nedenle her iki prosedür de benzer sonuçlar vermelidir. @Probabilityislogic 'in iyi bir noktaya geldiğini fark ettim. Bir havuzlanmış örnek kullanılması, eşit kalıntı varyansları anlamına gelir, böylece bu bir heterojenlik kaynağı olabilir. Ayrı regresyon prosedürünü nasıl uyguladığınızı bilmiyorum, ancak stat'ü kendiniz hesaplıyorsanız hata yapmak kolaydır. Bu, toplanmış regresyonu güvenli ve doğrudan bir yaklaşım haline getirir.
JDav

1
Gruplar arasındaki eşitsiz varyanslar sorununu çözmek için (heterosckedastisite) bir Beyaz (stata kullanıyorsanız Newey-west, Sandwich veya Robust olarak da bilinir) varyans tahmincisi deneyin. Bu yaklaşım, bilinmeyen türdeki heterosensedasiteyi düzeltir.
JDav

Oh, tamam, anlıyorum, aslında örnekteki gözlemler bir ülkenin farklı bölgelerinden geliyor, bu yüzden sanırım heterojenlik sorunları var!
Bill718
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.