Bir regresyon katsayısının bir gruplama değişkeni tarafından denetlenip denetlenmediğini nasıl test edebilirim?


9

Ilımlı bir değişkene (örneğin cinsiyet) dayalı iki grup örnek üzerinde bir regresyon var. Bir sette regresyonun öneminin kaybolup kaybolmadığını kontrol ederek diğerinde kalırsa ılımlı etki için basit bir test yapıyorum.

S1: Yukarıdaki yöntem geçerli, değil mi?

S2: Araştırmamın güven düzeyi% 95 olarak belirlendi. Bir grup için, regresyon .000'de anlamlıdır. Diğeri için, 0.038'de önemlidir Bu yüzden her iki regresyonu da önemli olarak kabul etmek zorunda olduğum ve ılımlı bir etkisi olmadığını düşünüyorum. Regresyonu kabul ederek, 0.01'de olmadığı kanıtlanırken önemlidir, Tip I hatasına neden oluyorum (falsy argümanını kabul ediyorum)?

Yanıtlar:


14

"Orta düzeyde bir etki" nin iki grup arasındaki bir veya daha fazla regresyon katsayısında bir değişiklik olduğu varsayılarak, yönteminiz soruyu ele almıyor gibi görünüyor. Regresyondaki önem testleri, katsayıların sıfır olup olmadığını değerlendirir. İki regresyonda p-değerlerinin karşılaştırılması , iki örnek arasındaki bu katsayılardaki farklılıklar hakkında çok az şey (eğer varsa) anlatır .

Bunun yerine, cinsiyeti kukla bir değişken olarak tanıtın ve tüm ilgili katsayılarla etkileşime geçin . Ardından ilişkili katsayıların önemini test edin.

Örneğin, en basit durumda (bir bağımsız değişkenden) verileriniz, bir listesi olarak ifade edilebilir; burada , ve olarak kodlanmış cinsiyetlerdir . Cinsiyet modeli olduğunu(xi,yi,gi)gi010

yi=α0+β0xi+εi

(burada indeksi olan veri ) cinsiyet ve modelin olduğuigi=01

yi=α1+β1xi+εi

(burada , olan verileri dizine ). Parametrelerigi=1α0, α1, β0, ve β1. Hatalarεben. Bağımsız olduklarını ve sıfır yolla aynı şekilde dağıldıklarını varsayalım. Eğim farkını test etmek için kombine bir model (β's olarak yazılabilir

yben=α+β0xben+(β1-β0)(xbengben)+εben

(nerede ben aralığındaki tüm veriler) gben=0 son terim, ilk modeli vererek α=α0ve ayarladığınızda gben=1 iki katları xben vermek için birleştir β1, ikinci modeli α=α1. Bu nedenle, modeli takarak eğimlerin aynı olup olmadığını ("denetleyici etki") test edebilirsiniz

yben=α+βxben+γ(xbengben)+εben

ve tahmin edilen ılımlı etki büyüklüğünün γ^, sıfırdır. Müdahalelerin aynı olacağından emin değilseniz, dördüncü bir terim ekleyin:

yben=α+δgben+βxben+γ(xbengben)+εben.

Mutlaka test etmek zorunda değilsiniz δ^ sıfırdır, eğer herhangi bir ilgi çekici değilse: iki kesime aynı kesmeye sahip olmaya zorlamadan ayrı lineer uyumlara izin vermek dahil edilmiştir.

Ana sınırlama Bu yaklaşımın hataların sapmalar olduğu varsayımıdırεbenher iki cinsiyet için de aynıdır. Değilse, bu olasılığı dahil etmeniz gerekir ve bu, modele uymak için yazılımla biraz daha fazla çalışma ve katsayıların önemini nasıl test edeceğiniz hakkında daha derin bir düşünce gerektirir.


Teşekkürler bunun nasıl çalıştığını anlayabiliyorum. Birden fazla denetleyici değişkenim varsa bu yöntem işe yarar mı? Örneğin, bölge (kırsal / kentsel), eğitim düzeyi (lise eğitimli / lise)? Ek kukla değişkenler ekleyebilir ve etkisini test edebilir miyim?
scorpion

1
@whuber, bazen analistin örneği iki gruba ayırdığı, her iki grup için aynı bağımsız değişken kümesini kullandığı ve sadece katsayıları niteliksel olarak karşılaştırdığı işlevsel olarak benzer durumlarla karşılaşıyorum. Etkileşim efektleri kullanma formülasyonu üzerinde az önce tarif ettiğim bu durumun herhangi bir avantajı var mı?
Andy W

3
@Andy Kritik ya da küçümseme gibi bir niyet olmadan, nitel yöntem için düşünebileceğim tek avantaj, analistin anlayışı ya da yeterliliği konusunda hiçbir talepte bulunmamasıdır: bu, daha fazla insan için erişilebilir olmasını sağlar. Kalitatif yaklaşım zorluklarla doludur. Örneğin, büyük olabilir belirgin yamaçlar ve yalnız tesadüfen yakaladığını her ikisi arasındaki farklılıklar. Sadece katsayıların nitel olarak değerlendirilmesi bu durumu gerçek etkilerden ayırt edemez.
whuber

1
@whuber, ilk düşüncem aynıydı ve yakın zamanda aynı öneriyi basitlik uğruna öneriyi görmezden gelen bir meslektaşına verdim (siz de bahsettiğiniz gibi). Belki de hata farklılıklarının her iki cinsiyet için de aynı olduğu varsayımıyla ilgili yorumun, varsayımın ihlal edildiği göz önüne alındığında iki model yaklaşımını daha uygun hale getirebileceğini düşündüm.
Andy W

1
@Andy Evet, ancak farklı varyans olasılığı, nitel olmayan bir karşılaştırmanın değerini artırmaz. Aksine, parametre tahminlerinin daha incelikli bir nicel karşılaştırmasını gerektirecektir. Örneğin, kaba (ancak bilgilendirici) bir yaklaşım olarak, tahmini hata sapmalarına ve bunların serbestlik derecelerine bağlı olarak bir CABF veya Satterthwaite t-testinin bir varyantı gerçekleştirilebilir. İyi yapılandırılmış bir dağılım grafiğinin görsel incelemesi bile, basitçe regresyon katsayılarını karşılaştırmaktan daha kolay ve daha bilgilendirici olacaktır.
whuber

-1

Bir gruplama değişkeninin moderasyonunun, bağımsız kesitsel veri dalgaları (örn. Yıl1, yıl2 ve yıl3 olarak grup1 grup2 ve grup3) arasındaki regresyon katsayılarını karşılaştırırken eşit derecede iyi çalışacağını tahmin ediyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.