Katsayılar arasındaki önemli farklılıkları test etmenin doğru yolu nedir?


18

Birisinin benim için karışıklık yaratmasına yardımcı olabileceğini umuyorum. Diyelim ki 2 set regresyon katsayısının aşağıdaki kurulumla birbirinden önemli ölçüde farklı olup olmadığını test etmek istiyorum:

  • yi=α+βxi+ϵi5 bağımsız değişkenli .
  • 2 grup, kabaca eşit boyutlarda (bu değişebilir)n1,n2
  • Binlerce benzer regresyon eşzamanlı olarak yapılacak, bu nedenle bir çeşit çoklu hipotez düzeltmesi yapılmalıdır.

Bana önerilen bir yaklaşım bir Z-testi kullanmaktır:

Z=b1b2(SEb12+SEb22)

Bu tahtada önerdiğim başka bir şey, gruplama için bir kukla değişken tanıtmak ve modeli şu şekilde yeniden yazmaktır:

yi=α+βxi+δ(xigi)+ϵi ; burada , 0, 1 olarak kodlanan gruplama değişkenidir.g

Benim sorum şu, bu iki yaklaşım nasıl farklı (örneğin farklı varsayımlar yapılmış, esneklik)? Biri diğerinden daha uygun mu? Bunun oldukça basit olduğundan şüpheleniyorum, ancak herhangi bir açıklama çok takdir edilecektir.


Benzer bir soruya verilen cevapların ve yorumların aradığınız açıklamayı sağlayabileceğine inanıyorum .
whuber

Teşekkür ederim whuber. Bu cevabı biliyordum. Aşağıdaki tartışmadan kabul edilen cevabın (ve orada yorumlarınızın) 2 ayrı uyumun katsayılarını karşılaştırmanın uygun olmadığı izlenimine kapıldım. Ayrı uyumlardan katsayılara uygulanan bir z testi yanlış mı yoksa kukla değişken kodlamanın daha kolay ve eşdeğer bir cevap vermesi mi?
cashoes

1
Lütfen cevabımın son paragrafına bakınız ("Ana sınırlama ..."). Z testi, büyük (varsa testte kullanılması) ve tahmini standart sapmaların S E b i birbirinden çok farklı olduğu varsayılarak geçerlidir . Standart sapmalar çok farklı olduğunda (kabaca 3: 1 oranından daha fazla) her iki yaklaşım da en iyisidir. niSEbi
whuber

Yanıtlar:


13

İki yaklaşım farklıdır.

İki regresyonun tahmini standart hataları ve s 2 olsun . Daha sonra, birleşik regresyon (tüm katsayı-kukla etkileşimleriyle) aynı katsayılara uyduğundan, aynı kalıntılara sahiptir, bu nedenle standart hatası şu şekilde hesaplanabilirs1s2

s=(n1p)s12+(n2p)s22)n1+n22p.

Örnekte parametre sayısı 6'ya eşittir : beş eğim ve her regresyonda bir kesişme.p6

Let tahmini bir regresyon bir parametre, b 2 tahmin diğer regresyon aynı parametre ve b bunların tahmin farkı kombine regresyon. Sonra standart hatalarıb1b2b

SE(b)=s(SE(b1)/s1)2+(SE(b2)/s2)2.

Kombine regresyonu yapmadıysanız, ancak sadece ayrı regresyonlar için istatistikleriniz varsa, için önceki denklemi takın . Bu t-testi için payda olacak. Açıkçası bu soruda verilen payda ile aynı değil.s

Kombine regresyon tarafından yapılan varsayım, artıkların varyanslarının her iki ayrı regresyonda da esasen aynı olduğudur. Ancak durum böyle değilse, z-testi de iyi olmayacaktır (örnek boyutları büyük olmadığı sürece): bir CABF testi veya Welch-Satterthwaite t-testi kullanmak istersiniz .


9

İki grup arasındaki katsayıdaki bir farkı test etmenin en doğrudan yolu , regresyonunuza bir etkileşim terimi eklemektir ; bu, sorunuzda neredeyse tanımladığınız şeydir. Çalıştıracağınız model şudur:

yi=α+βxi+γgi+δ(xi×gi)+εi

Grup değişkenini modelde ayrı bir regresör olarak eklediğimi unutmayın. Bu modelde, bir ile sıfır hipotezi ile -test H 0 : δ = 0 iki grup arasında aynı olma katsayıları bir testtir. Bunu görmek için önce yukarıdaki modelde g i = 0 olsun . Sonra, grup 0 için aşağıdaki denklemi elde ederiz:tH0:δ=0gi=0

yi=α+βxi+εi

Şimdi, eğer , o zaman elimizde:gi=1

yi=(α+γ)+(β+δ)xi+εi

δ


Modeli düzelttiğiniz için teşekkürler (yukarıdaki versiyonumun kesişimin her iki grupta da aynı olmasını sağladığını düşünüyorum ...). Daha da önemlisi, bu, yukarıda gönderdiğim z testine eşdeğer olur mu?
cashoes

yi=α+βxi+γgi+εiyi=α+βxi+γgi+δ(xi×gi)+εi

@ matt-blackwell bu kavramsal olarak modeli g'nin her değeriyle katmanlaştırmakla aynı mıdır? (yani. g = 0 olduğunda b'nin katsayısı g ve 1 olduğunda beta + delta olur)
bobmcpop
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.