Bağımsız bir değişkenin değişiklik puanları üzerindeki etkisini test ederken, bir temel ölçütü kontrol değişkeni olarak eklemek geçerli midir?


38

Bir OLS regresyonu çalıştırmaya çalışıyorum:

  • DV: Bir yıl boyunca kilodaki değişim (başlangıç ​​ağırlığı - son ağırlık)

  • IV: Egzersiz yapıp yapmadığın.

Bununla birlikte, daha ağır olan kişilerin egzersiz birimi başına daha zayıf insanların, zayıf insanlardan daha fazla kilo vermesi makul görünmektedir. Böylece bir kontrol değişkeni eklemek istedim:

  • CV: İlk başlangıç ​​ağırlığı.

Ancak şimdi başlangıç ​​ağırlığı , bağımlı değişkeni VE bir kontrol değişkeni olarak hesaplamak için BOTH kullanılır.

Bu iyi mi? Bu, OLS varsayımını ihlal ediyor mu?


4
Tedavi rastgele atandı mı?
Andy W

1
Başka bir çok benzer son zamanlarda da sorulmuştur, stats.stackexchange.com/q/15104/1036 . Bu sorunun cevabı bu soruya uygulanabilir (aslında, onların yinelenen sorular olduğunu söyleyebilirim).
Andy W

3
@Andy Aslında, iki soru, bu soruya diğerine verdiğimden farklı bir cevap vereceğimden yeterince farklı. Charlie zaten burada güzel bir analiz yaptı.
whuber

3
Farklılık puanları kullanmanın tipik olarak güvenilirlikteki önemli bir azalma ile ilişkili olduğunu unutmayın, ancak bu biraz tartışmalıdır
Behacad

Yanıtlar:


25

Asıl sorunuzu yanıtlamak için, "Bağımsız bir değişkenin değişiklik puanları üzerindeki etkisini test ederken kontrol değişkeni olarak bir temel ölçü eklemek geçerli midir?" Cevabı hayırdır . Bu sorunun cevabı hayır, çünkü yapı itibariyle temel puan, değişim puanının bağımlı değişken olarak kullanıldığı zaman hata terimiyle ilişkilendirilir, bu nedenle taban çizginin değişim skoru üzerindeki tahmini etkisi yorumlanamaz.

kullanma

  • Y1İlk ağırlık olarak
  • Y2Son ağırlık olarak
  • ΔYAğırlık değişimi olarak (yani )ΔY=Y2Y1
  • TRasgele atanan bir tedavi olarak , ve
  • XAğırlığı etkileyen diğer dışsal faktörler olarak (örneğin, sonuçla ilgili olan ancak rastgele atama nedeniyle tedavi ile ilişkili olmayan diğer kontrol değişkenleri)

Bir sonra gerileyen bir model vardır üzerindeki ve ;ΔYTX

ΔY=β1T+β2X+e

Tanımı gereği hangisi;

Y2Y1=β1T+β2X+e

Şimdi, taban çizgisini bir değişken olarak , denklemin her iki tarafında da terimine sahip olmanız bir sorun . Bu, yorumlanamaz olduğunu gösterir , çünkü doğası gereği hata terimiyle ilişkilendirilir.Y1β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

Şimdi, çeşitli yanıtları karışıklık parçası farklı model için aynı sonuçlar verecektir gerçeğinden kaynaklanıyor gibi görünüyor tedavi etkisinin , benim yukarıdaki formülasyonda. Bu nedenle, eğer biri “seviyeler” kullanarak modele bağımlı değişken olarak değişiklik puanları kullanarak modelin tedavi etkisini karşılaştırdıysa (her biri bir ortak değişken olarak dahil olmak üzere her modelle birlikte ), tedavi etkisinin yorumunu yapanlar; aynı. izleyen iki modelde aynı olacaktır ve bunlara dayanan çıkarımlar da olacaktır (Bruce Weaver'ın denkliği de gösteren bazı SPSS kodları vardır ).β1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

Bu yüzden bazıları tartışacak ( Felix'in bu başlıkta olduğu gibi ve Bruce Weaver'ın SPSS google grubundaki bazı tartışmalarda yaptığı gibi).) modeller aynı tahmini tedavi etkisine neden olduğundan, hangisini seçtiğinizin bir önemi yoktur. Değişiklik puanı modelindeki temel değişkenler yorumlanamadığı için aynı fikirde değilim, çünkü tahmin edilen etkinin aynı olup olmadığına bakılmaksızın, temel değeri asla bir değişken olarak eklememelisiniz. Bu da başka bir soruyu gündeme getiriyor; değişim puanlarını bağımlı değişkenler olarak kullanmanın anlamı nedir? Felix'in daha önce de belirttiği gibi, değişim puanını, bir değişken olarak taban çizgisi hariç bağımlı değişken olarak kullanan model, seviyeleri kullanan modelden farklıdır. Açıklığa kavuşturmak için sonraki modeller farklı tedavi etkileri verecektir (özellikle tedavinin başlangıç ​​ile ilişkili olduğu durumlarda);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

Bu önceki literatürde "Lord'un Paradoksu" olarak belirtilmiştir. Peki hangi model doğru? Peki, randomize deneyler durumunda, Düzeyler modelinin tercih edilebilir olduğunu söyleyebilirim (rastgele bir işi iyi yapsanız bile, ortalama tedavi etkisinin modeller arasında çok yakın olması gerekir). Diğerleri, seviye modelinin tercih edilmesinin nedenlerini belirttiler, Charlie'nin cevabı , seviye modelindeki taban çizgisi ile etkileşim etkilerini tahmin edebilmeniz için iyi bir noktaya değiniyor (ancak değişim puanı modelinde bulunamıyorsunuz). Whuber bu soruya çok benzer bir soruya yanıt olarak değişim puanlarının farklı tedaviler arasında nasıl korelasyon yarattığını göstermektedir.

Tedavinin rastgele atanmadığı durumlarda, bağımlı değişken olarak değişim puanlarını kullanan modele daha fazla önem verilmelidir. Değişim skoru modelinin asıl yararı, sonucun değişmez tahmin edicileri için kontrol edilmesinin herhangi bir zaman olmasıdır. Dolayısıyla, yukarıdaki formülasyonda, zaman içinde sabittir (örneğin, belirli bir ağırlıkta olmak üzere genetik bir yatkınlık söyleyin) ve , bir bireyin egzersiz yapmayı seçip seçmemesiyle (ve gözlemlenmemiş olmasıyla) ilişkili olduğu söylenebilir . Bu durumda, değişiklik puanı modeli tercih edilir. Ayrıca, tedavi seçiminin temel değer ile korele olduğu durumlarda, değişiklik skoru modeli tercih edilebilir. Paul Allison gazetesinde,XXXRegresyon Analizinde Bağımlı Değişkenler Olarak Puanları Değiştir , aynı örnekleri verir (ve konuya bakış açımı büyük ölçüde etkiledi, bu yüzden okumayı şiddetle tavsiye ederim).

Bu, rastgele olmayan ayarlarda değişim puanlarının her zaman tercih edildiğini söylemek değildir. Taban çizgisinin post ağırlık üzerinde gerçek bir nedensel etkiye sahip olmasını beklediğiniz takdirde, seviyeleri modelini kullanmalısınız. Baz çizgisinin nedensel bir etkiye sahip olmasını beklediğiniz ve tedaviye seçimin baz çizgisi ile korele olması durumunda, muamele etkisi baz çizgisi etkisiyle karıştırılır.

Charlie'nin notuna aldırmadım ki, ağırlığın logaritması bağımlı değişken olarak kullanılabiliyordu. Bunun bir olasılık olabileceğinden şüphem olmasa da, ilk soruya bir şekilde cevap veremem . Başka bir soru değişkenin logaritmalarını kullanmanın uygun olduğu (ve bu durumda hala geçerli olanlar) hakkında tartışmıştır. Günlük ağırlığının kullanılmasının da uygun olup olmadığına dair size rehberlik edecek bir konuyla ilgili literatür muhtemelen vardır.


Alıntı

Allison, Paul D. 1990. Regresyon analizinde puanları bağımlı değişkenler olarak değiştirin . Sosyolojik Metodoloji 20: 93-114. Genel PDF versiyonu .


3
Denklem olarak gibi standart bir uygulama ise, tüm eş değişkenler rastgele değişkenler değildir al, sonra ile bağlantısı olmayan ve . Bu nedenle, yalnızca rasgele olarak görürseniz bir sorun olduğunu düşünüyorum , bu durumda (yine sadece benim görüşüme göre) modellemelisinizY2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)Y1Y1

1
Y1Y1Y2Y1Y2

1
Y1β1

1
B1

1
bir cevap olarak ölçüm ve sabit bir temel değer üzerinde koşullandırma ve ikincisi, ANCOVA modelindeki nokta tahmini varyansının her zaman koşulsuz olandan daha büyük veya ona eşit olduğu anlamına gelir. Bu varyans farkının, gruplar arasında başlangıç ​​ortalama tepkilerinin küçük olmasını sağlayan randomizasyon nedeniyle tipik olarak küçük olacağı ortaya çıktı. Yazarlar koşulsuz modelin taban çizgisini rastgele bir değişken olarak modellemeye uygun olduğu sonucuna varmıştır, ancak ANCOVA sabit olarak görüntülendiğinde uygun olduğu sonucuna varmıştır.
dandar

21

Andy'nin cevabı ekonomistin olaylara bakışı gibi görünüyor. Gücü büyük ölçüde arttırmak için hemen hemen her zaman yanıt değişkeninin temel versiyonuna uyum sağlamak klinik deneylerde pratik olarak kabul edilir. Temel değişkenleri şartlandırdığımız için, genel hata terimiyle karıştırılmaları için 'hata terimi' yoktur. Tek sorun, bazal ortak değişkendeki ölçüm hatalarının başka bir X ile karıştırılması ve diğer X'in etkisini çarpıtması olabilir. Genel olarak tercih edilen yöntem, taban çizgisi için ayarlama yapmak ve değişikliği hesaplamadan yanıt değişkenini modellemektir. Bunun bir nedeni, değişimin büyük ölçüde Y'nin dönüşümünü doğrulamaya bağlı olmasıdır ve bu değişimin genel olarak regresyon modelleri için geçerli olmadığıdır. Örneğin, Y sıralı ise, iki sıralı değişken arasındaki fark artık sıralı değildir.


1
Bu cevabı tam olarak anlamıyorum. "Temel için ayarlama" ile ne demek istiyorsunuz? Farkı kabul et ya da kontrol et.
Henrik

3
'Temel çizgiye göre ayarla' derken, bir değişken olarak temel çizgiyi dahil etmek istedim. Değişim puanlarını kullanmak da yaygındır, ancak bunları bir değişken olarak temel çizgisi için ayarlama yapmadan da kullanamazsınız (bu nedenle neden değişim puanlarıyla uğraşmıyorsunuz?).
Frank Harrell

6
Aslında burada söylediğiniz hiçbir şey (veya Felix'in yorumlarına yanıt olarak) söylediklerimle doğrudan çelişmiyor. Değişim puanlarını kullanmak 'başlangıç ​​için ayarlama yapmaz', değişmeyen her türlü değişken değişkeni kontrol eder (ya da tedaviye seçimin başlangıç ​​ile yüksek derecede ilişkili olup olmadığını). Eğer referans değeri ihmal edilemez ise (yani sonuç üzerinde doğrudan bir nedensel etkiye sahiptir veya tedavi ile etkileşime girerse) değişim puanları sorunu çözmez.
Andy W

2
@Frank Harrell Bu tartışmaya katıldığınız ve bunu açıkladığınız için teşekkür ederiz. (+1)
Henrik

8

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

xw0w0

E[w1w0X,w0]=β0+(xw0)β+w0γ.

log(w1)log(w0)r;
rxBu tahmincilerin ağırlıktaki oran değişimleriyle nasıl ilişkili olduğunu size söyleyecektir. Bu, örneğin, 130 kilo ağırlığındaki bir kişi için ağırlığı% 10 azaltan bir egzersiz rejiminin (% 100 ile çarpılan bir katsayısı), yani program kilogramı 13 kilo azalttığını söyleyerek, başlangıç ​​ağırlığını kontrol eder. 200 pound katılımcının ağırlığı 20 pound. Bu durumda, başlangıç ​​ağırlığını (veya kütüğünü) sağ tarafa dahil etmeniz gerekmeyebilir.

w0w0β1β1

log(w0)β1/w0

Gördüğünüz gibi, etkileşim terimlerindeki çapraz bölümler yorumlamaları biraz zor olabilir, ancak ilgilendiğiniz bir etkiyi yakalayabilirler.


Merhaba Charlie, oran değişikliği kullanmanın avantajını görüyorum, ancak neden w1 'i w0' a bölmek yerine, kayıtlı değişkenlerdeki farkı buluyorsun.
ChrisStata

Orantılı değişim fikrini seviyorum. Bununla birlikte, beklenen etkileşim kelimenin tam anlamıyla orantılı olup olmadığı ise, sorun devam etmektedir. Aksi halde, başlangıç ​​ağırlığını ortak değişken olarak eklemeniz gerekir. Veya kilonuzun% 10'unu 100 veya 200 poundluk bir kişi için kaybetmenin aynı zorlukta olduğundan emin misiniz?
Henrik

@ ChrisStata, bunu da yapabilirsiniz. Ben bir ekonomistim ve kütüklerimizi (ve farklılıkları da) seviyoruz. Her bir kişi için bir zaman serisi (örneğin, çoklu gözlemler) varsa (panel veri seti hazırladıysanız), yolumun daha iyi olduğunu, ancak bunun burada alakalı olmadığını iddia edebilirim. Henrik, haklısın; Cevabımı bu konuda biraz ekledim.
Charlie

8

EDIT: Andy W'nin argümanı Beni Model C'yi düşürmeye ikna etti. Başka bir olasılık daha ekledim: Değişimi Rastgele Katsayılı Modellerle analiz etme (aka Çok Düzeyli Modeller veya Karışık Etki Modelleri)

Fark puanlarının kullanımı hakkında birçok bilimsel tartışma olmuştur. En sevdiğim metinler Rogosa (1982, [1]) ve Fitzmaurice, Laird ve Ware (2004, [2]).

Genel olarak, verilerinizi analiz etmek için üç seçeneğiniz vardır:

  • A) Sadece bireyler arası fark puanını alın (değişim puanı)
  • B) Post ölçümü DV olarak kabul edin ve referans için kontrol edin
  • C) Fark puanını DV olarak alın ve referans için kontrol edin (önerilen model budur). Andy W'in iddiaları yüzünden bu alternatifi düşürdüm
  • D) Her katılımcı ve katılımcı için regresyon çizgisinin modellendiği çok seviyeli / karışık etki modeli yaklaşımı kullanılarak, Seviye-2 birimi olarak kabul edilir.

A ve B Modelleri, taban çizgisi değişim puanıyla (örneğin daha ağır insanlar daha fazla kilo kaybına sahipse) ve / veya tedavi ataması taban çizgisi ile ilişkiliyse, çok farklı sonuçlar üretebilir.

Bu konular hakkında daha fazla bilgi edinmek istiyorsanız, belirtilen makalelere bakın ya da burada ve burada .

Ayrıca, A veya B'nin tercih edilebildiği koşulları ampirik olarak karşılaştıran yeni bir simülasyon çalışması [3] da olmuştur.

Eksik değerlere sahip tamamen dengeli tasarımlar için Model D, Model A'ya eşdeğer olmalıdır. Ancak, size kişi değişkenliği hakkında daha fazla bilgi verir, daha fazla ölçüm noktasına kolayca genişletilir ve dengesiz veri varlığında hoş özelliklere sahiptir. ve / veya eksik değerler.

Sonuç olarak: Sizin durumunuzda, başlangıç ​​için kontrol edilen post-ölçümleri analiz ederim (Model B).

[1] Rogosa, D., Brandt, D., ve Zimowski, M. (1982). Değişim ölçümüne bir büyüme eğrisi yaklaşımı. Psikolojik Bülten, 92, 726-748.

[2] Fitzmaurice, GM, Laird, NM, & Ware, JH (2004). Uygulamalı boyuna analiz. Hoboken, NJ: Wiley.

[3] Petscher, Y., ve Schatschneider, C., 2011. Randomize Deneysel Tasarımlarda Basit Fark ve Kovaryans Ayarlı Puanların Performansına İlişkin Bir Simülasyon Çalışması. Eğitimsel Ölçüm Dergisi, 48, 31-43.


Bu cevabı reddettim ve neden değişimin bir eş değişkenli temelde puanlama yapılmaması gerektiğine inandığına cevabımı görebilirsiniz. Özetlemek gerekirse, formülasyonunuzdaki Model B ve C eşdeğer tedavi etkileri üretse de, bu Model C'nin tercih edileceği anlamına gelmez. Aslında, Model C'deki bazal etki yorumlanamaz, bu yüzden kullanılmaması gerektiğini savunuyorum.
Andy

@AndyW: Tartışmanız beni ikna etti; Her iki modelde de tedavi etkisinin en uygun tahmini aynı olsa da, Model B Model C'ye göre tercih edilmelidir. Cevabımı buna göre ayarladım. Peki sen ne diyorsun Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.? Kim B ve C eşdeğeri gösterir?
Felix S

b¯b¯

Model D için bir nokta Neden sadece model D'yi göz önünde bulundurmadığımı merak ediyorum. En tutarlı olan (temel değer rastgele bir değişkendir ve bağımlı bir değişkene zorlanmadı), basit, çok esnek (etkileşim olabilir eklenebilir) ve ayrıca popülasyonun standart sapmasını sağlar.
giordano


3

Glymour ve diğ. (2005), bir değişim puanını analiz ederken başlangıç ​​düzeltmesi kullanılarak ele alınmıştır. Sağlık durumundaki değişiklik, temel değerlendirmeden önce gelirse veya bağımlı değişkende büyük bir ölçüm hatası varsa, bağımlı değişken olarak değişiklik puanını kullanan regresyon modeli bir taban değişken değişkeni içeriyorsa, bir yanlılığın ortaya çıkabileceğini tespit ederler. Frank Harrell'in cevabı "Tek sorun, temel değişkende ölçüm hataları başka bir X ile karıştırılarak diğer X'in etkisini çarpıtırsa olur." Glymour adresleri ile aynı önyargıyı yansıtıyor olabilir.

Glymour (2005) "Değişim Analizinde Temel Ayar Ne Zaman Yararlı? Eğitim ve Bilişsel Değişim Örneği. Amerikan Epidemiyoloji Dergisi 162: 267-278


1

Ocram doğru değil. Ağırlıklar arasındaki fark etmez olmayan dikkate başlangıç ağırlığına alır. Spesifik olarak, intial ağırlık, son ağırlığı ondan çıkartarak çıkarılır.

Bu nedenle, eğer başlangıç ​​ağırlığını kontrol ederseniz, bunun varsayımları ihlal etmediğini iddia edeceğim.

(BMI ve ilk BMI arasındaki farkı alırsanız aynı mantık geçerlidir.)


Güncelleme
Andy W'nin eleştirmeninden sonra neden haklı olduğum ve Ocram'ın yanlış olduğu konusunda daha resmi olmama izin verin (en azından benim açımdan).

aw
iw=awew=aw+Δw

Δw=iwew=awaw+Δw=Δw

aw

Bunu dikkate almak istiyorsanız, modelinize ayrı olarak dahil etmeniz gerekir (normal bir parametre ve / veya bir etkileşim terimi olarak).

ΔBMJew=awpropΔw


Farkın başlangıçtaki ağırlığı hesaba kattığını söylediğimde, aslında bunu kastediyorum. Şimdi, özellikle, ne yazarsın? son ağırlık - ilk ağırlık = ...?
ocram

Yazdığım gibi, tartışmanız bana yanlış geliyor. Bunların aynı "ölçek" olduğu gibi diffeence bu nedenle bazı son ağırlığı olarak ( "yeniden olçeklendirilmiş", oysa, aslında uç ağırlığı dikkate daha başlangıç ağırlığına alır iddia ediyorum mutlak değeri anoher çıkarılır absoulte değeri.
Henrik

(-1) Bu doğru değil. Genel olarak, aynı değişkeni denklemin hem sağ hem de sol tarafına dahil etmemelisiniz (bağımsız değişkenin hata terimiyle ilişkilendirilmiş olmasına neden olur). Dolayısıyla, bağımlı değişken için farklılıklar kullanırsanız, taban çizgisini bir değişken olarak eklememelisiniz.
Andy W

@Andy W: Ben senin argüman asıl doğru olduğunu biliyorum. Fakat benim argümanım, mutlak değeri bir tür kısalttığınızdır (son değeri temel değer ile çıkartarak), böylece bu korelasyonu ortadan kaldırırsınız. Dolayısıyla, onu bir değişken olarak eklemek, bu tür sahte hata korelasyonunu ortaya çıkarmaz.
Henrik

@Henrik, bu soruya verdiğim yanıtı ve neden bu düşüncenin yanlış yönlendirildiğine hala inandığımı görün.
Andy W

0

Bunu gözlemle

end weightinitial weightY=β0+βTx

eşittir

end weight=initial weight+β0+βTx

Bir başka deyişle, ağırlıktaki değişimin (son ağırlığın kendisinin yerine) DV olarak kullanılması, halihazırda başlangıç ​​ağırlığını oluşturmaktadır.


1
Ancak, başlangıçta verilen ağırlıkla verilen eğitim ve kilo verme arasında bir etkileşim olabileceğini tahmin ediyorum. Aynı antrenman egzersizlerinde 1.90 metre yüksekliğinde bir yetişkin ve 70 kg vücut kitlesinde bir yetişkin ve 1.60 metre boyunda bir yetişkin ve 90 kg vücut kütlesinde yer alalım diyelim. İkincisinin daha fazla kilo kaybettiğine bahse girerim. İkinci bir düşünce üzerine: belki vücut kitle indeksi, sadece ağırlıktan daha iyi bir CV'dir.
xmjx

1
@ xmjx: İlk ağırlığın son ağırlığı etkileyeceğini düşünüyorsanız - ve muhtemelen haklısınız - o zaman burada olduğu gibi modelde ofset olarak tanıtmak iyi bir fikirdir
eylül

3
Genel olarak doğru değil. Bazal ağırlığın eğimi 1.0 değilse, değişiklik analizi, ilk ağırlık her iki modelde olmadıkça ve normal regresyon kullanmıyorsanız, nihai ağırlık analizine eşdeğer olmayacaktır. Temel ağırlık iki yerde ise, modelin açıklanması daha zordur, bu nedenle bu yaklaşıma devam etmenin nedenleri belirsizdir.
Frank Harrell
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.