Hata terimini tekrarlanan ölçümlerde yazma R ANOVA: Hata (konu) ve Hata (konu / zaman)


10

Sorum çok yakından bir önceki yazı ile ilgilidir R tekrarlı ölçümler ANOVA hata () terimini belirtilmesi . Ancak, hata teriminin nasıl tanımlanacağı hakkında daha fazla bilgi edinmek istiyorum.

İki yönlü tekrarlanan bir ANOVA'ya sahip olduğumu varsayalım, Grup etkisi arasındaki faktör Tedavidir (plaseboya karşı kontrol), Zaman ise 4 kez tekrar tekrar ölçülen grup içi etki (T1 ~ T4). Hasta kimliği Konu olarak kaydedilir. Burada verileri http://gjkerns.github.io/R/2012/01/20/power-sample-size.html adresindeki öğreticiden bir örnek ödünç aldım, böylece veriler şöyle görünüyor

 Time Subject Method      NDI
 0min    1     Treat 51.01078
 15min   1     Treat 47.12314
 48hrs   1     Treat 26.63542
 96hrs   1     Treat 20.78196
 0min    2     Treat 42.61345
 15min   2     Treat 32.77171

ANOVA uygulamak için:

aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1              

Error: Subject:Time        
            Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45 

Ayrıca diğer hata terimini denedim:

aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)

Error: Subject      
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1               

Error: Within
             Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45

Birisi bu iki hata terimi arasındaki farkları açıklamama yardımcı olabilir mi? İlk terim doğru ise, ikinci hata teriminden alınan sonuçlar ne anlama gelir?

@ Amoeba tarafından güncelleme: İki çıkış aynıdır, bu nedenle bu durumda fark yoktur, ancak prensipte farkın ne olduğu konusunda soru hala devam etmektedir . Are Error(subject)ve Error(subject/time)hep aynı şey?


3
üzgünüm, bu iki terimin aynı sonuçları verdiğini fark ettim. Sanırım onlar aynı :-)
tiantianchen

1
Bunun bir açıklaması umuyordum: /
vipin8169

Hata terimi hakkında toplayabildiğim tek şey bu >> "Tekrarlanan önlemler tasarımında, katılımcıdan katılımcıya doğal varyasyonu açıklayan bir hata terimi belirtmemiz gerekir. (Örneğin, korkutucu müziğe sizden biraz farklı tepki verebilirim çünkü zombi filmlerini seviyorum ve onlardan nefret ediyorsunuz!) Bunu Error () işleviyle yapıyoruz: özellikle, tüm denekler içindeki değişkenlerimiz arasında katılımcı arasındaki varyasyonu kontrol etmek istediğimizi söylüyoruz. "
vipin8169

(+1) Yalnızca her bir konu / zaman kombinasyonu için tam olarak 1 ölçüm olduğunda eşdeğerdir. Özne / zaman kombinasyonu başına daha fazla ölçüm varsa (ya basitçe ölçümler tekrarlandığı için ya da ek olarak özne içinde başka bir faktör B olduğu için time), o zaman Error(subject)ve için Error(subject/time)farklı F- ve p-değerleri verecektir time.
amoeba

SO ile aynı soru: stackoverflow.com/questions/37497948 - ne yazık ki tam olarak tatmin edici bir şekilde cevap vermeden (imho).
amoeba

Yanıtlar:


2

Birincisi, içiçe yerleştirilmiş subject/timegösterimdir ve böylece iki parçaya ve etkileşime genişler . Öyleyse soru daha doğru bir şekilde ortaya çıkıyor, kişi etkileşimi ne zaman belirtmeli ve ne fark ediyor?timesubjectsubjectsubject:timesubject:time

Bu soruyu cevaplamadan önce, fark edilmesi gereken bir diğer önemli şey, tüm modellerin, tek tek ölçümlerle ilişkili hata terimi olan (bu hiyerarşik olarak düşünürseniz en düşük seviye) belirtilmesi gereken ek bir hata terimi içermesidir.

Bu durumda, subject:timeetkileşim her zaman modele dahil edilen en düşük seviyedir. Yani aynı sonucu kullanmak Error(subject)ve Error(subject/time)vermek; tek fark, çıktıda, bu sonuç seviyesinin Withinbirincisi ve subject:timeikincisi için çağrılmasıdır .

Bununla birlikte, her bir subject/timekombinasyonda birden fazla ölçümün olduğu durumlarda , subject:timeetkileşimi belirtmek gerekir , çünkü o zaman etkileşim en düşük seviyede değildir.


(Bu soruda açık bir lütuf vardı ama maalesef dün bitti ...) +1, ancak bence bu cevap, burada merkezi sorunun ne olabileceğini düşündürüyor: her subject/timekombinasyon için birden fazla ölçümün varlığında , neden mutlaka Etkileşime timegöre etkisini test etmek ister misiniz subject:time? Bu aslında sorumun içeriği burada stats.stackexchange.com/questions/286280 , bu yüzden bu konunun gelecekteki okuyucularını kavramsal gerekçeler için oraya davet etmeye davet ediyorum.
amip

Ayrıca, burada çok benzer bir Soru ve Cevap var: stats.stackexchange.com/questions/247582 .
amip
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.