Sabit bir etkinin rastgele bir iç içe içine yerleştirilmesi veya R (aov ve lmer) 'de tekrarlanan ölçümlerin nasıl kodlanacağı mantıklı geliyor mu?


23

Ben bakarak edilmiş @conjugateprior tarafından / lm bu bakış llmer R formüller ve aşağıdaki girişi ile karıştı:

Şimdi A'nın rastgele olduğunu, ancak B'nin sabit olduğunu ve B'nin A içinde iç içe olduğunu varsayalım.

aov(Y ~ B + Error(A/B), data=d)

lmer(Y ~ B + (1 | A:B), data=d) Aynı durum için aşağıdaki analog karma model formülü verilmiştir.

Ne anlama geldiğini tam olarak anlamadım. Deneklerin birkaç gruba ayrıldığı bir deneyde, sabit bir faktör (gruplar) içine yerleştirilmiş rastgele bir faktöre (denekler) sahip oluruz. Fakat sabit bir faktör rastgele bir faktör içinde nasıl yerleştirilebilir? Rasgele konular içine yerleştirilmiş sabit bir şey? Mümkün mü? Bu mümkün değilse, bu R formülleri mantıklı geliyor mu?


Bu genel bakış kısmen, kişilik projesinin, R'de tekrarlanan ölçümlere dayanarak bu öğreticiye dayanarak , R'de ANOVA yapma sayfalarına dayandığı belirtilmektedir . ANOVA tekrarlanan önlemler için aşağıdaki örnek verilmiştir:

aov(Recall ~ Valence + Error(Subject/Valence), data.ex3)

Burada denekler değişken değerde kelimelerle (üç seviyeli faktör) sunulur ve geri çağırma süreleri ölçülür. Her konu üç değerlik seviyesinin tümü ile birlikte sunulmaktadır. Bu tasarımda iç içe geçmiş hiçbir şey göremiyorum ( buradaki büyük cevaba göre çarpı işareti gibi görünüyor ) ve bu nedenle bu durumda uygun rastgele bir terim olduğunu Error(Subject)ya (1 | Subject)da uygun olacağını düşünüyorum . Subject/Valence"Yuvalama" (?) Karıştırıyor.

Bunun Valencebir konu içi faktör olduğunu anladığımı unutmayın . Ancak bence denekler arasında “iç içe geçmiş” bir faktör olmadığını düşünüyorum (çünkü tüm denekler üç seviyenin hepsini de yaşıyor Valence).


Güncelleştirme. Özgeçmiş ile kodlanmış tekrarlanan ölçümleri ANOVA'da R ile ilgili soruları araştırıyorum.

  • Burada aşağıdakiler, sabit konu içindeki / tekrarlanan önlemler A ve rastgele için kullanılır subject:

    summary(aov(Y ~ A + Error(subject/A), data = d))
    anova(lme(Y ~ A, random = ~1|subject, data = d))
    
  • Burada iki sabit konu içi / tekrarlanan ölçümler etkisi A ve B için:

    summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d))
    lmer(Y ~ A*B + (1|subject) + (1|A:subject) + (1|B:subject), data=d) 
    
  • Burada üç konu içi etki A, B ve C için:

    summary(aov(Y ~ A*B*C + Error(subject/(A*B*C)), data=d))
    lmer(Y ~ A*B*C + (1|subject) + (0+A|subject) + (0+B|subject) + (0+C|subject) + (0+A:B|subject) + (0+A:C|subject) + (0+B:C|subject), data = d)
    

Sorularım:

  1. Neden Error(subject/A)ve değil Error(subject)?
  2. Öyle mi (1|subject)yoksa (1|subject)+(1|A:subject)basitçe (1|A:subject)mi?
  3. Öyle mi (1|subject) + (1|A:subject)yoksa (1|subject) + (0+A|subject)ve neden sadece (A|subject)?

Şimdiye kadar, bu şeylerin bazılarının eşdeğer olduğunu iddia eden bazı iplikler gördüm (örneğin, ilk: aynı olduklarını iddia eden, ancak SO için zıt bir talep ; üçüncü: aynı olduklarını iddia eden bir iddia ). Onlar mı?


2
Sadece hızlı comment açık konuşmak gerekirse, demek kavramsal Bence o rastgele faktör iç içe sabit bir faktör olması mantıklı neredeyse hiç. Ben de en az bir tane ders kitabı yazarı okudum (şu anda referansı hatırlayamıyorum). Bununla birlikte, yukarıda yazdığınız model özelliklerinden bazılarının istatistiksel olarak daha mantıklı olan modellere denk olması muhtemeldir ... Daha fazla düşünmek ve biraz oynamak zorunda kalacağım.
Jake Westfall

4
Aslında, R'nin A / B sözdizimini yorumlama şeklini düşünürseniz mantıklı geldiğini tahmin ediyorum: basitçe bunu A + A: B'ye genişletiyor. Öyleyse subject/condition, bunun gibi rastgele bir terim düşünürsek , bu kavramsal olarak şüphelidir, çünkü koşulların konulara iç içe geçtiğini, açıkça tersi olduğu anlaşılıyor, ancak gerçekte uygun subject + subject:conditionolan model, rastgele konu efektleriyle mükemmel şekilde geçerli bir modeldir. ve rastgele konu X eğimleri.
Jake Westfall

@JakeWestfall Teşekkürler, bu şimdiye kadar kendim hakkında düşündüğüm çizgiler boyunca, ama birisinin doğru şekilde açıklamasını çok isterdim. Aslında bunun önemsiz bir soru olduğu ortaya çıkmasına şaşırdım; Hemen cevap verebilecek insanlardan biri olmanızı beklerdim. Ancak bu bir rahatlama, sanırım başlangıçta benim kafamın aptal olması gerektiğini düşündüm. Bu arada, bazı standart referanslar lmve aovformüller var mı? Tam olarak neyin aovişe yaradığı (sarmalayıcı lmmı?) Ve Error()terimlerin nasıl çalıştığı konusunda nereye bakmalıyım?
amip diyor Reinstate Monica

1
@ amoeba Evet, en küçük kareler için kullanılan anlamında aovbir ambalajlayıcıdır , ancak bazı ek işler yapar (özellikle terim için ). Yetkili kaynak, kaynak kodu veya büyük olasılıkla verilen referanslar : Chambers et al (1992). Ancak bu referansa erişimim yok, bu yüzden kaynak koduna bakardım. lmlmaovErrorlmhelp("aov")
Roland,

Yanıtlar:


12

Karışık modellerde, faktörlerin sabit veya rastgele olarak, özellikle de çarpılmış, kısmen çaprazlanmış veya iç içe geçmiş olsunlar ile birlikte kullanılması çok fazla kafa karışıklığına neden olabilir. Ayrıca, terminolojide anova / tasarlanmış deneyler dünyasında iç içe geçmenin ne demek olduğu ile karışık / çok düzeyli modeller dünyasında farklılıklar olduğu görülüyor.

Tüm cevapları bilmek konusunda tereddüt etmiyorum ve cevabım tam olmayacak (ve daha fazla soru sorabilirim) ancak burada bazı sorunlara değinmeye çalışacağım:

Sabit bir etkinin rastgele bir iç içe içine yerleştirilmesi veya R (aov ve lmer) 'de tekrarlanan ölçümlerin nasıl kodlanacağı mantıklı geliyor mu?

(soru başlığı)

Hayır, bunun mantıklı olduğuna inanmıyorum. Biz tekrarlanan önlemlerle ilgileniyor, sonra genellikle şey önlemler rastgele olacak tekrarlanan olduğunu, 'adil diyelim ne olursa olsun Subject, ve de lme4biz dahil etmek isteyeceksiniz Subjectdaha birine veya sağ tarafında |rastgele kesiminde formül. Başka rastgele etkilerimiz varsa, bunlar ya çaprazlanmış, kısmen çarpılmış ya da iç içe geçmiş - ve bu soruya cevabım buna değiniyor.

Bu anova tipinde tasarlanan deneylerle ilgili sorun, normalde sabit olarak düşünülebilecek, tekrarlanan önlemler durumunda düşünülebilecek faktörlerle nasıl başa çıkılacağı gibi görünüyor ve OP'nin gövdesindeki sorular şöyle konuşuyor:

Neden Hata (konu / A) ve Hata (konu) değil?

Genelde kullanmıyorum aov()bu yüzden bir şeyleri kaçırıyor olabilirim, ama benim Error(subject/A)için bağlantılı soru söz konusu olduğunda çok yanıltıcı . Error(subject)aslında aynı sonuçlara yol açar.

Bu (1 | konu) veya (1 | konu) + (1 | A: konu) veya basitçe (1 | A: konu)?

Bu, bu soru ile ilgilidir . Bu durumda, aşağıdaki tüm rastgele etki formülasyonları tamamen aynı sonuca yol açar:

(1|subject)
(1|A:subject)
(1|subject) + (1|A:subject)
(1|subject) + (1|A:subject) + (1|B:subject)

Bununla birlikte, bunun nedeni, sorudaki benzetilmiş veri kümesinin hiçbir şey içinde bir değişme göstermemesidir Y = rnorm(48). Eğer içindeki cakeveri kümesi gibi gerçek bir veri kümesi lme4alırsak, bunun genel olarak böyle olmayacağını görürüz. Belgelere göre, deneysel kurulum:

Üç farklı tarifle yapılmış ve altı farklı sıcaklıkta pişmiş çikolatalı keklerin kırılma açısına ilişkin veriler. Bu tarifeler bütün birimler ve alt birimlere (kopyalar içinde) uygulanan farklı sıcaklıklar ile bölünmüş bir tasarıma sahiptir. Deneysel notlar, tekrarlanan numaralandırmanın geçici sıralamayı temsil ettiğini göstermektedir.

Aşağıdaki 5 değişken hakkında 270 gözlemden oluşan bir veri çerçevesi.

replicate 1 ila 15 seviyelerine sahip bir faktör

recipe A, B ve C seviyelerine sahip bir faktör

temperature 175 <185 <195 <205 <215 <225 ile sipariş edilen bir faktör

temp pişirme sıcaklığının sayısal değeri (derece F).

angle pastanın kırıldığı açıyı veren sayısal bir vektör.

Böylece, içinde tekrarlanan önlemleri replicatealdık ve ayrıca sabit faktörlerle de ilgileniyoruz recipeve temperature( tempbu sadece farklı bir kodlama olduğu için görmezden gelebiliriz temperature) ve durumu kullanarak görselleştirebiliriz xtabs:

> xtabs(~recipe+replicate,data=cake)

     replicate
recipe 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
     A 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     B 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     C 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6

Eğer reciperastgele bir etki olsaydı, bunların rastgele etkilerden geçtiğini söylerdik. Hiçbir şekilde, hiçbir şekilde başka hiçbir kopyaya recipe Aait değildir replicate 1.

> xtabs(~temp+replicate,data=cake)

     replicate
temp  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
  175 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  185 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  195 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  205 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  215 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  225 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3

Benzer şekilde temp.

Bu yüzden uygun olabilecek ilk model:

> lmm1 <-  lmer(angle ~ recipe * temperature + (1|replicate), cake, REML= FALSE)

Bu, her replicatebirini rastgele değişimlerin tek kaynağı olarak görecektir (elbette artık dışında). Ancak tarifler arasında rastgele farklılıklar olabilir. Bu yüzden recipebaşka (çapraz) rastgele bir etkiyi dahil etmek için cazip gelebiliriz, ancak bu tavsiye edilmez çünkü sadece 3 seviyemiz var, recipebu yüzden modelin varyans bileşenlerini iyi tahmin etmesini bekleyemeyiz. Bunun yerine, replicate:recipeher bir çoğaltma ve tarif kombinasyonunu ayrı bir gruplandırma faktörü olarak ele almamızı sağlayacak olan gruplama değişkeni olarak kullanabiliriz . Öyleyse, yukarıdaki modelle replicate, her biri ayrı kombinasyonların her biri için şu anda 45 rastgele kavşağa sahip olacağımız seviyeler için 15 rastgele kavşağa sahip olacağız:

lmm3 <-  lmer(angle ~ recipe * temperature + (1|replicate:recipe) , cake, REML= FALSE)

Şimdi, tarif nedeniyle bazı rastgele değişkenliklerin olduğunu ancak çok fazla olmadığını gösteren (çok az) farklı sonuçlarımız olduğunu unutmayın.

Aynı şeyi aynı şekilde yapabiliriz temperature.

Şimdi soruna geri dönersin, sen de sorarsın

Neden (1|subject) + (1|A:subject)ve olmasın (1|subject) + (0+A|subject)ya da basitçe (A|subject)?

Emin tamamını değilim nerede bu (rastgele yamaçlarda kullanarak) gelir - bu 2 bağlantılı sorular ortaya görünmüyor - ama benim sorun (1|subject) + (1|A:subject)bu tam olarak aynı olmasıdır (1|subject/A)hangi yollarla Aiçinde yuvalanmış subject, hangi çevirmek (bana) her bir seviye A1 ve sadece 1 seviye, subjectburada açıkça böyle olmadığı anlamına gelir .

Muhtemelen biraz daha düşündükten sonra bu cevabı ekleyeceğim ve / veya düzenleyeceğim, ancak ilk düşüncelerimi aşağı çekmek istedim.


Çok teşekkürler (+1). cakeVeri setini anladığımdan emin değilim . Çoğaltma tarifi iç içe geçmiş gibi görünüyor; Sebep xtabs, tam anlamıyla iç içe geçmiş çapraz cevabınızda tanımladığınız neden olduğunu göstermiyor: çoğaltma kafa karıştırıcı bir şekilde 1-15 olarak değil, 1-45 olarak kodlanmış durumda. Her tarif için, 6 kek ile 15 "tekrar" yapıldı; Her kek daha sonra farklı sıcaklıklarda pişirildi. Bu yüzden tarif bir özne faktörüdür ve sıcaklık bir özne faktörüdür. Yani sizin cevabınıza göre, öyle olmalı (1|recipe/replicate). Yok hayır? (1|replicate:recipe)Muhtemelen eşittir.
amip diyor Reinstate Monica

Sorumu sadece konu içi faktörlere odakladım, bu yüzden cakesadece tek bir tarifle sınırlandırmak gibi olurdu . Nereden geldiğinden emin olmadığınızı söyleyeceğiniz üçüncü noktaya gelince, lütfen Q'mdaki en son bağlantıya bakın, üç konu içi faktörden bir örnek ile. Ayrıca, Jake'in rastgele yamaçlardan bahsettiği, Q'nun altındaki yorumuna bakınız.
amip diyor Reinstate Monica

Ve aovsize göre haklı göründüğü gibi görünüyor Error(subject/A)ve Error(subject)eğer başka bir faktör yoksa aynı sonuçları verir, ancak iki faktörle bağlantılı iplikten bir örnek alın ve orada Error(subject/(A*B))ve Error(subject)eşdeğer değildir. Benim şu anki anlayışım, eskilerin rastgele yamaçları içermesidir.
amip diyor Reinstate Monica

@ amoeba cakeveri kümesi iyi bir çalışma örneği değildi. Özür dilerim. Bunun içine biraz daha derin bakacağım ve muhtemelen örnekleme için daha iyisini bulmaya çalışacağım.
Robert Long,

Teşekkürler. Herhangi bir güncelleme için ve Placidia'nın hazırladığı güncelleme için bekliyorum. Bu arada, burada bir lütuf yapacağımı düşünüyorum.
amip diyor Reinstate Monica,

3

Ooooops. Uyarı yorum yapanları gönderimin çok saçma olduğunu fark ettiler. İç içe tasarımları ve yinelenen önlem tasarımlarını karıştırıyordum.

Bu site iç içe ve tekrarlanan ölçü tasarımları arasındaki farkın faydalı bir dökümüdür. İlginç bir şekilde, yazar sabit içinde sabit, sabit içinde rastgele ve rastgele içinde rastgele - ama rastgele içinde sabit olmamak için beklenen ortalama kareleri göstermektedir. Bunun ne anlama geldiğini hayal etmek zor - eğer A seviyesindeki faktörler rastgele seçildiyse, o zaman rastgelelik şimdi B seviyesindeki faktörlerin seçimini düzenler, eğer bir okul kurulundan rastgele 5 okul seçilirse, 3 öğretmen ise Her okuldan (okullara yerleştirilmiş öğretmenler) seçilen “öğretmen” faktörünün seviyeleri, okulların rastgele seçilmesi sayesinde okul yönetim kurulundan rastgele seçilen öğretmenler. Denemede sahip olacağım öğretmenleri "düzeltemiyorum".


2
+1, çok teşekkürler. Cevabınızdaki her şey benim için anlamlı. Ancak, "iç içe geçmiş" kelimesinin iki farklı anlamda kullanıldığına ve bunun karışıklığa neden olduğuna karar vermemiz gerektiğini düşünüyorum. @RobertLong, her B düzeyinin farklı düzeylerde AEg sınıfları ile birlikte gerçekleştiğinde A'nın B'ye yerleştirildiğini, kasabalara vb. Yerleştirilmiş okullara yerleştirildiğini söyler. Örnekte, denekler tedavi / kontrol faktörünün içine yerleştirilmiştir. Zamanın öznelerin içine yerleştirildiğini söylüyorsunuz, ancak Robert tüm zamanların geçtiklerini söyleyebilmeleri için tüm zaman seviyelerinin tüm öznelerde gerçekleştiğini söylüyorsunuz! Bu farklı bir "iç içe" dir. Sağ?
amip diyor Reinstate Monica

1
Örneğinizde, zamanın ve tedavinin sabit etkiler olduğu açıktır, ancak zamanın hastalar içinde yuvalandığı açık değildir. Lütfen "iç içe" tanımını sağlayabilir misiniz?
Joe King,

Benim hatam. Yerleştirme ve tekrarlanan önlemleri karıştırıyordum. Cevabımı değiştirdim - tekrar!
Placidia

Aslında orjinal cevabınızı bugün erken gelen düzeltmeler / eklemelerle beğendim. Sorumla ilgili birçok yararlı bilgi vardı çünkü gördüğünüz gibi burada "tekrarlanan önlemler" ile ilgileniyorum (ve "yuvalama" ile ilgili soru sadece terminolojik bir noktaydı). Önceki revizyona devam etmeni öneririm!
amip diyor Reinstate Monica

2
Yazarken, tekrarlanan ölçümlerdeki rastgele etkilerin iç içe geçtiğini fark ettim ve matematiğin nasıl çalıştığını ve serbestlik derecelerini test etmek istiyorum. Bu çivilenmiş olduğundan emin olduğumda cevabımı yükselteceğim!
Placidia
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.