Modelimi lmer'da doğru bir şekilde belirttim mi?


26

Birçok yardım sitesini araştırdım ve karışık bir modelde daha karmaşık iç içe terimlerin nasıl belirleneceği konusunda kafam hala karıştı. Ayrıca kullanımı gibi karıştı :ve /ve |etkileşimleri belirterek kullanarak rasgele faktörlerle yuva içinde lmer()de lme4yer pakette R.

Bu sorunun amacı için, verilerimi bu standart istatistiksel modelle doğru şekilde tasvir ettiğimi varsayalım: sabittir ve rastgele (dolaylı olarak) içinde yuvalanmıştır .

Ybenjk=u+istasyonben+kıtıkj(ben)+günk+(istasyonxgün)benk+(kıtıkxgün)j(ben)k
stationtowdayTowstation

Başka bir deyişle, modelimin İstasyon (i, sabit), Tow (j, rastgele, İstasyona tam olarak yerleştirilmiş), Gün (k, rastgele) ve Tow ile Gün arasındaki etkileşimi ve Gün ile etkileşimi içerdiğini umuyorum. ve İstasyon. Modelimi oluşturmak için bir istatistikçiye danışmıştım ve şu anda verilerimin temsilcisi olacağına inanıyorum, ancak aynı zamanda yazımın alt kısmına ilgi göstermeyenler için verilerimin açıklamasını da ekleyeceğim.

Şimdiye kadar bir araya getirmeyi başarabildiğim şey şuydu lmer:

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

Bu benim istatistiksel modelimi doğru bir şekilde gösteriyor mu? Doğru okumazsa kodumu nasıl geliştirebileceğime dair herhangi bir öneriniz var mı?

Lmer formülümde belirtmekte zorlandığım terimleri yazdım

# 1. Çekme rastgele olduğunda çekme istasyonu içinde yuvalanmış ve istasyon sabittir
ancak kullanarak rastgele iç içe ve etkileşim açısından birbirinden ayırma ile ilgili, ben kafam karıştı :ve /. Yukarıdaki örneğimde, (1|station:tow)istasyonun içinde iç içe yedekte okuduğunu umduğum bir umut. Çeşitli sitelerde rastgele biçimde kullanmamı :veya kullanmamamı gerektiren çelişkili yorumlar okudum . /(1|...)lmer

# 2. İstasyonun sabit olduğu gün ile gün arasında rastlantısal olan ve rastgele olan gün arasındaki etkileşim,
o zamanlar var, (1|station:day)ama bu sefer, istasyon ile gün arasındaki etkileşimi okuduğunu umuyorum. İstasyonun ve günün bireysel etkilerini ve bunların etkileşimlerini hesaba katmak için istasyon * gününü kullanabiliyor gibiyim (yukarıdaki üç terimin her birini ayrı ayrı dahil etmek yerine), ancak bunu nasıl belirteceğimi bilmiyorum biri sabit diğeri rasgele olduğunda. Bunu station*(1|day)yapar mısın?

3.. Çekme (sabit) istasyon içine yerleştiği yedekte ve gün (her ikisi de rastgele) arasındaki etkileşim Sonra son olarak, ben (1|tow:day)ben umuyorum ki etkileşimini okur towve dayama yedekte iç içe olduğunu tekrar belirtmek gerekir merak ediyorum (dolaylı olarak) istasyonda mı?

Hem Rve hem de lmeristatistiksel modelleme konusunda yeniyim ve mümkünse sorularıma verdiğim cevaplarda ayrıntılı açıklama yapma zorluğunu takdir ediyorum.

Verilerim hakkında daha ayrıntılı bilgi: Plankton konsantrasyonlarının kıyı okyanusunda fiziksel bir cepheye göre değişip değişmediğini soruyorum. Bu cephenin içinde ve dışında, karada üç istasyon var. İstasyon böylece sabittir. Her istasyonda, üç kopyalı plankton çekicisini alıyorum (ondan su ile ölçülen metre başına böcek sayısı bakımından sıralama, sayma ve konsantrasyon yapma). Çekme hareketi rastgeledir: Üç çekmede, o istasyondaki planktondaki genel değişkenliği hesaba katmayı umuyorum. Her bir çekirdeğin kendine özgü bir kimliği olmadığı için çekmece kendinden geçmeli olarak yuvaya yerleştirilmiştir (123,123,123, her istasyondaki çekicilerin kimliğidir). Daha sonra bunu yeni ve bağımsız bir günde, oluşturduğu yeni bir cephe ile yaptım. Günü engelleyici bir faktör olarak düşünebilir miyim? Gün, bunu birden fazla bağımsız cephe gününde tekrarlamak olarak rastgeledir; günden güne değişkenliği yakalamaya çalışır ve bu cephenin bulunduğu tüm günleri temsil eder. Tow'ların günden güne değişkenlik gösterip göstermediğini ve istasyonların her zaman benzer veriler sağlayıp sağlamadığını veya güne bağlı olup olmadığını görmek için etkileşim terimleri hakkında bilgi edinmek istiyorum.

Yine, zaman ayırdığınız ve yardım ettiğiniz için teşekkür ederim.


Standart istatistik modelinizde bazı abonelikleri kaçırdığınızı düşünüyorum (yanılıyorsam eklemek istemedim).

1
FWIW, bu konuya rastlayan ve konuyla ilgili olup olmadığını merak eden, Rsözdizimine, IMO'ya odaklandığı göz önüne alındığında, söz konusu modelin iç içe geçme ve etkileşimlerle ilgili olduğunu anlama konusunda yeterince istatistiki CV için.
gung - Reinstate Monica

1
Bu bence% 100 konudur.


2
Senin göre lmer()sözdizimi, bir bir sabit etkisi yoktur modeli belirttiğiniz stationaynı (1) kombinasyonu ile bireyler tarafından paylaşılan ve dört rastgele yakaladığını, stationve tow, (2) değeri Day, (3) kombinasyonunu stationve dayve ( 4) towve daysırasıyla sırasıyla. Amacın bu mu? Emin değilim, çünkü @BabekP tarafından belirtildiği gibi, model formülasyonunuzu nasıl yazdığınız belli değil. Değişken isimleri yazdınız, parametrelere değil. Normalde, böyle bir modelde, değişken kombinasyonları aboneler tarafından yakalanır.
Makro

Yanıtlar:


23

Yedekte rasgele ve istasyon sabit olduğunda Yedekte istasyonun içinde yuvalanmış

station+(1|station:tow)doğru. @John onun cevabını söylediğim gibi, (1|station/tow)kadar genişleyip (1|station)+(1|station:tow)Zaten bir sabit etkisi istasyonu belirtilen çünkü istemediğiniz (yedekte ile istasyon arasındaki istasyon artı etkileşimin ana etkisi).

İstasyon sabitlendiğinde ve gün rastgele olduğunda istasyon ile gün arasındaki etkileşim.

Sabit ve rastgele bir etki arasındaki etkileşim her zaman rastgeledir. Yine @John'un dediği gibi, station*daygenişletmek üzeresiniz station+day+station:day(yine) istemezsiniz, çünkü daymodelinizde zaten belirtmişsinizdir . İstediğinizi yapmanın ve day(rastgele) ve station(sabit) ' in çapraz etkilerini daraltmanın bir yolu olduğunu sanmıyorum , ancak station+(1|day/station)önceki cevabın belirtildiği şekilde genişleyeceği yazmak isteyebilirsiniz station + (1|day) + (1|day:station).

yedekte istasyona yerleştirildiğinde yedekte çekiş ve gün arasındaki etkileşim

Eğer benzersiz değerlere sahip olmadığı için towdeğişken siz römorkörler belirtilir aşağıda söylediği gibi (yani çünkü 1, 2, 3her istasyonda, sen yapmak gibi iç içe belirtme ihtiyacını (1|station:tow:day). Eğer römorkörler benzersiz belirtilen var mı varsa, ya kullanabilirsiniz (1|tow:day)veya (1|station:tow:day)(bunlar eşdeğer cevaplar vermelidir). Eğer yoksa değil , bu durumda iç içe belirtmek lme4tüm istasyonlarda çekme 1. tarafından paylaşılan bir rasgele etkisini tahmin etmek çalışacağız ...

station:tow:dayxx

Are http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specification ve http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed sizin için yararlı?


Yararlı cevaplar ve referanslar için çok teşekkür ederim, çok teşekkür ederiz. Yukarıda açıkladığınız gibi (1 | a: b) notaları hakkında kafam karıştı, burada ':' bir iç içe olduğu kadar bir etkileşimin de olduğu anlamına geliyor. Her ikisini de nasıl belirleyebilir? Başka bir deyişle, hangi ilişkiyi gösterdiğinizi nasıl bilebilir? Burada temel bir şey eksik olmalı, özür dilerim.
wtree

4
Bu bağlamda, etkileşim ve yuvalama arasında çok fazla bir fark yoktur. Bİç içe olup olmadığı Aveya onunla etkileşime girip girmediği, ana etkisinin Amodele dahil edilip edilmediğine bağlıdır . Ana etkisi ise Bolduğu da o modelde süre geçmedi ...
Ben Bolker

Herkese selam Burada ilgili bir soru sordum: stats.stackexchange.com/questions/272377/… birisi (özellikle @BenBolker'de) bir bakma ve bir cevap verme şansı varsa.
Joshua Rosenberg,

11

Formüldeki bazı şeyler biraz kafa karıştırıcıdır. :İse iki terim arasındaki etkileşimler içindir *ana etkileri ve etkileşimleri içindir. Bu /etkileşimler için bir diğeridir ancak yaptığı şey pay ve paydadaki tüm terimler arasında bir etkileşim oluşturmaktır (örn. A/(B+C) = A:B + A:C). Bu |"tarafından gruplandırılmış" gibi bir şey içindir. Yani, 1|stationistasyona göre gruplanmış engelleme olur ve parantez içinde rastgele olur (1|station). Bu şekilde yuva yapmayı tercih edersiniz.

Umarım bu yardımcı olur. Sabit bir efektin içinde rastgele bir efektin olması biraz garip ve bunu nasıl temsil edeceğinizden emin değilim. Durumu hayal bile edemiyorum. Değişkenlerinizin ne olduğunu ve neyi başarmak istediğinizi açıklarsanız daha iyi bir yanıt alabilirsiniz. Çoğu zaman insanlar sorular soruyor ve terminolojiyi yanlış kullanıyor ve iletişim kurması zor. Değişkenlerin neyi temsil ettiğini ve onlar hakkında ne bilmek istediğinizi açıklayın.

Son paragrafınızdaki açıklamanıza odaklanmanız, çekiciniz gibi topladığınız örneklerin bir göstergesidir ve çekicinin 1 çekiciden 2 bir şekilde sürekli olarak farklı olmasını beklediğiniz tahmin edilmesi gereken bir şey değildir. Tow sadece bir örnek gösteriyor. Çekicilerin sırasının gerçekten önemli olduğuna inanmıyorsanız, o değişkenle bile uğraşmazsınız. Ve eğer önemliyse, o zaman sabit bir etki (ve belki de rastgele, ancak sadece rastgele bir etki değil). Çekicilerin günden güne değişkenlik gösterip göstermediğini bilmek istediğinizi söylüyorsunuz. Cevabı evet mi? Günden güne değişmeyen gerçekçi olasılıklar alanında değildir. Bu sadece önlemlerin bir varyansı. Sen' Her bir sapma özelliğini açıklamaya çalışamazsınız çünkü hata için fazladan sapma kalmaz. Aşırı belirlenmiş bir modeliniz olurdu. Her önlemi rapor etme noktasında olacaktın.

İstasyonun günden güne değişip değişmediğini merak etmekle ilgili benzer bir açıklama yaparsınız; Tabii ki öyle. Ama belki belirli günleri kastediyorsunuz? Günler mevsim, ay döngüsü vb. İle bir şekilde gruplandırıldı mı? Bu sadece 1. günden başka bir şeye sahip olmadığınız sürece, bu gün 2., vb. İstasyonların günden güne değiştiğini bilmek, size istasyonların değiştiğinden başka bir şey söylediğini nasıl anlar? Dolayısıyla, bu sorunun cevabı elbette ki istasyonlar günden güne değişiyor. Ve elbette, şehirler günden güne ve istasyondan istasyona değişir. Sonunda basit bir modelle sola dönersin:

aov(y ~ station, data = dat)

Burada sahip olduğun sabit bir etki, istasyon, sadece birden fazla yedekte ve birden fazla günde örneklenir. Burada gerçekten çok seviyeli modellemeye ihtiyacınız olduğundan emin değilim. Modelinizi aşırı belirliyorsunuz gibi geliyor.

Gerçekten rastgele günler ve çekiliş efektleri istiyorsanız ve burada belirtmediğiniz bilgiler varsa, bunu çok düzeyli bir modele genişletebilirsiniz. Olurdu:

lmer(y ~ station + (two*day|station), data = dat)

Bu modeli kullanmak için her istasyonda ve günde birden fazla çekiciye ihtiyacınız var.


Söylediğin her şeye katılıyorum, ancak bunun bir cevaptan çok bir yorum olduğunu düşünüyorum.
Makro

@John "İç içe geçme şeklini bulana kadar" seninleydim. Sanırım iç içe geçme şeklini kaçırdım. Daha ayrıntılı olarak açıklamak ister misiniz? Sanırım hala kafam karıştı | ve içine daha fazla bakacağız. Fakat cevabınızdan, örneğin, çekicinin (rastgele) istasyonun (sabit) içine yerleştirildiğini nasıl göstereceğinden emin değilim.
wtree

@John Oh ve istasyon okyanusa ilgi duyulan yerler / yerler olarak belirlenir ve çekiciler rastgeledir, çünkü rastgele olan bu bölgelerdeki plankton çekicilerini alıyorum. Bir istasyondaki plankton popülasyonunu temsil etmek.
wtree

1
Bir numunenin her etiketi rastgele bir değişken değildir, düzenlemelere bakın.
John

1
Hala çekicinin bu açıklamada belirtilen modelde olmaması gerektiğini düşünüyorum. Gün olsa iyi geliyor.
John
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.