Palaeo bilimlerinde kullanılan belirli bir model türünü uydurmanın farklı yöntemlerinin bilgisayar tabanlı bir değerlendirmesini yaptım. Büyük bir ish eğitim setim vardı ve bu yüzden rastgele (tabakalı rastgele örnekleme) bir test setini ayırdım. I donatılmış eğitim seti örnekleri için farklı yöntemler kullanılarak m modelleri Elde edilen I test seti örnekleri için yanıtı tahmin ve test kümesinde örnekleri üzerinde RMSEP hesaplanmış. Bu tek bir koşu .
Daha sonra bu işlemi çok kez tekrarladım, her seferinde yeni bir test setini rastgele örnekleyerek farklı bir eğitim seti seçtim.
Bunu yaptıktan sonra, yöntemlerinden herhangi birinin RMSEP performansının daha iyi veya daha kötü olup olmadığını araştırmak istiyorum . Ayrıca, ikili yöntemlerle çoklu karşılaştırmalar yapmak istiyorum.
Yaklaşımım, Run için tek bir rastgele efektle doğrusal karışık efektler (LME) modeline uymaktı . Ben kullanılan lmer()
den lme4 benim model ve işlevleri uyacak şekilde paketin multcomp birden karşılaştırmalar yapmak için paketin. Modelim aslında
lmer(RMSEP ~ method + (1 | Run), data = FOO)
Burada method
, test seti için model tahminlerini oluşturmak için hangi yöntemin kullanıldığını gösteren bir faktördür ve benim "denememin" Run
her belirli Çalışması için bir göstergedir .
Benim sorum LME'nin kalıntıları ile ilgili. Run için tek rastgele etki göz önüne alındığında, bu çalışma için RMSEP değerlerinin bir dereceye kadar korele olduğunu, ancak rasgele etkinin sağladığı korelasyon temelinde, çalışmalar arasında korelasyon olmadığını varsayarım.
Bu koşular arasındaki bağımsızlık varsayımı geçerli mi? Değilse, bunu LME modelinde hesaba katmanın bir yolu var mı yoksa sorumu cevaplamak için başka bir statik analiz türü mü arıyorsunuz?