Korkarım, araştırmacı veya veri analisti tarafından öznel bir seçim olduğu nüanslı ve belki de tatmin edici olmayan bir cevaba sahip olabilirim. Bu iş parçacığının başka bir yerinde belirtildiği gibi, verilerin "iç içe bir yapıya" sahip olduğunu söylemek yeterli değildir. Adil olmak gerekirse, çok düzeyli modellerin ne zaman kullanılacağını kaç kitap tanımlamaktadır. Örneğin, Joop Hox'un Çok Düzeyli Analizi kitabını kitaplığımdan çıkardım, bu da bu tanımı veriyor:
Çok düzeyli bir sorun, hiyerarşik bir yapıya sahip bir nüfusla ilgilidir.
Oldukça iyi bir ders kitabında bile, ilk tanım dairesel görünüyor. Bunun kısmen, ne tür bir modelin (çok düzeyli bir model dahil) ne zaman kullanılacağını belirlemenin öznelliğinden kaynaklandığını düşünüyorum.
Başka bir kitap olan West, Welch ve Galecki'nin Doğrusal Karışık Modelleri bu modellerin:
artıkların normal olarak dağıtıldığı ancak bağımsız olmadığı veya sabit varyansının bulunduğu sonuç değişkenleri. LMM'ler kullanılarak uygun bir şekilde analiz edilebilecek veri kümelerine yol açan çalışma tasarımları arasında (1) sınıflardaki öğrenciler gibi kümelenmiş verilerle yapılan çalışmalar veya endüstriyel bir süreç için hammadde grupları gibi rastgele bloklarla deneysel tasarımlar ve (2) deneklerin zaman içinde veya farklı koşullar altında tekrar tekrar ölçüldüğü boylamsal veya tekrarlı ölçüm çalışmaları.
Finch, Bolin ve Kelley'nin R'deki Çok Düzeyli Modellemesi de iid varsayımını ve ilişkili kalıntıları ihlal etmekten bahsediyor:
Çok seviyeli modelleme bağlamında özellikle önemli olan, bir numunedeki bireysel gözlemler için bağımsız olarak dağıtılan hata terimlerinin varsayımıdır (standart regresyonda). Bu varsayım, temel olarak, analizdeki bağımsız değişkenler hesaba katıldığında, numunedeki bağımlı değişken için bireyler arasında hiçbir ilişkinin olmadığı anlamına gelir.
Gözlemlerin birbirinden bağımsız olması gerektiğine inanmak için bir neden olduğunda çok düzeyli bir modelin mantıklı olduğuna inanıyorum. Bu bağımsızlıktan bağımsız olarak ne tür "küme" modellenebilir.
Bunun bariz bir örneği sınıflardaki çocuklar olabilir - hepsi birbirleriyle etkileşime girer ve bu da test puanlarının bağımsız olmamasına neden olabilir. Bir sınıfta, o sınıfta diğer sınıflarda ele alınmayan malzemenin ele alınmasına yol açan bir soru soran birisi varsa ne olur? Öğretmen bazı dersler için diğerlerinden daha uyanıksa ne olur? Bu durumda, verilerin bağımsızlığı bir miktar olabilir; çok düzeyli kelimelerde, bağımlı değişkenteki bazı varyansların kümeye (yani, sınıfa) bağlı olmasını bekleyebiliriz.
Bir filin bir köpeğe karşı örneğiniz, ilginin bağımsız ve bağımlı değişkenlerine bağlıdır. Örneğin, kafeinin aktivite düzeyinde bir etkisi olup olmadığını sorduğumuzu varsayalım. Hayvanat bahçesinin her yerinden gelen hayvanlar, kafeinli bir içecek veya kontrol içeceği almak için rastgele atanır.
Kafeinle ilgilenen bir araştırmacıysak, çok düzeyli bir model belirleyebiliriz, çünkü kafeinin etkisini gerçekten önemsiyoruz. Bu model şu şekilde belirtilir:
activity ~ condition + (1+condition|species)
Bu, bu hipotezi test ettiğimiz çok sayıda tür varsa özellikle yararlıdır. Bununla birlikte, bir araştırmacı kafeinin türe özgü etkileriyle ilgilenebilir. Bu durumda, türleri sabit bir etki olarak belirtebilirler:
activity ~ condition + species + condition*species
Bu, örneğin 30 türün hantal bir 2 x 30 tasarımı oluşturması durumunda bir sorundur. Bununla birlikte, bu ilişkileri nasıl modellediğiyle oldukça yaratıcı olabilirsiniz.
Örneğin, bazı araştırmacılar çok düzeyli modellemenin daha geniş bir kullanımı için tartışıyorlar. Gelman, Hill ve Yajima (2012) , çok düzeyli modellemenin çoklu karşılaştırmalar için bir düzeltme olarak kullanılabileceğini savunmaktadır - verilerin yapısının açık bir şekilde hiyerarşik olmadığı deneysel araştırmalarda bile:
Daha fazla yapıya sahip çoklu karşılaştırmaları modellerken daha zor sorunlar ortaya çıkar. Örneğin, beş sonuç ölçütü, üç çeşit tedavi ve iki cinsiyet ve dört ırk grubuna göre sınıflandırılmış alt gruplarımız olduğunu varsayalım. Bu 2 × 3 × 4 × 5 yapıyı 120 değiştirilebilir grup olarak modellemek istemeyiz. Bu daha karmaşık durumlarda bile, çok seviyeli modellemenin sonunda klasik çoklu karşılaştırma prosedürlerinin yerini alması ve yerini alması gerektiğini düşünüyoruz.
Sorunlar çeşitli şekillerde modellenebilir ve belirsiz durumlarda, çoklu yaklaşımlar çekici görünebilir. Bence işimiz makul ve bilgili bir yaklaşım seçmek ve bunu şeffaf bir şekilde yapmak.