Bir modele rastgele bir efekt ne zaman eklenir?


9

Karma modelleme konusunda yeniyim ve yaptığım bir analizde rastgele bir efekt kullanmanın uygun olup olmadığı konusunda kafam karıştı. Herhangi bir tavsiye mutluluk duyacağız.

çalışmam, yeni geliştirilen bir memeli bolluğu endeksinin yerleşik ancak daha emek yoğun bir endeksin değerini ne kadar iyi tahmin edebileceğini test ediyor. Bu endeksleri her orman yamasında birden fazla parsel ile birden fazla orman yamasında ölçüyorum.

çünkü orman yamalarının etkisi ile doğrudan ilgilenmiyorum ve örnek arazilerim orman yamalarının içine yerleştirildiği için orman yamalarını rastgele bir etki olarak kullanıyorum. Ancak, bununla ilgili birkaç sorum var:

İlk olarak, rastgele efektlerin, sonuçlarınızı rastgele örneklemenin tüm olası seviyeleri arasında genelleştirmenize izin verdiğini biliyorum. ama bana öyle geliyor ki, bu tür bir çıkarımda bulunmak için seviyelerinizin rastgele örneklenmesi gerekecek mi? Orman yamalarım rastgele örneklenmedi, bu yüzden hala rastgele bir efekt olarak kullanabilir miyim?

ikincisi, örneğin efektli ve etkisiz modelleri karşılaştırmak için bir olasılık oranı testi yaparak rastgele bir etkiye sahip olmanın gerekli olup olmadığını test edebileceğinizi okudum. Bunu yaptım ve rastgele etki modelinin verileri ve sabit etkiler sadece modelini açıklamadığını gösteriyor. bununla ilgili sorunum, arazilerimin hala orman yamaları içinde iç içe geçmiş olması ve bu yüzden muhtemelen bağımsız olmaması. öyleyse, bu LRT yaklaşımını rastgele efekti hariç tutmak için kullanabilir miyim, yoksa yine de iç içe geçmişliği hesaba katmak için eklemem gerekir mi? ve eğer rastgele efekti kaldırırsam, orman yamaları içindeki arazilerin bağımsız olarak değerlendirilebileceğini doğrulamanın bir yolu var mı?

Yardımın için teşekkürler!

alakarga


Rastgele etkilere sahip temel kavramsal şey, hepsinin aynı büyüklükte olması ve değiştirilebilir olması gerektiğidir - bu, örneklenmemiş rastgele etkiler hakkındaki çıkarımın mümkün olmasını sağlar. Ayrıca, ML / REML tahmini sıfır veya sıfıra yakın olsa bile, varyans bileşeni ile ilgili önemli belirsizlikler olabileceğinden, rastgele etkiler için LR testleri kullanmaya dikkat etmelisiniz.
olasılık

Bunun için çok teşekkürler.Yani rasgele etkiyi korumak gerekiyorsa çalışmanın bir yolu var mı?
jay

Anladığım kadarıyla, REML'ye uyan modellerle LR karşılaştırmaları yapmak en iyisidir. Örneğin, R'nin lmer'sinde, LRT yaparken REML = FALSE ayarlamanız gerekir. (Varsayılan olarak TRUE (varsayılan), aksi takdirde daha iyidir.)
Wayne

Yanıtlar:


6

Anladığım kadarıyla, basit bir iç içe gözlemsel tasarımınız var (yamalar içindeki grafikler) ve ilginiz iki sürekli değişken (iki endeks) arasında bir korelasyon / regresyonda. Örneklem büyüklüğünüz m yamalar xn grafikleri = N çift gözlem (veya dengesizse uygun sumatory). Hiçbir uygun randomizasyon dahil edilmemiş olabilir, ancak belki (1) yamaların bu türden veya bazı bölgelerdeki tüm yamalardan "rastgele" seçildiğini ve / (2) arazilerin "rastgele" her yama içinde seçilir.

Rastgele faktör Yamasını görmezden gelirseniz, (önceden) seçilen yamalarda (sayı veya tür olarak) sınırlandırmadan N grafiğini "serbestçe" seçtiğinizi düşünerek, sahte olarak çoğaltabilirsiniz.

Yani, ilk sorunuz: evet, rastgele bir faktörün izin verdiği şey budur. Bu çıkarımın geçerliliği, gelişigüzel seçimin yamaların rastgele seçimine eşdeğer olduğu varsayımının geçerliliğine bağlıdır (örneğin, farklı bir dizi orman yaması seçildiğinde sonuçlarınızın farklı olmayacağı). Bu, çıkarım alanınıza da bir sınır koyar: sonuçlarınızın genişletileceği orman veya coğrafi alan türü, numunenizin güvenilir bir "rastgele" örnek olduğu maksimum (hayali) yama popülasyonuna bağlıdır. Belki gözlemleriniz, bölgenizdeki orman yamalarının memelilerinin "makul rastgele" bir örneğidir, ancak tüm kıtanın memelilerinin kuşkuyla toplanmış bir örneği olacaktır.

İkincisi: Test, "yalancı çoğaltma derecesi" ne veya örneğinizdeki parsellerin yamalara "ait" olduğuna dair kanıtlara bağlı olacaktır. Bu, yamalar arasında ve yamalar içindeki parseller arasında ne kadar varyasyon olduğudır (sınıf içi korelasyon arayışı). Bir uçta, sadece yamalar arasında varyasyon vardır (bir yamanın içindeki araziler aynıdır) ve "saf yalancı çoğaltma" nız vardır: N'niz yamalar sayısı olmalı ve her birinden bir ya da daha fazla çizim örneklemiyor yeni bilgi. Diğer uçta, tüm varyasyonlar araziler arasında gerçekleşir ve her bir arsanın hangi orman yamasının ait olduğunu bilerek açıklanan hiçbir ekstra varyasyon yoktur (ve daha sonra rastgele faktörü olmayan model daha cimri görünecektir); "bağımsız" planlarınız var. Aşırı uçların HİÇBİRİ çok olası değildir ... özellikle de memelilerin uzamsal otokorelasyonu ve coğrafi dağılımları nedeniyle, yerde gözlemlenen biyolojik değişkenler için. Kişisel olarak yukarıda açıklanan "deneysel-gözlemsel" benzetmeyi sürdürmek için faktörleri yine de tasarım yoluyla tutmayı tercih ederim (örneğin, yamalar BU ÖRNEKTE ilgili bir varyasyon kaynağı olmasa bile); Unutmayın: örneklerinizde, yamalar arasındaki varyasyonun sıfır olduğuna dair sıfır hipotezini reddetmek için kanıt bulunması, popülasyonda varyasyonun sıfır olduğu anlamına gelmez. yamalar bu örnekte alakalı bir varyasyon kaynağı olmasa bile) yukarıda açıklanan "deneysel-gözlemsel" benzetmeyi sürdürmek için; Unutmayın: örneklerinizde, yamalar arasındaki varyasyonun sıfır olduğuna dair sıfır hipotezini reddetmek için kanıt bulunması, popülasyonda varyasyonun sıfır olduğu anlamına gelmez. yamalar bu örnekte alakalı bir varyasyon kaynağı olmasa bile) yukarıda açıklanan "deneysel-gözlemsel" benzetmeyi sürdürmek için; Unutmayın: örneklerinizde, yamalar arasındaki varyasyonun sıfır olduğuna dair sıfır hipotezini reddetmek için kanıt bulunması, popülasyonda varyasyonun sıfır olduğu anlamına gelmez.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.