R'deki karmaşık anket verilerine çok düzeyli modellerin yerleştirilmesi


11

R'deki çok düzeyli modellerle karmaşık anket verilerinin nasıl analiz edileceğine dair tavsiye arıyorum. Bir seviyeli modellerde surveyeşit olmayan seçim olasılıkları için paketi ağırlık olarak kullandım , ancak bu paket çok düzeyli modelleme için işlevlere sahip değil. lme4Paket düzeyli modelleme için harika ama ben kümeleme farklı düzeylerde ağırlıkları dahil etmek bildiğim bir yolu yoktur. Asparouhov (2006) sorunu ortaya koymaktadır:

Çok düzeyli modeller sıklıkla küme örnekleme tasarımlarındaki verileri analiz etmek için kullanılır. Ancak bu tür örnekleme tasarımları genellikle küme düzeyinde ve bireysel düzeyde eşit olmayan bir seçim olasılığı kullanır. Örnekleme ağırlıkları, bu olasılıkları yansıtacak şekilde bir veya her iki seviyede atanır. Örnekleme ağırlıkları her iki düzeyde de göz ardı edilirse, parametre tahminleri büyük ölçüde önyargılı olabilir.

İki seviyeli modeller için bir yaklaşım, MPLUS'da uygulanan çok düzeyli sahte maksimum olabilirlik (MPML) tahmin edicisidir ( Asparouhov ve ark . ? ). Carle (2009), büyük yazılım paketlerini gözden geçirir ve nasıl devam edileceği konusunda birkaç öneri yapar:

Karmaşık araştırma verileri ve tasarım ağırlıkları ile MLM'yi düzgün bir şekilde yürütmek için analistlerin, programın dışında ölçeklendirilmiş ağırlıkları ve otomatik program değişikliği olmadan "yeni" ölçeklendirilmiş ağırlıkları içerebilen bir yazılıma ihtiyaçları vardır. Şu anda, başlıca MLM yazılım programlarından üçü buna izin vermektedir: Mplus (5.2), MLwiN (2.02) ve GLLAMM. Ne yazık ki, ne HLM ne de SAS bunu yapamaz.

West ve Galecki (2013) daha güncel bir inceleme yaparlar ve ilgili pasajı uzun süre alıntılayacağım:

Bazen analistler, karmaşık tasarımlara sahip örneklerden toplanan veri setlerini araştırmak için LMM'leri yerleştirmek ister (bkz. Heeringa ve ark., 2010, Bölüm 12). Karmaşık örnek tasarımları genellikle popülasyonun tabakalara bölünmesi, tabakalar içindeki bireylerin kümelerinin çok aşamalı seçimi ve hem kümeler hem de örneklenen nihai bireyler için eşit olmayan seçim olasılıkları ile karakterizedir. Bu eşit olmayan seçim olasılıkları, bir analize dahil edildiğinde tanımlayıcı parametrelerin tarafsız bir şekilde tahmin edilmesini sağlayan bireyler için örnekleme ağırlıklarının oluşturulmasına yol açar. Bu ağırlıklar, anket yanıtı için daha fazla ayarlanabilir ve bilinen nüfus toplamlarına göre kalibre edilebilir. Geleneksel olarak, analistler, regresyon modellerini tahmin ederken bu karmaşık örnekleme özelliklerini dahil etmek için tasarım tabanlı bir yaklaşım düşünebilirler (Heeringa ve ark., 2010). Daha yakın zamanlarda, istatistikçiler, örnekleme katmanlarının sabit etkilerini ve örneklenmiş kümelerin rastgele etkilerini dahil etmek için LMM'leri kullanarak bu verileri analiz etmek için model tabanlı yaklaşımları keşfetmeye başladılar.

Bu verileri analiz etmek için model tabanlı yaklaşımların geliştirilmesindeki temel zorluk, örnekleme ağırlıklarını dahil etmek için uygun yöntemleri seçmektir (konuların bir özeti için bkz. Gelman, 2007). Pfeffermann ve diğ. (1998), Asparouhov ve Muthen (2006) ve Rabe-Hesketh ve Skrondal (2006), çok düzeyli modelleri araştırma ağırlıklarını içerecek şekilde tahmin etmek için teori geliştirmiştir ve Rabe-Hesketh ve Skrondal (2006), Carle (2009) ve Heeringa ve ark. (2010, Bölüm 12) mevcut yazılım prosedürlerini kullanarak uygulamalar sunmuşlardır, ancak bu, istatistiksel araştırmaların aktif bir alanı olmaya devam etmektedir. LMM'leri yerleştirebilen yazılım prosedürleri, literatürde şimdiye kadar karmaşık tasarım özelliklerinin dahil edilmesi için önerilen yaklaşımların uygulanmasının çeşitli aşamalarındadır, ve analistlerin LMM'leri karmaşık örnek anket verilerine uydururken bunu göz önünde bulundurmaları gerekir. LMM'leri karmaşık örnek anketlerden toplanan verilere uydurmakla ilgilenen analistler, buradaki literatürle tutarlı olarak anket ağırlıklarını tahmin prosedürlerine (HLM, MLwiN, Mplus, xtmixed ve gllamm) doğru bir şekilde dahil edebilen prosedürlere çekilecektir. alanı.

Bu bana sorumu getiriyor: RMM'deki karmaşık anket verilerine LMM yerleştirmek için en iyi uygulama önerileri olan var mı?


1
selam Eric başlar WIH o paragrafta bağlantılar i've never said it beforegelen addhealth Bu yayınının ilgi olabilir .. :(
Anthony Damico

1
@AnthonyDamico, bağlantı şimdi kesildi :-(
Ben Bolker

@BenBolker öyle! mikro verilerin ismini değiştirdiler, ben de yaptım :) yeni konum: asdfree.com/search/label/…
Anthony

Sorunuzu yanlış yorumladıysam özür dilerim, ancak benim anlayışım, tasarımın tasarımındaki ağırlıkları sabitlediğiniz (bilinen) ve bu tasarım ağırlıklarını içeren doğrusal karışık bir model kullanmak istediğinizdir. lmerİşlev lme4paketinin bir belirtilmesine izin veren weightsTasarım ağırlıkları sabit eğer öyleyse, o argümanı ile birleştirmek mümkün olmalıdır, model uydurma süreci için argüman. Burada çubuğun yanlış ucunu buldum mu? Bunun ihtiyaçlarınız için yetersiz olmasının bir nedeni var mı?
Ben - Monica

Yanıtlar:


4

Bildiğim kadarıyla, şu anda gerçekten R'de yapamazsınız, eğer gerçekten karışık bir modele ihtiyacınız varsa (örneğin, varyans bileşenlerini önemsiyorsanız)

İçin ağırlıklar argüman lme4::lmer() olmaz çünkü, ne istersen yap lmer()hassas ağırlık olarak yorumlayıp ağırlıkları ağırlıkları örnekleme olarak değil. Sıradan doğrusal ve genelleştirilmiş doğrusal modellerin aksine, örnekleme ağırlıklarına karışık bir model için hassas ağırlık olarak davranan kodla doğru nokta tahminleri bile almazsınız.

Varyans bileşenlerini tahmin etmeniz gerekmiyorsa ve sadece modelin çok düzeyli özelliklerinin doğru standart hataları almasını istiyorsanız kullanabilirsiniz survey::svyglm().


0

WeMix ambalajın en az doğrusal ve lojistik düzeyli modeller için, şimdi bir seçenektir. Bu modelleri Stata veya MPlus'ta çalıştırmaya kıyasla çok yavaş görünüyor.


0

Ben de aynı sorunla karşı karşıyayım. Son birkaç gün içinde çok fazla araştırma yaptıktan sonra, BIFIEsurvey paketinin, örnek ve çoğaltma ağırlıkları ve makul değerlerle karmaşık anket verileri içeren çok düzeyli modelleri analiz etmeye en yakın olduğunu buldum: https://cran.r-project.org/web /packages/BIFIEsurvey/index.html Paket, iki düzeyli modellerle sınırlıdır. Ayrıca, "intsvy" paketinin yazarının uzun vadede çok düzeyli modelleri analiz edebilmek için "intsvy" yapmayı planladığını okudum ama bugün itibariyle hala yapamıyor. Bu sorunun çözümünde yanlışlıkla kaçırmış olabileceğim bir ilerleme olursa, birisi paylaşabilirse mutlu olurum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.