Yapısal bir denklem modelinde çok küçük bir numuneye sahip olmanın komplikasyonları


13

Amos 18'de yapısal bir denklem modeli (SEM) kullanıyorum. Deneyim için (gevşek olarak kullanıldı) 100 katılımcı arıyordum ki bu muhtemelen başarılı SEM yürütmek için yeterli değildi. SEM'in (EFA, CFA ile birlikte) "büyük örnek" istatistiksel bir prosedür olduğu defalarca söylendi. Uzun lafın kısası, 100 katılımcıya ulaşmadım (ne sürpriz!) Ve iki sorunlu veri noktasını hariç tuttuktan sonra sadece 42 tane var. Çıkar dışında, yine de modeli denedim ve sürprizime göre, çok iyi uyuyordu! CFI> .95, RMSEA <.09, SRMR <.08.

Model basit değil, aslında, nispeten karmaşık olduğunu söyleyebilirim. Biri iki gözlenen ve diğeri 5 gözlenen değişken olan iki gizli değişkenim var. Modelde ayrıca gözlenen dört değişken daha var. Dolaylı ve doğrudan değişkenler arasında çok sayıda ilişki vardır, bazı değişkenler örnek olarak dörde endojendir.

SEM için biraz yeniyim; Bununla birlikte, SEM'e oldukça aşina olduğunu bildiğim iki kişi, uyum göstergeleri iyi olduğu sürece, etkilerin yorumlanabilir olduğunu (anlamlı oldukları sürece) ve modelde önemli bir "yanlış" olmadığını söylüyor. Bazı uyum göstergelerinin iyi örnekleme açısından küçük numunelere karşı veya önyargılı olduğunu biliyorum, ancak daha önce bahsettiğim üç iyi görünüyor ve benzer şekilde önyargılı olmadığına inanıyorum. Dolaylı etkileri test etmek için önyükleme kullanıyorum (2000 örnek veya benzeri), yüzde 90 önyargı düzeltilmiş güven, monte carlo. Ek bir not, üç farklı koşul için üç farklı SEM çalıştırıyorum.

Bazılarınızın dikkate almasını istediğim iki sorum var ve katkıda bulunacak bir şeyiniz varsa lütfen yanıtlayın:

  1. Modelimde uyum indeksleri tarafından gösterilmeyen önemli zayıflıklar var mı? Küçük örneklem, çalışmanın bir zayıflığı olarak vurgulanacaktır, ancak tamamen bilmediğim bazı büyük istatistiksel problem olup olmadığını merak ediyorum. Gelecekte 10-20 katılımcı daha almayı planlıyorum, ancak bu yine de bu tür analizler için nispeten küçük bir örnek bırakacak.

  2. Küçük örneğim veya kullandığım bağlamda önyükleme kullanımımla ilgili herhangi bir sorun var mı?

Umarım bu sorular bu forum için çok "temel" değildir. SEM ve ilgili konular hakkında birkaç bölüm okudum, ancak insanların bu alandaki görüşler açısından çok dağınık olduğunu düşünüyorum!

Şerefe


1
@Behacad - iyi açıklanmış bir sorun. Çok seyrek veriler kullanarak bir sürü parametreyi tahmin ediyorsunuz. Yani çıkarım çok titrek olacak. Ama geri çekilip sormak istiyorum - bu 42'yi daha büyük bir nüfus arasındaki ilişkileri çıkarmak için mi kullanıyorsunuz? Eğer öyleyse, 42 rastgele bir örnek midir, yoksa en azından gösterilebilir bir örnek midir?
rolando2

Yorumunuz için teşekkür ederiz rolando2! Örneklem 42 üniversite öğrencisini içermektedir ve bir dizi faktör ile kaygı arasındaki ilişkiye bakıyorum. Çıkarım yapmak istediğim ilişkiler genel nüfus arasında olacaktı. Çıkarımlarım sınırlı, çünkü katılımcıların hepsi nispeten genç öğrenciler, ancak belirli bir popülasyon (örneğin, bir anksiyete bozukluğu olan kişiler) aramıyorum. Örneğin X'in klinik olmayan bir numunede dolaylı olarak Y ile ilişkili olduğunu belirtmekle ilgileniyorum. Bu sorularınızı cevaplıyor mu?
Behacad

1
@Behacad - potansiyel eleştirmenlerinizin örneğinizi temsil edebileceğini varsayarsak, 12 değişken arasındaki ilişkileri tahmin etmeye çalışmanın 42 vakanızdan çok fazla şey istediğini kesin olarak söyleyebilirim. Modelinizi yalnızca en ilginç 3 öngörücüyü içerecek şekilde basitleştirip basitleştiremeyeceğinize bakın. Verilerle ayrılmanın acı verici olduğunu fark etsem de, toplamak için çok çalışmış olabilirsiniz!
rolando2

Cevabınız için teşekkür ederim. Tüm bu değişkenler arasındaki ilişkileri tahmin etmenin 42 veri noktasıyla ilgisi olmadığını "hissetiyorum" ve nereden geldiğinizi görüyorum. Bununla birlikte, bu problem için istatistiksel bir neden (tercihen belirtilen) ne olurdu? Bu, farklı bağımlı değişkenler üzerinde bir dizi regresyon / korelasyon yürütmekten nasıl farklıdır? Uyum iyidir (ve aslında farklı deneysel görevler için üç farklı model çalıştırıyorum) ve sonuçlar modeller arasında ve teori ile uyumludur. Savunma olarak gelirsem özür dilerim!
Behacad

(Savunmasız - endişelenmeyin!) 42 vakanın olması, tek değişkenli istatistikleri tahmin ederken bile en azından örnekleme hatasına maruz kalmanızı sağlar. Şimdi, SEM'de, her değişken birçok kez kullanılır, çünkü C, D, vb.'yi kontrol ederken A ile B arasındaki ilişkiyi tahmin edersiniz. tipik olarak büyük örnekler ister. Sizin durumunuzda, rastgele bir örneğiniz olmadığı için örnekleme hatasından daha fazla hata türünüz olabilir. Bu nedenle, elde ettiğiniz sonuçların etrafına çok büyük bir güvenilir aralık çizmeniz gerekir.
rolando2

Yanıtlar:


4

Bir nokta: "temel soru" diye bir şey yoktur, bilmediklerinizi değil, yalnızca bildiklerinizi bilirsiniz. bir soru sormak genellikle öğrenmenin tek yoludur.

Ne zaman küçük örnekler gördüğünüzde, modellerinde kimin gerçekten "iman" olduğunu, kimin olmadığını öğrenirsiniz. Bunu söylüyorum çünkü küçük numuneler genellikle modellerin en büyük etkiye sahip olduğu yerlerdir.

Kendimi keskin (psiko?) Bir model olarak, bunun için git diyorum! Dikkatli bir yaklaşımı benimsiyorsunuz ve küçük örneklem nedeniyle potansiyel önyargı vb. Kabul ediyorsunuz. Modellerin küçük verilere uydurulmasının akılda tutulması gereken bir şey, 12 değişkeninizin olmasıdır. Şimdi düşünmelisiniz - 12 değişkenli herhangi bir model 42 gözlemle ne kadar iyi belirlenebilir? 42 değişkeniniz varsa, o zaman herhangi bir model bu 42 gözleme (gevşekçe) tam olarak uyabilir, bu nedenle davanız çok esnek olmaktan çok uzak değildir. Modeliniz çok esnek olduğunda ne olur? Gürültüye uyma eğilimindedir - yani, varsaydıklarınız dışındaki şeylerin belirlediği ilişkiler.

Ayrıca, gelecekteki 10-20 örneklerin modelinizden ne olacağını tahmin ederek egonuzu modelinizin olduğu yere koyma fırsatına da sahipsiniz. Eleştirmenlerinizin doğru tahminler veren "tehlikeli" bir modele nasıl tepki vereceğini merak ediyorum. Modeliniz verileri iyi tahmin etmiyorsa benzer bir "Sana söylemiştim" alacağınızı unutmayın.

Sonuçlarınızın güvenilir olduğundan emin olmanın bir başka yolu da bunları kırmaya çalışmaktır. SEM sonuçlarınızın gülünç görünmesini sağlamak için orijinal verilerinizi koruyun, yeni bir veri kümesi oluşturun ve bu yeni veri kümesine ne yapmanız gerektiğini görün. Sonra ne yapmanız gerektiğine bakın ve şunu düşünün: Bu makul bir senaryo mu? "Saçma" verilerim gerçek bir olasılığa benziyor mu? Saçma sonuçlar üretmek için verilerinizi saçma bölgeye götürmeniz gerekiyorsa, yönteminizin sağlam olduğuna dair bazı güvence sağlar (sezgisel, biçimsel değil).


1

Bununla ilgili gördüğüm temel sorun güç eksikliğidir. Doğrulayıcı faktör ve SEM testi null değerini kabul etmek istiyor - önemli olmayan bir p değeri görmek istiyorsunuz - bu nedenle güç eksikliği bir sorun olabilir. Testin gücü örneklem büyüklüğüne (42) ve serbestlik derecesine bağlıdır. AMOS size serbestlik derecesi verir. Alıntı yapmadınız, ancak bu durumda büyük olmayacaktır. 12 değişkenle, 66 DF ile başlar ve tahmin ettiğiniz her parametre için 1 çıkarırsınız. Kaç tane olacağını bilmiyorum, ama çeşitli yapılar arasında çeşitli faktörler ve korelasyonlar olduğunu söylüyorsun.

Rolando2 ile tamamen aynı fikirde değilim. SEM'de, temeldeki yapıların güvenilir göstergeleri olduğunu varsayarak çok sayıda değişkene sahip olursunuz. Yani değişken sayısını azaltmayın. Aynı nedenden dolayı @probabilityislogic ile tamamen aynı fikirde değilim. SEM'de, 42 gözlemli 12 değişken modellemeye çalışmıyorsunuz. Yapıları 42 replikasyonla güçlendirilmiş 12 gösterge ile modellenmeye çalışıyorsunuz. Çok basit bir faktör modeli - 12 göstergeli 1 faktör - muhtemelen 42 kişi ile test edilebilir.

RMSEA ve diğer uyum iyiliği önlemleri, modelin doygunluğuna yaklaştıkça iyileşme eğilimi gösterecektir, bu nedenle yine yanıltıcı bir sonuç alma riskiniz vardır.

Bununla birlikte, küçük veri kümelerinin bir faktör modelini reddettiğini gördüm. Muhtemelen uyumun iyi göründüğü bir şey anlamına gelir.

Not: Bir SEM modelinin kalıntılarını da kontrol edebilirsiniz. Bunlar, tahmini kovaryans matrisi ile model kovaryans matrisi arasındaki farklardır. İsterseniz AMOS bunları size verecektir. Kalıntıların incelenmesi, eşit olarak dağılmış olup olmadıklarını veya belirli kovaryansların çok kötü takıldığını gösterebilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.