İki grup için küçük ve dengesiz numune boyutları - ne yapmalı?


10

İki grup (yani numuneler) için verilerim var ama karşılaştırmak istediğim toplam örnek boyutu küçük (n = 29) ve kuvvetli dengesiz (n = 22 vs n = 7).

Bu verilerin toplanması lojistik olarak zor ve pahalıdır, bu nedenle bariz bir çözüm olarak 'daha fazla veri topla' bu durumda yardımcı olmaz.

Bir dizi farklı değişken ölçüldü (kalkış tarihi, varış tarihi, geçiş süresi vb.), Bu nedenle bazıları varyansları çok farklı olan (daha küçük varyansı daha yüksek olan küçük örnek) birden fazla test vardır.

Başlangıçta bir meslektaş bu veriler üzerinde t-testi yaptı ve bazıları P <0.001 ile istatistiksel olarak anlamlıydı, diğeri P = 0.069 ile anlamlı değildi. Bazı örnekler normalde dağıtılırken diğerleri dağıtılmadı. Bazı testler, 'eşit' varyanslardan büyük kalkışlar içeriyordu.

Birkaç sorum var:

  1. t-testleri burada uygun mu? Değilse, neden? Bu sadece normallik ve varyansların eşitliği varsayımlarının karşılandığı testler için mi geçerli?
  2. uygun alternatif (ler) nedir? Belki bir permütasyon testi?
  3. eşit olmayan varyans Tür I hatasını şişirir, ama nasıl? ve küçük, dengesiz numune boyutunun Tip I hatası üzerinde nasıl bir etkisi var?

Yanıtlar:


11

İki popülasyonun eşit varyanslarını kabul eden T testleri, iki popülasyonun farklı varyansları olduğunda geçerli değildir ve eşit olmayan örnek boyutları için daha kötüdür. En küçük örnek boyutu en yüksek varyansa sahip olan boyuttaysa, testte Tip I hatası şişirilecektir). Öte yandan, t-testinin Welch-Satterthwaite versiyonu eşit varyans kabul etmez. Fisher-Pitman permütasyon testini düşünüyorsanız, eşit varyanslar varsayar (düşük bir p değerinden eşit olmayan araçlar çıkarmak istiyorsanız).

Düşünmek isteyebileceğiniz başka şeyler de var:

(1) Varyanslar açıkça eşit değilse, araçlar arasındaki farkla hala ilgileniyor musunuz?

(2) Etki tahminleri sizin için p değerlerinden daha yararlı olabilir mi?

(3) Bir dizi tek değişkenli karşılaştırma yapmak yerine verilerinizin çok değişkenli doğasını düşünmek ister misiniz?


Merhaba Scortchi, cevabınız için teşekkürler.
Sorduğunuz

2
(1) Hem varyans hem de ortalama, çalışmamız için bilgilendirici olabilir (örneğin, göç çıkış tarihleri ​​bir popülasyon için önemli ölçüde daha geç olabilir ve kalkış tarihlerindeki aralık daha değişkendir).
DeanP

3
(1) Az önce bahsettiğim için, insanlar eşitsiz varyansları yalnızca teknik bir sorun olarak görüyorlar ve bunun kendi başına ilginç bir gerçek olduğunu unutuyorlar.
Scortchi - Monica'yı eski durumuna döndürün

2
(2) Demek istediğim, p-değerleri listesinin genellikle güven aralıklı etki büyüklüğü tahminlerinin (ortalamalar, medyanlar, varyanslar veya herhangi bir şey olabilir) bir listesinden daha az kullanışlı olmasıydı. Özellikle küçük numunelerde güven aralıkları, p-değeri yüksek olsa bile pratik önemi olan etki boyutlarının verilerle hala uyumlu olup olmadığını gösterebilir.
Scortchi - Monica'yı eski durumuna döndürün

2
(3) Bir bağımsız değişken (grup) ve birkaç bağımlı değişken (göç zamanı & c.) Düşünüyordum: gruplar arasındaki ilginç bir fark, bağımlı değişkenler arasındaki ilişkide bir değişiklik olabilir. İlk adım, diyalog boyunca gruplar arasındaki her bir dv'yi ve diğer hücrelerdeki her bir dv çifti (yine ayırt edici gruplar) için dağılım grafiklerini karşılaştıran kutu grafikleri veya nokta grafikleri olan güzel bir matris olacaktır. Dürüst olmak gerekirse, küçük örneklem büyüklüklerine sahip bir keşif analizi için bu son adım olabilir.
Scortchi - Monica'yı eski durumuna döndürün

1

İlk olarak, Scortchi'nin daha önce belirttiği gibi, T-testi, verilerin dağılımı hakkındaki varsayımları nedeniyle verilerinize o kadar uygun değildir.

İkinci noktanıza, T-testine bir alternatif öneriyorum. İlginiz yalnızca gerçeğe bağlıysa, iki örneğinizin dağılımları eşit veya eşit değilse, Wilcoxon rank-sum testinin iki taraflı sürümünü de kullanmayı deneyebilirsiniz. Wilcoxon sıra toplamı testi parametrik olmayan bir testtir. Bu tür bir test, verilerinizin temeldeki dağıtımından emin değilseniz özellikle yararlıdır.

Küçük numune boyutları ve büyük kohortlar için testin kesin bir çözümü vardır . Ayrıca , Wilcoxon sıra toplamı testini gerçekleştiren bir R paketi de vardır .

Parametresiz bir test olduğundan ve küçük örnek boyutlarını da işlediğinden, test sizin için uygun olacaktır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.