Veriler normal olarak dağıtılmadığında iki grup arasındaki farklar nasıl test edilir?


19

Tüm biyolojik detayları ve deneyleri ortadan kaldıracağım ve sadece eldeki problemi ve istatistiksel olarak yaptığım şeyi alıntılayacağım. Doğru olup olmadığını ve nasıl devam edileceğini bilmek istiyorum. Veriler (veya açıklamam) yeterince net değilse, düzenleyerek daha iyi açıklamaya çalışacağım.

Varsayalım ki iki grup / gözlem var, X ve Y, ve N y = 40 . Bu iki gözlemin araçlarının eşit olup olmadığını bilmek istiyorum. İlk sorum:Nx=215Ny=40

  1. Varsayımlar karşılanırsa, burada parametrik iki örnekli bir t testi kullanmak uygun mudur? Bunu soruyorum çünkü benim anlayışımdan, boyutu küçük olduğunda genellikle uygulanır?

  2. Hem X hem de Y'nin histogramlarını çizdim ve iki örnekli bir t-testinin varsayımlarından biri olan normal olarak dağılmadılar. Benim karışıklığım, onları iki nüfus olarak görüyorum ve bu yüzden normal dağılımı kontrol ettim. Ama sonra iki ÖRNEK t testi yapmak üzereyim ... Bu doğru mu?

  3. Merkezi limit teoreminden, örnekleme (popülasyon büyüklüğünüze bağlı olarak tekrarlı / tekrarsız) yaparsanız ve her seferinde örneklerin ortalamasını hesaplarsanız, yaklaşık olarak normal olarak dağıtılacağını anlıyorum. Ve bu rastgele değişkenlerin ortalaması, popülasyon ortalamasının iyi bir tahmini olacaktır. Bu yüzden bunu hem X hem de Y'de 1000 kez yapmaya karar verdim ve örnekler elde ettim ve her örneğin ortalamasına rastgele bir değişken atadım. Arsa normal olarak dağılmıştı. X ve Y'nin ortalaması 4.2 ve 15.8 (popülasyon + - 0.15 ile aynı idi) ve varyans 0.95 ve 12.11 idi.
    Eşit olmayan varyanslarla bu iki gözlemde (her biri 1000 veri noktası) bir t testi yaptım çünkü çok farklılar (0.95 ve 12.11). Ve sıfır hipotezi reddedildi.
    Bu hiç mantıklı mı? Bu doğru / anlamlı bir yaklaşım mı yoksa iki örnekli bir z-testi yeterli mi yoksa tamamen yanlış mı?

  4. Ayrıca parametrik olmayan bir Wilcoxon testi de yaptım (orijinal X ve Y'de) ve sıfır hipotez de ikna edici bir şekilde reddedildi. Önceki yöntemimin tamamen yanlış olması durumunda, parametrik olmayan bir test yapmanın iyi olduğunu düşünüyorum, belki istatistiksel güç hariç?

Her iki durumda da, araçlar önemli ölçüde farklıydı. Ancak, yaklaşımlardan birinin veya her ikisinin hatalı / tamamen yanlış olup olmadığını ve eğer öyleyse, alternatifin ne olduğunu bilmek isterim.

Yanıtlar:


21

T-testinin sadece küçük numuneler için olduğu fikri, tarihsel bir dayanaktır. Evet, başlangıçta küçük örnekler için geliştirildi, ancak teoride küçükleri büyükten ayıran hiçbir şey yok. Bilgisayarların istatistik yapmak için yaygın olduğu günlerde, t-tabloları genellikle sadece 30 dereceye kadar serbestliğe ulaştı ve normal, bunun ötesinde t dağılımının yakın bir yaklaşımı olarak kullanıldı. Bu t-masanın boyutunu makul tutmak kolaylık sağlamak içindi. Şimdi bilgisayarlarda herhangi bir örnek boyutu için t testi yapabiliriz (çok büyük örnekler için z testi ve t testi sonuçları arasındaki fark çok küçük olsa da). Ana fikir, standart sapmaları tahmin etmek için numuneyi kullanırken bir t-testi ve popülasyon standart sapmaları biliniyorsa (çok nadir) z testi kullanmaktır.

Merkezi Limit Teoremi, numune boyutları yeterince büyük olduğu sürece popülasyon normal olarak dağıtılmasa bile normal teori çıkarımını (bu durumda t-testleri) kullanmamızı sağlar. Bu, testinizin yaklaşık olduğu anlamına gelir (ancak örnek boyutlarınızla, yaklaşım çok iyi olmalıdır).

Wilcoxon testi, bir araç testi değildir (popülasyonların mükemmel bir şekilde simetrik olduğunu ve diğer olası varsayımların geçerli olduğunu bilmiyorsanız). Araçlar ana ilgi alanı ise, t-testi muhtemelen alıntı yapmak daha iyidir.

Standart sapmalarınızın çok farklı olduğu ve şekillerin normal olmadığı ve muhtemelen birbirinden farklı olduğu göz önüne alındığında, araçlardaki fark burada devam eden en ilginç şey olmayabilir. Bilimi ve sonuçlarınızla ne yapmak istediğinizi düşünün. Kararlar nüfus düzeyinde mi yoksa bireysel düzeyde mi alınıyor? Bu örneği düşünün: belirli bir hastalık için 2 ilacı karşılaştırıyorsunuz, ilaç üzerinde Numunenin yarısı hemen öldü, diğer yarısı yaklaşık bir hafta içinde iyileşti; B ilacında hepsi hayatta kaldı ve iyileşti, ancak iyileşme süresi bir haftadan daha uzundu. Bu durumda, hangi ortalama iyileşme süresinin daha kısa olduğunu gerçekten önemsiyor musunuz? Ya da A'daki yarım ölmeyi, iyileşmesi gerçekten uzun bir zaman alan (B grubundaki herkesten daha uzun) ile değiştirin.


Teşekkürler Greg. Prosedürde yanlış bir şey olmadığını varsayıyorum? Doğru soruyu sormayabileceğimi anlıyorum, ama endişem istatistiksel test / prosedür ve aynı şekilde verilen iki örnekle ilgili. Doğru soruyu sorup sormadığımı kontrol edeceğim ve varsa sorularla geri döneceğim. Belki biyolojik sorunu açıklarsam, daha fazla öneriye yardımcı olur. Tekrar teşekkürler.
Arun

5

Greg'in zaten çok kapsamlı cevabına bir ek.

Sizi doğru şekilde anlarsam, 3. noktanız aşağıdaki prosedürü belirtir:

  • Bir dağılımın örneğini gözlemleme XnX .
  • mn
  • Bu 1000 kez tekrarlayın, karşılık gelen araçları kaydedin
  • X

Şimdi varsayımınız, bu ortalama için merkezi limit teoreminin tuttuğu ve karşılık gelen rastgele değişkenin normal olarak dağıtılacağıdır.

Belki de hatayı tanımlamak için hesaplamanızın arkasındaki matematiğe bir göz atalım:

X X1,,XnX1,,XnXmk

Yk=1mi=1mXμik

μikni

11000k=110001mi=1mXμik

Xi1000m1000mXi , rastgele ağırlıkları.

Bununla birlikte, şimdi, Merkezi Limit Teoremi, birçok bağımsız rasgele değişkenin toplamının yaklaşık normal olduğunu belirtir . (Bu da ortalama yaklaşık normal olur).

Yukarıdaki tutar bağımsız örnekler üretmez. Belki rastgele ağırlıklarınız vardır, ancak bu örneklerinizi hiç bağımsız yapmaz. Bu nedenle, 3'te yazılı prosedür yasal değildir.

t


Teşekkür ederim. Görünüşe göre t-testi CLT'yi (göz ardı ettiğim greg'in cevabından) kullanarak problemle zaten ilgileniyor gibi görünüyor. Bunu işaret ettiğiniz ve 3) açık bir şekilde açıkladığınız için teşekkürler. Bu kavramları anlamak için daha fazla zaman ayırmam gerekecek.
Arun

2
CLT'nin eldeki dağılıma bağlı olarak farklı performans gösterdiğini (veya daha da kötüsü, dağılımın beklenen değerinin veya varyansının mevcut olmadığını unutmayın - o zaman CLT geçerli değildir). Şüpheniz varsa, gözlemlediğinize benzeyen bir dağıtım oluşturmak ve daha sonra bu dağılımı birkaç yüz kez kullanarak testinizi simüle etmek iyi bir fikirdir. Yaklaşık CLT sarf malzemelerinin kalitesi hakkında bir fikir edineceksiniz.
Thilo
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.