Parametrik olmayan istatistiklerde bağlar neden bu kadar zor?


14

Benim parametrik olmayan metin, Pratik Parametredışı İstatistikler , sık sık olduğu gibi, varyansları testi istatistik ve beklentilerin temiz formüller verir ama biz bağları göz ardı edersek bu sadece çalışır bu ihtar içerir. Mann-Whitney U İstatistiği hesaplanırken, hangisinin daha büyük olduğunu karşılaştırırken bağlı çiftleri atmanız önerilir.

Bu bağların bize hangi popülasyonun daha büyük olduğu hakkında pek bir şey söylemediğini anlıyorum (ilgilendiğimiz şey bu ise), çünkü her iki grup da diğerinden daha büyük değildir, ancak asimptotik dağılımlar geliştirirken bunun önemli olmadığı anlaşılmaktadır.

Öyleyse neden bazı parametrik olmayan prosedürlerde bağlarla ilgili böyle bir sorun var? Bağları basitçe atmak yerine yararlı bilgiler çıkarmanın bir yolu var mı?

DÜZENLEME: @ whuber'ın yorumuyla ilgili olarak, kaynaklarımı tekrar kontrol ettim ve bazı prosedürler, bağlı değerleri tamamen bırakmak yerine ortalama sıralar kullanıyor. Bu, bilgiyi saklamakla ilgili olarak daha mantıklı görünse de, bana da titizlikten yoksun gibi geliyor. Ancak sorunun ruhu hala geçerli.


Diyorsun ki Pratik Parametredışı İstatistikler "anlatır dışarı atmak onlar bağlanmıştır atarken veri"? Tavsiyesini yanlış yorumlayabilir misiniz? Tam olarak alıntı yapabilir misiniz?
whuber

Evet, tavsiyeyi yanlış yorumluyorum. Aynı yazardan: jstor.org/stable/2284536 "Wilcoxon başlangıçta sıfırlardan verilerden çıkılmasını ve testin azaltılmış veri kümesinde gerçekleştirilmesini önerdi. Sıfır olmayan bağlar yoksa bu prosedür koşullu olarak sonuçlanır ( sıfır)) dağıtım serbest testi ve kritik değerlerin mevcut kesin tabloları kullanılmasını sağlar.Bu nedenle, parametrik olmayan istatistiklerle ilgili çoğu kitap Wilcoxon'un yöntemini testin açıklamalarına dahil eder "
Christopher Aden

Bu Wilcoxon İmzalı Sıra testine atıfta bulunuyor, ancak diğer NP prosedürlerinde kullanılan benzer tavsiyeleri duydum. Mann-Whitney örneğiyle ilgili olarak, geri dönüp kitaba baktım ve yanıldığım konusunda haklısın. Mann-Whitney ile, kitap bağlı değerlerin sıralarının ortalamasını önerir, yani: 6 ve 7 sıraları bağlıysa, her birine 6.5 değeri verir.
Christopher Aden

2
Teşekkür ederim. Bağlı grupları hesaba katmanın titiz yolları vardır. Sansürlü (ancak sürekli) verilerle çalışırken önemlidirler, çünkü sıklıkla sansürlenen değerler büyük bağlı bir gruptur. Kruskal-Wallis ve Wilcoxon Rank Sum testleri için RO Gilbert, Çevresel Kirlilik İzleme için İstatistiksel Yöntemler bölüm 18'e bakınız. "Bağlı verileri içeren formüller karmaşıklaşabilir, ancak bazı durumlarda (KW testi gibi) yapmanız gereken tek şey rütbeleri için bir ANOVA tablosu hesaplamak
whuber

Yanıtlar:


14

Parametrik olmayanlar üzerindeki çalışmaların çoğu başlangıçta, bağların imkansız olacağı (yeterince doğru ölçülürse) altta yatan bir sürekli dağılım olduğu varsayılarak yapıldı. Teori daha sonra, sipariş istatistiklerinin (bağları olmayan çok daha basit olan) veya diğer formüllerin dağılımlarına dayanabilir. Bazı durumlarda istatistik yaklaşık normaldir ve bu da işleri gerçekten kolaylaştırır. Veriler yuvarlandığı veya doğal olarak ayrık olduğu için bağlar eklendiğinde, standart varsayımlar geçerli değildir. Yaklaşım hala bazı durumlarda yeterince iyi olabilir, ancak diğerlerinde olmayabilir, bu yüzden genellikle en kolay şey bu formüllerin bağlarla çalışmadığına dair bir uyarı vermektir.

Bazı standart parametrik olmayan testler için bağlar mevcut olduğunda kesin dağılımı hesaplayan araçlar vardır. R için exactRankTests paketi bir örnektir.

Bağlarla başa çıkmanın basit bir yolu, permütasyon testleri veya önyükleme gibi randomizasyon testlerini kullanmaktır. Bunlar asimtotik dağılımlar için endişelenmez, ancak verileri olduğu gibi, bağları ve her şeyi kullanırlar (birçok bağla birlikte, bu tekniklerin bile düşük güce sahip olabileceğini unutmayın).

Birkaç yıl önce, bağların fikirlerini ve onlarla yapabileceğiniz bazı şeyleri tartışan bir makale vardı (Amerikan İstatistikçisinde düşündüm, ama bulamıyorum). Bir nokta, hangi soruyu sorduğunuza bağlı olması, bir üstünlük testinde aşağılık olmayan bir teste kıyasla bağlarla ne yapılacağının çok farklı olabileceğidir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.