Wilcoxon imzalı sıralama testine etki büyüklüğü?

Bazı yazarlar (örn. Pallant, 2007, s. 225; aşağıdaki resme bakın), test istatistiğini gözlem sayısının kare köküne bölerek Wilcoxon imzalı bir sıralama testi için etki boyutunu hesaplamayı önermektedir:

$r = \frac{Z}{\sqrt{n_x + n_y}}$

ZSPSS (aşağıdaki resme bakın) yanı sıra tarafından tarafından test istatistiği çıkışı wilcoxsign_testR. içinde (aynı zamanda benim ilgili soruya bakın: teststatistic wilcoxsign_test içinde linearstatistic vs )

Diğerleri Bravais-Pearson'u önermektedir ( ) ya da Spearman (veri türüne bağlı olarak) korelasyon katsayıları (). $r = \frac{cov(XY)}{sd(X) \times sd(Y)}$ $r_S$

Onları hesapladığınızda, iki rs uzaktan bile aynı değildir. Örneğin, mevcut verilerim için:

r = 0.23 ( $r = \frac{Z}{\sqrt{n_x + n_y}}$ )

r = 0.43 (Pearson)

Bunlar oldukça farklı etki boyutları anlamına gelir.

Peki, kullanılacak doğru etki büyüklüğü rhangisidir ve ikisi birbiriyle nasıl ilişkilidir?

Sayfa 224 (alt kısım) ve Pallant, J. (2007) 'den 225. SPSS Hayatta Kalma Kılavuzu:

resim açıklamasını buraya girin

effect-size wilcoxon-signed-rank

— Topluluk
kaynak

Ah, evet, belki bu kadar .

— Glen_b

Olduğu gibi bırakmayı tercih ederim - Bravais bir dilde krediyi hak ediyorsa, başka bir dilde hak ediyor! Eğitimimdeki bir boşluğun doldurulmasını takdir ediyorum.

— Glen_b -Monica

Evet, çünkü bağları kaldırabilecek bir teste ihtiyacım var.

n

\sqrt{n}

$\sqrt{n}$

n = n_{x} + n_{y}

$n = n_x + n_y$

Şahsen ben Z / sqrt (n) bir seçenek olabileceğini düşündüm. Mann-Whitney'deki Wikipedia, Kirby'nin eşleştirilmiş Wilcoxon'u da dikkate alan bir pdf makalesine bağlanıyor; Makaleyi kendim okumadım.

— ttnphns

Yanıtlar:

Bağlarınız yoksa, önceki değerlerin karşılık gelen değerlerinden daha düşük olan after değerlerinin oranını rapor ederdim.
Bağlarınız varsa, bağlı olmayan çiftlerin toplam sayısından öncekinden daha düşük olan değerlerin oranını veya üç oranın (<, =,>) ve belki de ikisinin toplamının toplamını bildirebilirsiniz. Daha anlamlı. Örneğin, '% 33'ün istatistik korkusu daha az,% 57'si değişmedi ve% 10'unun kurstan sonra% 90'ın öncekiyle aynı veya daha iyi olması gibi daha fazla korkusu olduğunu' söyleyebilirsiniz.

$N$ $z$ $\sqrt N$ $z/\sqrt N$ $z/\sqrt N$

Yine de başka bir kırışıklık var. Genel etkinin boyutunun tahmin edilmesini isteseniz de, insanlar genellikle sıralı olan verilerle Wilcoxon imzalı sıralama testini kullanırlar. Yani, verilerin bir öğrenci içindeki vardiya büyüklüğünü güvenilir bir şekilde gösterebileceğine güvenmiyorlar, ancak sadece bir vardiya meydana geldi. Bu beni yukarıda tartışılan iyileşme oranına getiriyor.

Öte yandan, değerlerin kendinden anlamlı olduğuna güveniyorsanız (örn., Normalize ve aykırı değerlere karşı sağlamlığı için yalnızca imzalı sıralama testini kullandınız), sadece ham ortalama veya medyan fark veya standartlaştırılmış ortalama fark kullanabilirsiniz. bir etki ölçüsü olarak.

— gung - Monica'yı eski durumuna döndür
kaynak

+1 Önerilen etki önlemleriniz kolayca anlaşılır ve test istatistiği ile de ilgilidir.

— John

Ne tür verilerin değerlendirildiğini bilmeden, burada iyi tavsiyeler vermek çok zordur. Ve gerçekten, elde edebileceğiniz bu kadar. Böyle sorular için etki büyüklüğünün en iyi ölçüsü diye bir şey yoktur ... belki de hiç.

Soruda bahsedilen etki boyutlarının tümü standartlaştırılmış etki boyutudur. Ancak orijinal önlemlerin araçlarının veya medyanlarının iyi olması tamamen mümkündür. Örneğin, bir üretim sürecinin tamamlanmasının ne kadar sürdüğünü ölçüyorsanız, zamanlardaki fark mükemmel derecede makul bir etki büyüklüğü olmalıdır. Süreçteki değişiklikler, gelecekteki ölçümler, sistemler arası ölçümler ve fabrikalar arası ölçümler zamanında yapılacaktır. Belki ortalamayı, belki de medyanı, hatta modu istersiniz, ancak yapmanız gereken ilk şey gerçek ölçüm ölçeğine bakmak ve orada etki büyüklüğünün yorumlamak için makul olup olmadığını ve ölçüme güçlü bir şekilde bağlı olup olmadığını görmek.

Bunu düşünmeye yardımcı olmak için, standartlaştırılması gereken etkiler, dolaylı ve birçok şekilde ölçülen şeylerdir. Örneğin, psikolojik ölçekler zaman içinde değişebilir ve birçok yönden ve doğrudan değerlendirilmeyen temel bir değişkene ulaşmaya çalışabilir. Bu durumlarda standart efekt boyutları istersiniz.

Standartlaştırılmış etki boyutları ile kritik konu sadece hangisinin kullanılacağı değil, ne anlama geldikleridir. Sorunuzda ifade ettiğiniz gibi, ne anlama geldiklerini de bilmiyorsunuz ve bu kritik olan şey. Standartlaştırılmış etkinin ne olduğunu bilmiyorsanız, doğru bir şekilde raporlayamaz, doğru bir şekilde yorumlayamaz veya doğru şekilde kullanamazsınız. Ayrıca, verileri tartışmak istediğiniz çeşitli yollar varsa, birden fazla efekt boyutu bildirmenizi kesinlikle engelleyecek hiçbir şey yoktur. Verilerinizi ürün moment korelasyonu gibi lineer ilişki veya Spearman ile rütbe arasındaki ilişki açısından tartışabilirsiniz.rve bunlar arasındaki farklar veya tablodaki tüm bilgileri sağlayın. Bunda yanlış bir şey yok. Ancak sonuçlarınızın ne anlama geldiğine karar vermeniz gereken her şeyden daha fazlası. Bu, verilen bilgilerden cevaplanamayan bir şeydir ve bu tür bir forumdaki bir soru için makul olandan çok daha fazla bilgi ve alana özgü bilgi gerektirebilir.

Ve etkileri nasıl bildirdiğiniz konusunda daima meta-analitik düşünün. Gelecekte insanlar bildirdiğim sonuçları alıp başkalarıyla entegre edebilecek mi? Belki de bu şeyler için alanınızda bir standart var. Belki de parametrik olmayan bir test seçtiniz, çünkü esas olarak başkalarının temel dağılımlar hakkında yaptığı sonuçlara güvenmiyorsanız ve öncelikle parametrik testleri kullanan bir alandaki varsayımlarınızda daha muhafazakar olmak istiyorsunuz. Bu durumda, tipik olarak parametrik testlerde kullanılan bir efekt boyutu sağlamakla ilgili yanlış bir şey yoktur. Bulgunuzu benzer araştırmaların daha geniş bir literatürüne nasıl yerleştirdiğinizi düşünürken bu ve diğer birçok konunun dikkate alınması gerekir. Tipik olarak iyi tanımlayıcı istatistikler bu sorunları çözer.

Bu birincil tavsiyedir. Birkaç yorum daha var. Etki büyüklüğünüzün yaptığınız testle güçlü bir şekilde ilişkili olmasını istiyorsanız, Ztemel tavsiye en iyisidir. Standartlaştırılmış efekt boyutunuz testle aynı anlama gelir. Ama bunu yapmadığınız anda, başka bir şey kullanmanın yanlış bir yanı yok, hatta dparametrik testlerle ilişkili Cohen gibi bir şey . Hesaplama yöntemleri, standart sapmalar veyadpuanları. Aslında, önerilen korelasyon katsayısına göre daha zayıf varsayımlar vardır. Ve her zaman iyi tanımlayıcı tedbirler bildirin. Yine, açıklayıcı önlemlerin ihlal edeceğiniz varsayımları yoktur, ancak bunların önemli anlamlarını unutmayın. Verileriniz hakkında söylemek istediğiniz ve araçların ve medyanların farklı şeyler söylediği açıklayıcı istatistikler bildirirsiniz.

Bağımsız tasarım efekt boyutlarına karşı tekrarlanan ölçümleri tartışmak istiyorsanız, bu gerçekten yeni bir soru.

— John
kaynak