Sıradan Verileri Görüntüleme - Araçlar, Medya ve Ortalama Sıralamalar


11

Normalde dağıtılmayan bazı sıralı verilerim var, bu yüzden Mann-Whitney U Testini kullanarak parametrik olmayan testler yapmaya karar verdim. Yedi puan için gruplar arasındaki farklılıklara bakıyorum - bu puanlar her konu için 0, 1, 2 veya 3'tür. Verilerimi nasıl görüntüleyeceğimi bulmakta zorlanıyorum!

Verileri medyanları (ve medyanların IQR'sini) kullanarak sunarsam, farkların nerede olduğu açık değildir çünkü çoğunlukla medyanlar 0 veya 1'e düşer. Bu nedenle Mann-Whitney U Testi önemli farklılıklar göstermesine rağmen, tablo sadece ilginç görünmüyor.

Verileri araçları kullanarak da sunabilirim . Orada sıralı verilerle araçlar kullanabileceğinizi ancak puanlar arasındaki farklar hakkında aynı türde varsayımlar yapamayacağınızı söyleyen bazı bilimsel makaleler var (örneğin, 0 ile 1 arasındaki fark 1 ile 1 arasındaki fark değil 2). Tablodaki sayılar, hikayeyi kullandığımda iyi anlatsa da, araçları kullanmak biraz tartışmalı olurdu.

Üçüncü seçenek, SPSS'nin Mann-Whitney çıktısında bana verdiği ortalama dereceleri kullanmaktır . Ortalama sıralamalar gruplar arasında karşılaştırılan şeydir, belki de sadece bunları kullanmalıyım? Bununla ilgili tek sorun, ortalama sıralamaların gerçek verilerle ilgili gerçekten bir şey ifade etmemesidir (örneğin, kontroller ortalama sıralamaları kullanarak 1'e yakınken konuların 3'e daha yakın olduğunu göremiyorum.)

Ve son bir seçenek, skorları iki gruba (düşük için 0 ve 1 ve yüksek için 2 ve 3) böldükten sonra denek ve kontrolleri karşılaştıran bir ki-kare analizi yapmaktı. Ancak, bunu yaptığımda, farklar belirgin değildi (muhtemelen birkaç nedenden dolayı).


Verilerinizi metinde, tabloda veya şekilde en iyi nasıl sunacağınızı mı soruyorsunuz?
gung - Monica'yı eski

Hem metin hem de tablo. Metinde, uyku anketimin çeşitli bileşenleri üzerinde gruplar arasında önemli farklılıklar olduğunu söyleyeceğim. Bu farklılıklar bir Mann-Whitney testi ile yapılır, bu nedenle ortalama dereceleri karşılaştırırlar. Bilmiyorum, bu farklılıkları bir tabloda nasıl sunmalıyım. Medyan kullanmak işe yaramıyor çünkü çok benzerler ve farklılıkları göremiyorsunuz. Araçlar daha iyi çalışır, ancak parametrik olmayan medyanlarla ilgili olması gereken bir tabloda parametrik önlemleri kullanmak garip görünüyor. Ve ortalama rütbeler işe yarar, ancak gerçek değerleri temsil etmezler.
Eric

1
İki sıra değişken arasındaki ilişki için Graph'ten bazı cevapların sizin amaçlarınıza uyarlanıp uyarlanamayacağını merak ediyorum. Örnek grafikler, her biri beş seviyeli iki değişken arasındaki ilişkiyi gösterir, ancak örneğin iki grubu karşılaştırıyorsanız ve dört olası seviyeniz varsa, bu görselleştirmelerden bazılarını 5'e 2 yerine 4'e 2 olarak hayal edebilirsiniz. Belki 5.
Silverfish

Bazı (muhtemelen tamamen sahte) örnek veriler yayınlayabiliyorsanız faydalı olabilir, böylece olası bir tekniği göstermek isteyen insanların üzerinde çalışacak bir şeyleri vardır.
Silverfish

1
Eric, tanımı gereği parametrik olmayan bir test, özellikle Mann-Whitney, genel olarak (baskınlık için) iki dağılımı karşılaştırır, ortalama veya medyan gibi bir dağılımın spesifik bir parametre değerini karşılaştırmaz. Bir dağılımın karakteristiği olan tek bir sayı yoktur ve aynı zamanda bu durumda karşılaştırılan şeydir. Hodges-Lehmann 2 örnekli tahmin ediciyi kullanabilirsiniz, ancak bu, iki dağılımın her biri için değil, iki dağılım arasındaki farkın karakteristiğidir.
ttnphns

Yanıtlar:


8

Bu mükemmel bir soru. Bulduğunuz gibi, nicelikler verilerde birçok bağ olduğunda işe yaramaz, çünkü tahmin ediciler olarak çok süreksizdirler. Eğer kategoriler arasındaki boşluğun en azından "yarı anlamlı" olduğunu varsayabilirseniz, çoğu zaman en iyi yolu bulurum. Aşılma olasılıkları her zaman geçerlidir. Sizin durumunuzda bunlar gözlem oranı ile tahmin edilir.1,2,=3 . Grupları karşılaştırırken ortalama sıralar yararlıdır, ancak tek bir değişken için çok fazla kullanım görmüyorum.

Ortalamaları sıralı değişkenleri özetlemek için kullanmanın doğruluğu nadiren verilerin kendisinden gelebilir. Bu özneldir.

Dxyγxy


1
Merhaba Frank, düşünceli yanıtın için teşekkürler. Sakıncası yoksa, birkaç takip sorum var. Araçlarla ilgili olarak - temelde sırasıyla "hayır, hafif, orta ve şiddetli bozulma" anlamına geldiklerinden, kategorilerin en azından yarım anlamlı olduğuna inanıyorum. Bunun için emsal olarak kullanabileceğimi bildiğiniz referanslar var mı? Ayrıca, sadece bir tabloda araç, diğerlerinde ise tutarlılık uğruna medyan kullanmakta tereddüt ediyorum. VE ortalama sıralar için - Grupları karşılaştırdığımı düşünüyorum - denekler ve kontroller 7 puan üzerinde. Ortalama sıralamaların karşılaştırılması kabul edilebilir / yararlı mı?
Eric

Sayımlar ve belki de değer düşüklüğü örneğiniz gibi az seviyeli sayısal sıralı veriler için, araçlar yararlıdır ve medyanlar (çok fazla bağ nedeniyle) değildir. Aynı tabloda sıralı veriler için araçlar ve çarpık sürekli veriler için medyanlar kullandığımda birçok durum var.
Frank Harrell
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.