Beş noktadan oluşan grup farkları


22

İtibaren ardından bu soruya : Bir 5'li Likert öğe üzerinde iki grup (örneğin, erkek ve kadın) arasındaki merkezi eğilim farklılıkları için teste istediğiniz düşünün (örn, yaşam doyum: Memnun etmek Memnun). Bir t-testinin çoğu amaç için yeterince doğru olacağını düşünüyorum, ancak grup araçları arasındaki farkların önyükleme testinin genellikle güven aralıklarının daha doğru bir tahminini sağlayacağını düşünüyorum. Hangi istatistiksel testi kullanırdınız?


2
İlgili bir soru: İnsanlar bu tür veriler için sıklıkla parametrik olmayan Mann-Whitney testini kullanır. Sadece beş olası değer olduğundan, çok sayıda bağlı aşama olacaktır. Mann-Whitney testi, bağlı rütbelere göre ayarlanır, ancak bu ayarlama çok sayıda bağ olduğunda da işe yarar mı?
Harvey Motulsky

5
PARE, Beş Noktalı Likert Öğeleri'nde yayınlanan bu son makalede ilginizi çekebilir : t testi ve Mann-Whitney-Wilcoxon , j.mp/biLWrA .
chl

Ki-kare testinin de uygun olup olmadığından emin değilim, gruplar ve öğeler arasında bir bağımlılık olup olmadığını test eder (gruplar arasında farklı dağılımlar).
pe-pe-rry,

Yanıtlar:


12

Clason ve Dormody, Likert maddeleri için istatistiksel test konusunu ele aldı ( bireysel Likert tipi maddeler tarafından ölçülen verilerin analizi ). İki dağıtım benzer göründüğünde (zil biçimli ve eşit varyans) önyükleme testinin tamam olduğunu düşünüyorum. O, madde kategorileri arasında tepki dağıtımı için kontrol üzerinde Agresti kitabını görmenizi sağlar Ancak, kategorik verilerin (örneğin eğilim veya Fisher testi veya sıralı lojistik regresyon) için bir test de ilginç olacağını Kategorik Veri Analizi üzerinde (Bölüm 7 için Logit modelleri multinom yanıtları ).

Bunun dışında, eğer cevap dağılımı iki grup arasında kuvvetli bir şekilde dengesizse, t testi veya parametrik olmayan diğer testlerin başarısız olacağı durumları hayal edebilirsiniz. Örneğin, A grubundaki tüm insanlar 1 ya da 5 yanıtını verirse (eşit oranda) B grubundaki tüm insanlar 3 cevap verirse, o zaman aynı durumda grup içi ortalama ile özdeşleşirsiniz ve test bu durumda hiç anlamlı değildir eşcinsellik varsayımı varsayımı büyük ölçüde ihlal edilmiştir.


Clason ve Dormody makalesi iyi görünüyor. Yanıt dağılımı yorumlarınız üzerinde düşünmeniz ilginçtir. Dağıtımlardaki farklılıkların ilgi çekici olabileceğine katılıyorum. Ancak, yalnızca nüfus grubunun anlamlarının farklı olup olmadığıyla ilgileniyorsanız, hangi dağıtımların bu eşitliği sağladığı önemli değildir.
Jeromy Anglim

Bu durumda, Likert ölçeğinizin (başka bir deyişle, çok memnun ve "sadece" memnun) arasındaki algılanan farkın ideal şekilde davrandığını ve her iki popülasyonda da aynı anlama sahip olduğunu algılıyorsunuz. Bu nedenle, bunun sayısal bir ölçek olduğu varsayımını örtük olarak yapıyorsunuz, ancak bunun, özellikle katılımcılar aynı ülkeden geliyorsa, uygulamalı araştırmada bu şekilde değerlendirileceğini kabul ediyorum. Demek istediğim, genellikle Soru 10'a verdiğim yanıtta olduğu gibi, Faktör Analizi geleneğinde olduğu gibi kategorik veri analizi perspektifini vurgulamaktı.
chl

Bir Likert maddesine cevap veren numunenin ortalamasının, genel olarak grubun altında yatan boyuttaki pozisyonunun anlamlı bir özeti olduğunu kabul ediyorum. Bir Likert öğesinin anlamının gruplar arasında sistematik olarak ne zaman değişeceğini düşünmek ilginçtir. Tabii ki, bu sorun muhtemelen herhangi bir öznel ölçüm prosedürüne sadece Likert öğelerinin ötesine uzanıyor.
Jeromy Anglim

8

Söz konusu veri setinin boyutuna bağlı olarak, hipotezin kesin bir testini (ve kesin bir CI) sağlayabilmesi için bir önyükleme için bir permütasyon testi tercih edilebilir.


4

IMHO Likert terazileri için t testi kullanamazsınız. Likert ölçeği sıralıdır ve sadece bir değişkenin değerlerinin ilişkilerini “bilir”: örneğin “tamamen memnuniyetsiz” “bir şekilde memnuniyetsiz” den daha kötüdür. Öte yandan bir t-testi, araçları ve daha fazlasını hesaplamak zorundadır ve bu nedenle aralık verisine ihtiyaç duymaktadır. Likert skalası puanlarını aralık verilerine eşleştirebilirsiniz ("tamamen tatminsiz", 1'dir vb.) Ancak hiç kimse, "tamamen memnun olmayan" ın "bir şekilde memnuniyetsiz" ile "ne de" ne de "memnun" olduğu kadar aynı olduğunu garanti edemez. Bu arada: "tamamen tatminsiz" ile "bir şekilde memnuniyetsiz" arasındaki fark nedir? Sonunda, sıralı verilerinizin kodlanmış değerleri üzerinde bir t-testi yapardınız, ancak bu bir anlam ifade etmiyor.


9
... ve yine de yaygın olarak yapılır. Dikkat edilmesi gereken bir nokta ve evet, Likert ölçeği olmayan tek bir Likert tipi ürün kullanıyorsanız, bu biraz sersemleticidir. Aradaki fark anlamlıdır (soru soran bir Likert eşyası hakkında konuşsa ve sıralamanın bir konudur). Bir Likert ölçeği, birkaç Likert maddesinin toplanması veya ortalamalarının bir sonucudur. Bu yaklaşım, sıralı verilerin gerçekte ne derece sıralı olduğunu dengelemek ve aralık ölçeğinde ele almanın daha makul olmasını sağlamak için özel olarak geliştirilmiştir.
russellpierce

3

Ankette yer alan her madde sıralı ise ve "kesinlikle katılıyorum" ile "katılıyorum" arasındaki nicel farkın "ile aynı olup olmadığını bilmenin bir yolu olmadığı düşünüldüğünde, bu noktanın tartışılmayacağını düşünüyorum. kesinlikle katılmıyorum "ve" katılmıyorum ", öyleyse neden tüm bu sıralı seviye ölçeklerinin toplamı gerçek aralık seviyesi verilerinin özelliklerini paylaşan bir değer üretiyor?

Örneğin, bir depresyon envanterinin sonuçlarını yorumluyorsak, "20" puanına sahip bir insanın "2 puanına sahip bir insandan iki kat daha" depresyonda olduğunu söylemek mantıklı gelmez. 10" . Bunun nedeni, anketteki her maddenin depresyon seviyelerindeki gerçek farklılıkları ölçmemesi (depresyonun kararlı, içsel, organik bir hastalık olduğunu varsayarsak) değil, kişinin belli bir ifadeyle kabul ettiği öznel derecelendirme derecesini ölçmesidir. “Ne kadar moral bozucu ruh haliniz 1-4, 1 çok moralsiz ve 4 hiç moralsiz değilsiniz?” Diye sorulduğunda, bir katılımcının öznel notunun 1'in diğer bir cevaplayıcı ile aynı olduğunu nasıl bilebilirim? ? Veya 4 ile 3 arasındaki farkın kişi açısından 3 ile 4 ile aynı olup olmadığını nasıl bilebilirim? Şu anki depresyon seviyesi. Bunların hiçbirini bilemezsek, o zaman bu sıradan öğelerin toplamını aralık seviyesi verileri olarak ele almak mantıklı değil. Veriler normal bir dağılım oluştursa bile, puanlar arasındaki farkları, bir likert maddelerine verilen tüm yanıtları toplayarak hesaplanırsa, puanlar arası veriler olarak değerlendirmenin uygun olmadığını düşünüyorum. Verilerin normal bir dağılımı sadece cevapların muhtemelen toplayıcı popülasyonu temsil ettiği anlamına gelir; Stoklardan elde edilen değerlerin, aralık seviyesi verilerinin önemli özelliklerini paylaştığı anlamına gelmez. puanlar arasındaki farkları, tüm cevapları bir likert maddelerine ekleyerek hesapladılarsa, aralık düzeyinde veri olarak ele almanın uygun olacağını düşünmeyin. Verilerin normal bir dağılımı sadece cevapların muhtemelen toplayıcı popülasyonu temsil ettiği anlamına gelir; Stoklardan elde edilen değerlerin, aralık seviyesi verilerinin önemli özelliklerini paylaştığı anlamına gelmez. puanlar arasındaki farkları, tüm cevapları bir likert maddelerine ekleyerek hesapladılarsa, aralık düzeyinde veri olarak ele almanın uygun olacağını düşünmeyin. Verilerin normal bir dağılımı sadece cevapların muhtemelen toplayıcı popülasyonu temsil ettiği anlamına gelir; Stoklardan elde edilen değerlerin, aralık seviyesi verilerinin önemli özelliklerini paylaştığı anlamına gelmez.

Davranış bilimlerinde, üzerinde çalıştığımız gizli değişkenlerle konuşmak için istatistikleri nasıl kullandığımız konusunda dikkatli olmamız gerekir, çünkü bu varsayımsal yapıları ölçmenin doğrudan bir yolu olmadığı için, konuyu ölçmeye çalıştığımızda önemli problemler yaşanacaktır. parametrik testlere. Yine, basitçe bir cevap grubuna değer verdiğimiz için, bu değerler arasındaki farkların anlamlı olduğu anlamına gelmez.


1
Öğe puanlarının toplanmasından memnunsanız, şimdiden kesin olarak sıradan ölçüm seviyesinden daha fazlasını kabul ettiniz. Açıkçası, sıralı önlemler anlamlı bir şekilde eklenemez veya ortalaması alınamaz (bu arada, Stevens bunun hakkında açıktır). Bunu yaptıktan sonra, elde edilen puanları aralık seviyesi verileri olarak ele almak tamamen makul.
Gala,

0

Orantılı oran oranı modeli Likert madde skalası için t-testinden daha iyidir.


1
Sebeplerinizi açıklamak ister misiniz? Böyle bir modelin daha kesin bir gözlemlenen tepki modeli sağladığını görebiliyorum. Bununla birlikte, gördüğüm tipik pratik araştırma durumlarında, araştırmacılar iki grubun ortalama bakımından farklılık gösterip göstermediğiyle ilgileniyorlar (örneğin, eğitim grubu kontrolden daha yüksek performans rapor etti mi, bir sonraki yıla göre öğrenci memnuniyeti daha yüksekse) ). Oransal oran oranı modeli bu soruyu tam olarak bildiğim kadarıyla test etmiyor.
Jeromy Anglim

0

Bu bağlamda orantılı oran oranı modelini açıklamaya çalışacağım, çünkü bu soruya en az 2 cevap içinde önerilip belirtildi.

Oransal oran modelinin puan testi, Wilcoxon sıra toplamı testine eşdeğerdir.

Daha kesin olarak, orantılı bir sonuç için tek bir iki değişkenli değişkenin orantılı bir olasılıkta kümülatif lojistik regresyon modelinde (McCullagh 1980) etkisinin olmadığı için puan testi istatistiğinin Wilcoxon sıra toplamı test istatistiğine eşit olduğu gösterilmiştir. ( Karmaşık örnekleme anket verileri için Wilcoxon Rank-Sum testinin bir uzantısında kanıt .)

Wilcoxon rütbe toplamı testi gibi, bu test de beklenen değerlerden bağımsız olarak iki örneğin farklı dağılımlardan alındığını tespit eder.

Wilcoxon sıra toplamı testi gibi, sadece iki örneğin farklı beklenen değerlere sahip dağılımlardan iki örnek alınıp alınmadığını tespit etmek istiyorsanız bu test geçersizdir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.