Sıra verileri için kullanılacak iyi temel istatistikler nelerdir?


67

Anket sorularından elde ettiğim sıradan veriler var . Benim durumumda bunlar Likert tarzı tepkilerdir (Kesinlikle Katılmıyorum-Katılmıyorum-Nötr-Katılıyorum-Kesinlikle Katılıyorum). Verilerimde 1-5 olarak kodlandılar.

Buradaki anlamın çok anlamlı olacağını sanmıyorum, bu yüzden hangi temel özet istatistiklerin faydalı olduğu düşünülüyor?


2
Ortak seçimler şunlardır - her gruptaki medyanlar, modlar, oranlar veya kümülatif oranlar
Glen_b

Yanıtlar:


29

Frekans tablosu başlamak için iyi bir yerdir. Her seviye için sayımı ve göreceli sıklığı yapabilirsiniz. Ayrıca, toplam sayı ve eksik değerlerin sayısı kullanımda olabilir.

Aynı anda iki değişkeni karşılaştırmak için bir beklenmedik durum tablosu da kullanabilirsiniz. Mozaik arsa kullanarak da gösterebilir.


32

Uygulamalı bir bakış açısıyla, ortalamanın genellikle bir Likert öğesinin merkezi eğilimini özetlemek için en iyi seçenek olduğunu iddia edeceğim. Özellikle, öğrenci memnuniyeti anketleri, pazar araştırması ölçekleri, çalışan görüş anketleri, kişilik test maddeleri ve birçok sosyal bilimler anketi gibi bağlamları düşünüyorum.

Bu gibi bağlamlarda, araştırma tüketicileri genellikle aşağıdaki gibi sorulara cevap ister:

  • Hangi ifadelerin diğerlerine göre az ya da çok mutabakatı var?
  • Hangi gruplar daha fazla ya da daha az, belirli bir açıklama ile anlaştı?
  • Zamanla, anlaşma aşağı veya yukarı gitti mi?

Bu amaçlar için, ortalamanın birçok faydası vardır:

1. Ortalama hesaplamak kolaydır:

  • Ham veriler ve ortalama arasındaki ilişkiyi görmek kolaydır.
  • Pragmatik hesaplanması kolaydır. Böylece, ortalama raporlama sistemlerine kolayca yerleştirilebilir.
  • Aynı zamanda bağlamlar ve ayarlar arasında karşılaştırılabilirliği kolaylaştırır.

2. Ortalama nispeten iyi anlaşılmış ve sezgiseldir:

  • Ortalama genellikle Likert öğelerinin merkezi eğilimini bildirmek için kullanılır. Bu nedenle, araştırma tüketicilerinin ortalamayı anlama olasılıkları daha yüksektir (ve böylece ona güvenerek hareket et).
  • Bazı araştırmacılar, belki de 4 veya 5'e cevap veren numunenin yüzdesini rapor etme konusunda daha sezgisel bir seçeneği tercih ediyorlar. Özünde, 0, 0, 0, 1, 1kodlama ile, bu sadece ortalamanın alternatif bir şeklidir .
  • Ayrıca, zaman içinde, araştırma tüketicileri referans çerçeveleri oluştururlar. Örneğin, öğretim performansınızı yıldan yıla veya denekler arasında karşılaştırırken, ortalama 3,7, 3,9 veya 4,1'in ne anlama geldiğine dair nüanslı bir anlayış geliştirirsiniz.

3. Ortalama tek bir sayıdır:

  • Tek bir sayı özellikle “öğrenciler X dersinden Y konusundan daha memnun kaldılar” gibi hak iddia etmek istediğinizde özellikle değerlidir.
  • Ayrıca, ampirik olarak, tek bir sayının aslında bir Likert maddesindeki ana ilgi alanı bilgisi olduğunu tespit ediyorum. Standart sapma, ortalamanın merkezi puana ne kadar yakın olduğu ile ilgili olma eğilimindedir (örneğin, 3.0). Tabii ki, ampirik olarak, bu sizin bağlamınızda geçerli olmayabilir. Örneğin, bir yerde You Tube dereceleri yıldız sistemine sahip olduğunda, en düşük veya en yüksek derecenin çok sayıda olduğunu okudum. Bu nedenle, kategori frekanslarını incelemek önemlidir.

4. Çok fazla farketmez

  • Resmi olarak test etmemiş olmama rağmen, öğeler arasında, katılımcı gruplarında veya zaman içinde merkezi eğilim derecelendirmelerini karşılaştırmak amacıyla, zaman içinde ortalamanın oluşturulması için herhangi bir makul ölçeklendirme seçiminin benzer sonuçlar vereceğini varsaymak isterim.

4
Güzel mesaj! Farklı kültürlerin / ülkelerin bu tür sonuçları önemli ölçüde etkileyebilecek likert ölçeklerini nasıl kullanabileceği hakkında bir fikriniz var mı?
Chase

@chase Bu konuda bir araştırma var, ancak araştırmaya başladığımdan bu yana bir süre geçti. İşte Google alimi ile ilgili bir örnek arama scholar.google.com.au/…
Jeromy Anglim

Bay Jeromy Anglim'in ortalamanın (yani ağırlıklı olmak üzere ağırlıklı ortalama) kullanımına ilişkin gerekçelerine , veri noktalarının her birinin katkısı olan Likert skalasının kullanımı gibi, sipariş edilen kategorik değişkenlerin en güvenilir tarafsız ve daha açıklayıcı yorumlanması olarak katılıyorum . son ortalama.


28

Temel özetler için, sıklık tablolarının rapor edilmesinin ve merkezi eğilim hakkındaki bazı belirtilerin iyi olduğuna katılıyorum. Çıkarım için, PARE'de basılan son bir makale t-vs. MWW-testi, Beş Noktalı Likert Öğeleri: t-versus-Mann-Whitney-Wilcoxon'u tartıştı .

Daha ayrıntılı tedavi için, Agresti'nin sipariş edilen kategorik değişkenler hakkındaki incelemesini okumanızı tavsiye ederim:

Liu, Y ve Agresti, A (2005). Sıralı kategorik verilerin analizi: Genel bir bakış ve son gelişmelerin bir incelemesi . Sociedad de Estadística e Investigacón Operativa Test , 14 (1), 1-73.

Eşik temelli model gibi (örneğin orantılı olasılık oranı) normal istatistiklerin ötesine uzanır ve Agresti'nin CDA kitabının yerine okunmaya değerdir .

Aşağıda, bir Likert öğesini ele almanın üç farklı yolunun bir resmini gösteriyorum; üstten alta, "frekans" (nominal) görünüm, "sayısal" görünüm ve "olasılık" görünümü ( Kısmi Kredi Modeli ):

alt metin

Veriler , teknolojinin ilgili olduğu (“Yeni teknoloji temel bilimsel araştırmaya bağlı değil”, cevabı dört puanlık bir ölçekte “kesinlikle katılmıyorum” cevabını Sciencetaşıyan) ltmpaket içindeki verilerden geliyor.


14

Geleneksel uygulama, sıralı verileri tanımlamak için parametrik olmayan istatistik rütbe toplamı ve ortalama rütbe kullanmaktır.

İşte nasıl çalışıyorlar:

Rütbe Toplamı

  • her gruptaki her üyeye bir rütbe atamak;

  • örneğin, iki rakip futbol takımındaki her oyuncu için hedefler aradığınızı varsayalım, sonra her bir üyeyi ilk önce en sondan önce her iki takımda da sıralayın ;

  • grup başına rütbe ekleyerek rütbe toplamını hesaplayın ;

  • rütbe toplamının büyüklüğü, rütbelerin her grup için birbirine ne kadar yakın olduğunu gösterir.

Ortalama Sıra

M / R, R / S'den daha karmaşık bir istatistiktir çünkü karşılaştırdığınız gruplardaki eşit olmayan boyutları telafi eder. Dolayısıyla, yukarıdaki adımlara ek olarak, her toplamı gruptaki üye sayısına bölersiniz.

Bu iki istatistiği elde ettikten sonra, örneğin, iki grup arasındaki farkın istatistiksel olarak anlamlı olup olmadığını görmek için rütbe toplamını z-testi yapabilirsiniz (sanırım , işlevsel olarak değiştirilebilir, yani Wilcoxon rütbe toplamı testi olarak bilinir. Mann-Whitney U testine eşdeğerdir).

R Bu istatistiklerin işlevleri (zaten bildiğimler):

standart R kurulumunda wilcox.test

meanranks içinde Cranks Paketi


3

Özete dayanarak Bu makale , Likert ölçeği olan bazı değişkenleri karşılaştırmak için faydalı olabilir. İki tür parametrik olmayan çoklu karşılaştırma testini karşılaştırır: Biri rütbelere dayalı, diğeri Chacko'nun testine dayalı. Simülasyonları içerir.


Şu anda, bu neredeyse bir yorum gibi görünüyor, @PeterFlom. ACM dijital kütüphanesi muhtemelen çürüme bağlantısına daha az duyarlı olmasına rağmen, belki de sağladığı yararlı bilgilerin bir özeti ile ilgili bir şey söyler misiniz?
gung - Reinstate Monica

2
Merhaba @gung Bu uzun konudaki yorumu nereye koyacağımdan emin değildim. Ben soru yayınlanmıştır bugün kapatıldı beri burada alıntı eklendi ve bu makalede yararlı görünmektedir (ve başka bir yerde görmedim sorunları kapsar)
Peter Flom

2

Genellikle Mosaic komployu kullanmayı severim. Bunları, ilgilenilen diğer ortak değişkenleri destekleyerek oluşturabilirsiniz (örneğin: seks, tabakalı faktörler vb.).


2

Jeromy Anglim'in değerlendirmesine katılıyorum. Likert yanıtlarının tahmini olduğunu unutmayın - kararlı boyutlara sahip fiziksel bir nesneyi ölçmek için tamamen güvenilir bir cetvel kullanmıyorsunuz. Makul örneklem büyüklükleri kullanılırken ortalama güçlü bir ölçüdür.

İş ve ürün AR-GE'sinde ortalama, Likert ölçeklerinde kullanılan en yaygın istatistiktir. Likert ölçeklerini kullanırken, genellikle araştırma sorusuna en uygun olan ölçüyü seçtim. Örneğin, “tercih” veya “tutumlar” hakkında konuşuyorsanız, her bir göstergenin biraz farklı bir bakış açısı sağlamasıyla birden fazla Likert tabanlı gösterge kullanabilirsiniz.

Sorusunu değerlendirmek "nasıl segmentinde insanlar olacaktır sunan hizmet tepki (2) tam medyan, (3) yüzdesi en uygun yanıt (top box), (4),% I (1) aritmetik ortalama bakabilir," ilk iki kutu, (5) ilk iki kutunun alt iki kutuya oranı, (6) orta menzilli kutular içindeki yüzde ... vb. Her bir ölçü hikayenin farklı bir bölümünü anlatır. Çok kritik bir projede birden fazla Likert tabanlı gösterge kullanıyorum. Ayrıca küçük örneklerle ve belirli bir çapraz sekme "ilginç" bir yapıya sahip olduğunda veya bilgi açısından zengin göründüğünde birden fazla gösterge kullanacağım. Ahhh ... istatistik sanatı.XiX


1

"Kutu puanları" genellikle sıradan verileri özetlemek için, özellikle anlamlı sözlü bağlantılarla geldiğinde kullanılır. Diğer bir deyişle, "ilk 2 kutu" yu, "katılıyorum" veya "kesinlikle katılıyorum" seçenini belirtebilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.