Birden çok sıralı listeden genel sıralama


13

Şanssız ve bu forumun şu anda karşılaştığım istatistiksel bir soruna yardımcı olabileceğini umarak bu forumu da içeren birçok çevrimiçi literatüre baktım:

Her biri konum 1'den (en iyi) konum 10'a (en kötü) kadar sıralanmış 10 öğe içeren 5 sıralı veri listesi var. Bağlam uğruna, her listedeki 10 madde aynıdır, ancak sıralamalarına karar vermek için kullanılan teknik farklı sıralama düzenlerinde farklıdır.

Örnek veriler:

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

Yukarıdaki verileri yorumlamanın ve analiz etmenin bir yolunu arıyorum, böylece her teste ve konumuna göre her bir öğenin genel sıralamasını gösteren nihai bir sonuç elde edeceğim, örneğin

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

Şimdiye kadar bu bilgiyi Pearson Korelasyonu, Spearman Korelasyonu, Kendall Tau'nun B ve Friedman testlerini yaparak yorumlamaya çalıştım. Bununla birlikte, bu sonuçların genellikle listelerimi eşleştirdiğini (yani liste 1 ile liste 2, sonra liste 1 ile liste 3 .. vb.) Eşleştirdiklerini veya genel olarak Ki-Kare, P-Değerleri vb. veri.

Herkes bu verileri istatistiksel olarak sağlam bir yöntemle (lisansüstü / doktora uygulanabilir düzeyde) nasıl yorumlayabileceğimi biliyor mu? Ya da, başka bir teknik veya istatistiksel test varsa, bakabilirim, herhangi bir ipucu veya rehberliği takdir ediyorum.

(Ayrıca belirtmek gerekir ki, toplamlar, ortalama, minimum - maksimum testler vb. Gibi daha basit matematiksel teknikleri de uyguladım, ancak bunların bu seviyede istatistiksel olarak önemli olduğunu düşünmüyorum).

Herhangi bir yardım veya tavsiye büyük mutluluk duyacağız, zaman ayırdığınız için teşekkür ederiz.


1
Uygun şekilde yorumlanmış, yinelenen görünen (ve bu nedenle zaten cevaplar veren) iki soru buluyorum: stats.stackexchange.com/search?q=valuation+rank . Bunlar yeterli mi? Değilse, lütfen durumunuzla ilgili neyin özel olduğunu anlamamıza yardımcı olun.
whuber

Yanıtınız için teşekkürler. Bu makalelere bir göz attım ve aradığım şey olup olmadıklarından ya da benim hatamdaki anlayışımdan emin değilim. Bu makalelerde, her veri kümesinin farklı anlamların birçok değişkenine sahip olduğu ve sıralamaların farklı olabileceği veya yalnızca sıradan daha fazla tamsayı değerine sahip olabileceği izlenimini edindim. Sadece 'genel olarak en önemli madde X, ardından Y ... ve son olarak (veya en az önemli) Z maddesi' diyebilmenin istatistiksel olarak kanıtlanmış bir yolunu arıyorum. Neredeyse 1-10 sıralarını düz sayılar olarak analiz etmeyi düşünüyorum
Liam

1
Bu iş parçacıklarının önemli bir noktası, böyle bir "istatistiksel olarak kanıtlanmış yol" bulunmamasıdır. Bu bir değerleme meselesidir : sonuçlarınızın herhangi bir istatistiksel birleşimi, bunlar arasındaki ödünleşim duygusunu yansıtır. Örneğin , "nesneleriniz" arabalar olabilir ve "teknikler" onları çeşitli özelliklere göre sıralayabilir: maliyet, yakıt verimliliği, güç, konfor, vb. ikiniz de haklısınız.
whuber

cevabı aldın mı lütfen yorum bırakın burada stats.stackexchange.com/questions/347336/…
Ray Coder

Yanıtlar:


7

Neden korelasyonlara ve benzer önlemlere baktığınızdan emin değilim. İlişkilendirilecek bir şey yok gibi görünüyor.

Bunun yerine, bir dizi seçenek var, hiçbiri diğerinden daha iyi değil, ancak ne istediğinize bağlı olarak:

Ortalama sıralamayı alın ve sonra ortalamaları sıralayın (ancak bu, verileri aralık olarak ele alır)

Medyan rütbesini al ve sonra medyanları rütbe et (ama bu bağlarla sonuçlanabilir)

Her öğenin aldığı 1. oy sayısını alın ve bunları buna göre sıralayın

Sayısını al son yer oyu ve sıralamak (ters açıkçası) buna dayanarak.

Makul olduğunu düşündüğünüz şeye bağlı olarak, ağırlıklı bir sıralama kombinasyonu oluşturun.


4
Bir yorumda atıfta bulunduğum konularda yapılan önemli bir nokta - ve bu da tüm sorunun en önemli noktası olduğunu düşünüyorum - tüm bu yöntemlerin keyfi olmasıdır . Nesnel yöntemler vardır ancak verilere özgü olmayan bilgilerin kullanılmasını gerektirirler. Bunu istatistiklerden ziyade bir değerleme problemi yapan da budur .
whuber

Hangi ağırlıklı rütbe kombinasyonunu önerirsiniz?
Archie

4

Diğerlerinin de belirttiği gibi, takip edebileceğiniz birçok seçenek var. Önerdiğim yöntem ortalama sıralara, yani Peter'ın ilk teklifine dayanıyor.

Bu durumda, son sıralamanın istatistiksel önemi iki aşamalı bir istatistiksel test ile incelenebilir. Bu, ilgili post-hoc test ile Friedman testinden , Nemenyi testinden oluşan parametrik olmayan bir prosedürdür . Her ikisi de ortalama rütbelere dayanmaktadır. Friedman testin amacı hipotezini reddetmek ve orada sonucuna etmektir olan öğeler arasında bazı farklılıklar. Öyleyse, hangi öğelerin gerçekten farklı olduğunu bulmak için Nemenyi testine devam ediyoruz. (Tesadüfen bulunan önemden kaçınmak için post-hoc test ile doğrudan başlamıyoruz.)

Her iki test için de kritik değerler gibi daha fazla ayrıntı makalede Demsar tarafından bulunabilir .


2

Tau-x kullanın (burada "x", "uzatılmış" Tau-b'yi ifade eder). Tau-x, Kemeny-Snell mesafe metriğinin korelasyon eşdeğeridir - bir mesafe metriğinin tüm gereksinimlerini karşılayan sıralı öğelerin listeleri arasındaki benzersiz mesafe metriği olduğu kanıtlanmıştır. Kemeny ve Snell tarafından yazılan "Sosyal Bilimlerde Matematiksel Modeller" bölüm 2'ye, ayrıca "Fikir birliği Sıralama Problemine Başvuruyla Yeni Bir Sıra Korelasyon Katsayısı, Edward Emond, David Mason, Çok Kriterli Karar Analizi Dergisi, 11: 17- 28 (2002).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.