Sıralanan listelerin karşılaştırılması


15

Diyelim ki ve içeren iki grup, her biri en önemlisi en önemlisi 25 maddeden oluşur. Bu sıralamaları karşılaştırmanın en iyi yolları nelerdir?n 2n1n2

Açıkçası, 25 Mann-Whitney U testi yapmak mümkündür, ancak bu, çok fazla olabilen (ve sıkı kullanımda, çoklu karşılaştırma soruları ortaya çıkarır) yorumlanması için 25 test sonucuyla sonuçlanır. Ayrıca, bu testin tüm varsayımlarını karşıladığı da tam olarak açık değil.

Ayrıca derecelendirme ve sıralama hakkında literatüre işaret etmekle de ilgilenirim.

Bazı bağlamlar: Bu 25 maddenin hepsi eğitim ile ilgilidir ve iki grup farklı tipte eğitimcilerdir. Her iki grup da küçük.

@Ttnphns'a yanıt olarak DÜZENLE:

Grup 1'deki öğelerin toplam sıralamasını grup 2 ile karşılaştırmak istemedim - @ttnphns'ın belirttiği gibi bu sabit olacaktır. Ancak grup 1 ve grup 2'deki sıralamalar farklı olacaktır; yani grup 1, madde 1'i grup 2'den daha yüksek sıralayabilir.

Onları, öğeye göre, her bir öğenin ortalama veya medyan rütbesini alıp 25 test yaparak karşılaştırabilirim, ancak bunu yapmanın daha iyi bir yolu olup olmadığını merak ettim.


1
Her bir kişi 25 değişken içindeki toplamdan 25 madde sıraladıysa sabittir (325). Buna göre, ne demek istiyorsun the best ways to compare these rankings- 2 grubun ne tür bir fark olduğunu bilmek isterdiniz?
ttnphns

2
Belki de her grup için Kemeny medyanını hesaplamak için? Kendim yapmadım ve 2 sonucun istatistiksel olarak karşılaştırılıp karşılaştırılamayacağını (yani popülasyonu çıkartarak) bilmiyorum.
ttnphns

1
Başka bir seçenek tekrarlanabilir ordinal regresyonu ölçer (burada grup faktörü ve rm faktörü arasındaki etkileşim interes olacaktır); bu, çok terimli dağıtım ve logit bağlantılı GEE modeli ile yapılabilir. Ancak, yine, 25 madde arasındaki toplam sabit olduğu için, şimdi matematiksel olarak geçerli olup olmadığını söyleyemem.
ttnphns

2
Benim üzerimde kitap yok, ancak D Hand'in "Ölçüm Teorisi ve Uygulaması" buna benzer bazı konuları tartışıyor. Özellikle sıralamadaki "fark" hakkında ne bilmek istersiniz. Örneğin, önce her grup için bir toplu sıralama oluşturamaz ve sonra sıralama korelasyonunu ele alamaz mısınız?
Corone

2
@PeterFlom Sonunda sıralama karşılaştırması için bir çözüm buldunuz mu? Cevabınız evet ise, yayınlamak ister misiniz? :)
Mark Heckmann

Yanıtlar:


6

özet

Düşüncelerimi Ayrıntılar bölümünde paylaşıyorum . Bence gerçekten neyi başarmak istediğimizi belirlemede faydalılar.

Sanırım buradaki asıl sorun, rütbe benzerliğinin ne anlama geldiğini tanımlamamanız. Bu nedenle, hiç kimse sıralar arasındaki farkı ölçmenin daha iyi olduğunu bilmiyor.

Etkili bir şekilde, bu, tahminlere dayanan bir yöntemi belirsiz bir şekilde seçmemize izin verir.

Gerçekten önerdiğim ilk önce bir matematiksel optimizasyon hedefi tanımlamak. Ancak o zaman ne istediğimizi gerçekten bilip bilmediğimizden emin olacağız.

Bunu yapmazsak, gerçekten ne istediğimizi bilmiyoruz. Biz olabilir neredeyse ne istediğimizi biliyoruz ama neredeyse bilerek bilerek .

Ayrıntılar bölümündeki metnim, temelde benzerliğin matematiksel bir tanımına ulaşma yolunda atılan bir adımdır . Bunu çivilediğimizde, bu benzerliği ölçmek için en iyi yöntemi seçmek için güvenle ilerleyebiliriz.

ayrıntılar

Yur yorumlarından birine dayanarak:

  • " Amaç iki grup sıralamasının farklı olup olmadığını görmek " Peter Flom.

Hedefi kesin olarak yorumlarken buna cevap vermek için:

  • Sıralarında, herhangi bir madde, farklı olan vardır, bu şekilde , burada ürünün sıralamasıdır grubu ile ve olan aynı öğenin sıralamasına göre grup .i a ib i a i i a b i bi{1,2,,25}iaibiaiiabib
  • Aksi halde, rütbeler farklı değildir.

Ama bu katı yorumu gerçekten istediğini sanmıyorum . Bu nedenle, gerçekten söylemek istediğiniz şey:

  • ve gruplarının dereceleri ne kadar farklıdır ?bab

Buradaki çözümlerden biri, minimum düzenleme mesafesini ölçmektir . Gerek grubunun sıralanmış listesinde yapılacak bu düzenlemelerin en az sayıda nelerdir Yani o grup özdeş hale öyle ki .bab

Bir düzenleme iki öğenin değiştirilmesi olarak tanımlanabilir ve kaç şerbet gerektiğine bağlı olarak maliyeti puandır. Dolayısıyla, öğenin öğeyle değiştirilmesi gerekiyorsa ( ve gruplarının özdeş sıralarını elde etmek için ), bu düzenleme için maliyet .1 3 a b 3n13ab3

Ancak bu yöntem uygun mu? Bunu cevaplamak için biraz daha derinlemesine bakalım:

  • Normalleştirilmiş değil. Gruplara safları arasındaki mesafe dersek bir grupları saflarına arasındaki mesafe ise, bir , mutlaka anlamına gelmez kadar birbirinden benzer olan ( nin çok daha büyük bir öğe kümesini sıraladığı anlamına da gelebilir ).3 c , d 123 a , b c , d c , da,b3c,d123a,bc,dc,d

  • Her bir düzenlemenin maliyetinin , atlama sayısına göre doğrusal olduğunu varsayar . Bu, uygulama alanımız için doğru mu? Bir o olabilir lojistik ilişki daha uygundur? Yoksa üstel olan mı?

  • Tüm öğelerin eşit derecede önemli olduğunu varsayar. Örneğin, madde (diyelim) sıralamasındaki anlaşmazlık, madde (dn) sıralamasındaki anlaşmazlık ile aynı muamele görür . Alan adınız için bu doğru mu? Örneğin, kitapları sıralıyorsak, TAOCP gibi ünlü bir kitabın sıralamasına katılmıyorum, TAOUP gibi korkunç bir kitabın sıralamasına katılmama konusunda eşit derecede önemli mi?515

Yukarıdaki noktalara değindiğimizde ve iki rütbe arasında uygun bir benzerlik ölçüsüne ulaştığımızda, aşağıdaki gibi daha ilginç sorular sormamız gerekecek:

  • ve grupları arasındaki fark sadece rastgele şanstan kaynaklanıyorsa , bu tür farklılıkları veya daha aşırı farklılıkları gözlemleme olasılığı nedir ?bab

5

Bu 'Willcoxon işaretli sıra testi' ( wikipedia bağlantısı ) gibi geliyor. Rütbelerinizin değerlerinin aynı kümeden (yani [1, 25]) olduğu varsayılarak, bu bir eşleştirilmiş fark testidir (sıfır hipotezi bu çiftlerin rastgele seçilmesiyle). Not: Bu bir dis-benzerlik skorudur!

Hem vardır Rve Pythonbu wiki sayfasında bağlantılı uygulamalar.


İlginç. Eşli bir Wilcoxon farkı duymamıştım.
Peter Flom - Monica'yı eski durumuna döndürün

4

Uyarı: Bu harika bir soru ve cevabını bilmiyorum, bu yüzden bu daha çok "yapmam gerekirse ne yapardım":

Bu problemde, bir çok serbestlik derecesi ve yapılabilecek çok sayıda karşılaştırma vardır, ancak sınırlı verilerle bu, verileri verimli bir şekilde birleştirme meselesidir. Hangi testin çalıştırılacağını bilmiyorsanız, permütasyonları kullanarak her zaman bir tane "icat edebilirsiniz":

İlk önce iki işlevi tanımlarız:

  • Oylama işlevi : sıralamaları nasıl puanlayacağımız, böylece tek bir grubun tüm sıralarını birleştirebilelim. Örneğin, en üst sırada yer alan öğeye 1 puan ve diğerlerine 0 atayabilirsiniz. Yine de çok fazla bilgi kaybediyor olabilirsiniz, bu yüzden belki de böyle bir şey kullanmak daha iyidir: üst sıradaki öğe 1 puan, ikinci sıra 2 puan vb.

  • Karşılaştırma fonksiyonu : İki grup arasındaki iki toplam puanın karşılaştırılması. Her ikisi de bir vektör olacağından, farkın uygun bir normunu almak işe yarayacaktır.

Şimdi aşağıdakileri yapın:

  1. İlk önce iki gruptaki her bir öğe için oylama işlevini kullanarak ortalama puanı hesaplayarak bir test istatistiği hesaplayın, bu 25 büyüklüğünde iki vektöre yol açmalıdır.
  2. Sonra karşılaştırma işlevini kullanarak iki sonucu karşılaştırın, bu sizin test istatistiği olacaktır.

Sorun şu ki, test istatistiğinin her iki grubun aynı olduğu null altında dağılımını bilmiyoruz. Fakat eğer aynıysa, gruplar arasındaki gözlemleri rastgele karıştırabiliriz.

Bu nedenle, iki grubun verilerini birleştirebiliriz, karıştırır / izin , grup A ve geri kalan grup B için ilk (orijinal grup A'daki gözlem sayısı) gözlemlerini seçebiliriz . Şimdi bu örnek için test istatistiğini iki adımdan önce.n1

İşlemi yaklaşık 1000 kez tekrarlayın ve şimdi permütasyon testi istatistiklerini ampirik null dağılım olarak kullanın. Bu, bir p değeri hesaplamanıza izin verir ve güzel bir histogram oluşturmayı ve test istatistikleriniz için bir çizgi çizmeyi unutmayın:

histogram permütasyon testi l1

Şimdi elbette, iyi bir güç elde etmek için doğru oylama ve karşılaştırma işlevlerini seçmekle ilgilidir. Bu gerçekten hedefinize ve bağlıdır, ancak oylama işlevi ve normu için ikinci başlamak için iyi yerler olduğunu düşünüyorum. Bu seçeneklerin büyük bir fark yaratabileceğini ve yapabileceğini unutmayın. Yukarıdaki grafik normu kullanıyordu ve bu bir normuyla aynı verilerdi :l 1 l 2l1l1l2

histogram permütasyon testi l2

Ancak ayara bağlı olarak, çok fazla içsel rastgelelik olabileceğini ve tümünü yakalama yönteminin çalışması için oldukça büyük bir örnek boyutuna ihtiyacınız olacağını umuyorum. İki grup arasında farklı olabileceğini düşündüğünüz belirli şeyler hakkında önceden bilginiz varsa (belirli öğeleri söyleyin), bunu iki işlevinizi uyarlamak için kullanın. (Elbette , testi yapmadan önce bunu yapın ve önemli bir şey alana kadar tasarımları kiraz seçmeyin)

PS (dağınık) kodumla ilgileniyorsanız bana bir mesaj gönderin. Buraya eklemek için biraz uzun ama yüklemekten memnuniyet duyarım.


Bu fikri gerçekten seviyorum.
Peter Flom - Monica'yı eski durumuna döndürün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.