Sıra korelasyon katsayısı bağlamında bağlı veriler nedir?


16

İstatistik alanında değilim.

Rank Korelasyon Katsayıları hakkında okurken "bağlı veri" kelimesini gördüm.

  • Bağlı veriler nedir?
  • Bağlı verilere örnek nedir?

Yanıtlar:


5

Aynı değere sahip veriler anlamına gelir; örneğin, veri kümesi olarak 1,2,3,3,4'ünüz varsa, iki 3 veri bağlanır. Veri kümesi olarak 1,2,3,4,5,5,5,6,7,7'ye sahipseniz, 5'ler ve 7'ler bağlı verilerdir.


14

"Bağlı veriler", sıra tabanlı parametrik olmayan istatistiksel testler bağlamında ortaya çıkar.

Parametrik olmayan testler : Belirli bir olasılık dağılımını varsaymayan testler , örneğin çan şeklinde bir eğri varsaymaz.

sıra tabanlı : büyük bir parametrik olmayan test sınıfı, sayıları (ör. "3 gün", "5 gün" ve "4 gün") sıralara (örn. "en kısa süre (3.)", "en uzun süre dönüştürerek başlar (1.) "," ikinci en uzun süre (2.) "). Daha sonra bu derecelere geleneksel bir parametrik test yöntemi uygulanır.

Bağlı veriler bir sorundur, çünkü özdeş olan sayıların sıralamaya dönüştürülmesi gerekir. Bazen rütbeler rastgele atanır, bazen ortalama bir rütbe kullanılır. En önemlisi, sonucun tekrarlanabilirliği için bağlı dereceleri kırmak için bir protokol açıklanmalıdır.


5

Aynı veri kümesinde 7'yi iki kez gözlemlemek gibi iki özdeş veri değeri.

Bu, verilerin sürekli olduğunu ve dolayısıyla aynı ölçümlerin imkansız olduğunu (veya teknik olarak olasılık aynı değerlerin sıfır olduğunu) varsatan istatistiksel yöntemler bağlamında ortaya çıkar. Pratik yöntemler, bu yöntemler yuvarlatılmış veya kırpılmış verilere uygulandığında ortaya çıkar, böylece özdeş ölçümler sadece mümkün değil, aynı zamanda oldukça yaygındır.


1
Bu muhakemeye katılmıyorum çünkü sıfır olasılığından dolayı bu olayın asla gerçekleşemeyeceğini söyleyemezsiniz. Bu iyi bir gerekçe değil.
Henry.L

2

Soru temel öneme sahiptir:

Bağlı gözlem / veri / çift nedir?

T+

(Bu yüzden @ Ming-Chih Kao'nun cevabının önce parametrik olmayan testler sunarak doğru olduğunu düşünmüyorum. Ama başlık 'Sıra korelasyon katsayısı bağlamında bağlı veriler nedir?' Olduğu için satın alacağım.)

Zi=XiYi

(Xi,Yi)

Zi

Zi

|Zi|

{(1,1)(1,1)},{(1,2)(1,2)(2,1)(2,1)(2,3)(2,3)(3,2)},{(3,0)}

Bunu yapmanın çok kolay yolunu deneyelim, soldan sağa doğru sıralıyoruz ve veriyoruz:

Ri

|Zi|

Ri

|Zi|

Ri

|Zi|=1|Zi|=2

1++77=48+92=8.5

Ri

Bu sıralamaları değiştirdi ve bağlı gözlemlerin her birinin sıralanan istatistikleri, dolayısıyla sıra testini hesaplamada aynı etkiye sahip olmasını sağlayın.

Bağlı gözlem / veri / çiftin çözümleri nelerdir?

(1) Ortalama sıralamayı atayın. Yukarıda yaptığımız şey bu. Aynı gruptaki bağlı verilere aynı rütbeyi atayarak, sıralama testindeki etkilerini aynı yaparız ve bu nedenle bağlı gözlemlerin neden olduğu olası yanlışlıkları ortadan kaldırırız.

(2) Rastgele rütbe atayın. Bağlı grup öğelerinin her birine rasgele sıralar atamanız yeterlidir. Tek kısıtlamaMbirxR,birnkfbenrstgrÖup<MbennR,birnksecÖndgrÖup çünkü eğer MbirxR,birnkfbenrstgrÖup>MbennR,birnksecÖndgrÖup, bu sıralama yasasını ihlal eder; EğerMbirxR,birnkfbenrstgrÖup=MbennR,birnksecÖndgrÖupsonra iki bağlı grubu bir araya getirmeliyiz.

(3)Perturbation of data. This requires very careful consideration about the nature of the data. This works only if the data is not categorical(discrete). In the above example, we can just make a This will put different weights manually to each of the elements in the tied group. For a continuous distribution, for example, it makes little difference if you perturb it in ϵ manner.

(@John D. Cook 's answer is a bit misleading in this way. A better way of saying this point is that when the distribution is continuous, PX=x=0. However, we shall observe ties since our measurement is of limited accuracy, i.e. any sample space in reality is actually finite.) (@quarkdown27 's answer is simple but correct in each word.)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.