Önyargılı olduğunu gösterebilirim (sanırım), ama nedenini açıklayamam. Birisinin cevabımı görmesini ve daha fazla açıklamasına yardımcı olmasını umuyorum.
Birçok meta-analizde ve yayınladığınız görüntüde olduğu gibi, birçok kişi BESD'yi şu şekilde yorumlar: Her iki değişkeni de medyanlayacak olursanız, insanları belirli bir yüzde 2 x 2 olasılık tablosunun "sağ" hücrelerine doğru bir şekilde koyarsınız. zaman.
Yani , insanlar diyebilir, "Bu gözlemlenen göz önüne alındığında , bunu şöyle düşünebilirsiniz: X'deki medyanın üzerindeki insanlar da zamanın% 70'inde medyanın üzerinde olacaktır. " Kraus'un (1995, s. 69) bunu nasıl yorumladığı (bir değişkenin gerçekten ikiye ayrıldığı, diğerinin medyan bölünmesi olduğu varsayımsal bir duruma güvenir):r0,50 + r / 2 = 0,70r
İnsanlar sıklıkla tıbbi metaforları da kullanmaktadırlar: "Bu , kontrol ve deneysel durumdaki insanlar arasındaki yüzde 40'lık bir farka karşılık gelir."r
Ortanca bölünmüş esque yorumunun taraflı olup olmadığını görmek için, gerçek popülasyon olan 1.000.000 vakadan oluşan bir popülasyonu simüle ettim . Daha sonra bu popülasyondan 100 kişi çizdim, BESD "doğru oranını" (yani ) hesapladım ve sonra 2 x 2 beklenmedik tablo için gerçek medyan bölünmüş hücreleri, yukarıda kategorize etmek için tarif edilen gibi hesapladım. insanlar "doğru." Bunu 10.000 kez yaptım..50 + r / 2r = .38.50+r/2
Daha sonra, bu 10.000 uzunluktaki vektörlerin her birinin ortalama ve standart sapmasını aldım. Kod:
library(MASS)
# set population params
mu <- rep(0,2)
Sigma <- matrix(.38, nrow=2, ncol=2) + diag(2)*.62
# set seed
set.seed(1839)
# generate population
pop <- as.data.frame(mvrnorm(n=1000000, mu=mu, Sigma=Sigma))
# initialize vectors
besd_correct <- c()
actual_correct <- c()
# actually break up raw data by median split, see how it works
for (i in 1:10000) {
samp <- pop[sample(1:1000000, 100),]
besd_correct[i] <- round(100*(.50 + cor(samp)[1,2]/2),0)
samp$V1_split <- ifelse(samp$V1 > median(samp$V1), 1, 0)
samp$V2_split <- ifelse(samp$V2 > median(samp$V2), 1, 0)
actual_correct[i] <- with(samp, table(V1_split==V2_split))[[2]]
}
# cells for BESD
mean(besd_correct)
100 - mean(besd_correct)
# cells for actual 2 x 2 table with median split
mean(actual_correct)
100 - mean(actual_correct)
BESD dayanarak, bu tabloyu, nereden v1
ve v2
değişkenleri ifade ve low
ve high
aşağıda sırasıyla ortanca, yukarıda atıfta:
+---------+--------+---------+
| | v2 low | v2 high |
+---------+--------+---------+
| v1 low | 69 | 31 |
+---------+--------+---------+
| v1 high | 31 | 69 |
+---------+--------+---------+
Aslında ham verilerle medyan bir bölünme yapmaya dayanarak, bu tabloyu elde ederiz:
+---------+--------+---------+
| | v2 low | v2 high |
+---------+--------+---------+
| v1 low | 62 | 38 |
+---------+--------+---------+
| v1 high | 38 | 62 |
+---------+--------+---------+
Birisi, BESD kullanarak, "kontrol ve deneysel olarak yüzde 38 puan farkı" olduğunu iddia edebilirken, gerçek medyan bölünme 24'te bu sayıya sahiptir.
Bunun neden olduğundan emin değilim ya da örneklem büyüklüğüne ve korelasyonuna bağlıysa (kolayca anlamak için daha fazla simülasyon yapabilir), bence bu önyargılı. Birisinin hesaplama yerine matematiksel bir açıklamaya girip giremeyeceğini çok isterim.