Bunu ayrımcılık davalarıyla ilgili deneyimlerden tersine mühendislik yapacağım. "741'de bir" vb . Değerlerin nereden geldiğini kesinlikle belirleyebilirim . Ancak, çeviri sırasında o kadar çok bilgi kayboldu ki, yeniden yapılanmamın geri kalanı insanların mahkeme salonu ortamlarında nasıl istatistik yaptığını görmeye dayanıyor. Sadece bazı ayrıntıları tahmin edebilirim.
Ayrımcılıkla mücadele yasalarının 1960'larda (Başlık VI) geçtiği zamandan beri, ABD'deki mahkemeler p değerlerine bakmayı ve bunları ve eşikleriyle karşılaştırmayı öğrendiler . Ayrıca, tipik olarak "standart sapmalar" olarak adlandırılan standart etkilere bakmayı ve bunları "iki ila üç standart sapma" eşiği ile karşılaştırmayı da öğrendiler. Bir kurmak için ilk bakışta bir ayrımcılık takım için durum davacılar genellikle bu eşikleri aşan bir "yıkıcı etkisi" gösteren bir istatistiksel hesaplama girişimi. Böyle bir hesaplama desteklenemiyorsa, vaka genellikle ilerleyemez.0.050.01
Davacılar için istatistik uzmanları genellikle sonuçlarını bu tanıdık terimlerle ifade etmeye çalışırlar. Bazı uzmanlar, sıfır kararın "olumsuz etki" göstermediği, istihdam kararlarının tamamen rastgele ve çalışanların diğer özellikleri tarafından yönetilmediğini varsayarak istatistiksel bir test yürütmektedir. (İster tek kuyruklu ister iki kuyruklu bir alternatif olsun, uzman ve koşullara bağlı olabilir.) Daha sonra bu testin p değerini standart Normal dağılımına başvurarak bir dizi "standart sapmaya" dönüştürür. - standart Normal, orijinal testle ilgisiz olsa bile. Bu dolambaçlı yoldan, sonuçlarını yargıya açık bir şekilde iletmeyi umuyorlar.
Beklenmedik durum tablolarında özetlenebilecek veriler için tercih edilen test, Fisher's Exact Testidir. Adında "Tam" ın ortaya çıkması davacıları özellikle sevindiricidir, çünkü hatasız (ne olursa olsun!) Yapılan istatistiksel bir belirlemeyi ifade eder .
İşte burada, Çalışma Bakanlığı'nın hesaplamalarının benim (spekülatif rekonstrüksiyonu).
Fisher'ın Kesin Testi'ni ya da onun gibi bir şeyi çalıştırdılar ( randomizasyon yoluyla belirlenen p değerine sahip bir testi gibi). Bu test, Matthew Gunn'ın cevabında tarif edildiği gibi hipergeometrik bir dağılım olduğunu varsayar. (Bu şikayete katılan az sayıda insan için hipergeometrik dağılım, Normal dağılım ile iyi bir şekilde yakın değildir.)χ2
P değerini normal Z skoruna ("standart sapma sayısı") dönüştürdüler.
Bunlar yuvarlak , beş standart sapmaları aşıyor " " üç standart sapmaları aşıyor"" ve "altı standart sapmaları aşıyor": en yakın tam sayıya Z skoru. (Bu Z-skorları bazı yuvarlak Çünkü up daha fazla standart sapmalar, ben "aşıyor" haklı olamaz; Tek yapabileceğim bunu alıntı budur.)
Şikayette bu integral Z skorları tekrar p değerlerine dönüştürüldü! Yine standart Normal dağılım kullanıldı.
Bu p-değerleri (muhtemelen yanıltıcı bir şekilde) “bu sonucun şansa göre meydana gelme olasılığı” olarak tanımlanmaktadır.
Bu spekülasyonu desteklemek için, üç örnekte Fisher's Exact Test'in p değerlerinin yaklaşık , ve . Bu varsayarak havuzları dayanmaktadır , ve "daha" karşılık gelen , ve , sırasıyla. Bu sayılar Z = , ve normal puanlarına sahiptir, ki bunlar yuvarlandığında üç, beş ve altı standart sapmadır, tam olarak şikayette görülür. (tek kuyruklu) normal p değerlerine karşılık1 / 12801 / 5650001 / 5800000073011601307301160130−3.16−4.64−5.521/741, ve : tam olarak şikayette belirtilen değerler.1/35000001/1000000000
İşte R
bu hesaplamaları yapmak için kullanılan bazı kod.
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))