Kafamda, Pearson korelasyon katsayısının popülasyon değerinin iki tür tahmincisi hakkında bir kafa karışıklığı oldu.
A. Fisher, (1915) iki değişkenli normal popülasyon ampirik için gösterdi a, negatif eğimli tahmincisi p'ye eğilim, sadece küçük bir numune boyutu (pratikte önemli miktarda olmasına rağmen, n < 30 ). Numune r hafife p o daha yakın olduğu anlamında 0 den p'ye . (İkinci olduğunda hariç 0 ya da ± 1 daha sonra da, r önyargısızdır.) Çeşitli yaklaşık tarafsız tahmin arasında p'ye önerilmiştir, iyi bir olasılıkla olmakOlkin ve Pratt (1958) düzeltildi :
B. Bu regresyon gözlenen söylenir abartılı ilgili nüfus R-kare. Ya da, basit regresyon ile tam o r 2 abartılı p 2 . Gerçeğine dayanarak, söyleyerek birçok metinleri gördüm r olan olumlu göreli önyargılı için p mutlak değerini, yani: r uzak dan 0 den p'ye (? Bu doğru ifadedir). Metinler, standart sapma parametresinin örnek değeri ile aşırı tahmin edilmesiyle aynı problem olduğunu söylüyor. Gözlenen "ayarlamak" için birçok formüller vardır mevcut Ar 2yakın nüfus parametresine, kayık en (1931) en iyi bilinen (ama en iyi) olmak. Bu düzeltilmiş kök R 2 adj adlandırılır büzülmüş r :
İki farklı tahmin edicileri mevcut . Çok farklı: birincisi r , ikincisi r . Onları nasıl uzlaştırmak? Biri nerede kullanmalı / bildirmeli, diğeri mi?
Özellikle, bu doğru olabilir ki "tarafsız" gibi, ama sadece, çok "çekmiş" tahmincisi olan (neredeyse) tarafsız farklı bağlam - regresyon asimetrik bağlamında. Zira, OLS regresyonunda, bir tarafın (öngörücü) değerlerini, numuneden numuneye rasgele bir hata olmadan katılarak, sabit olarak değerlendiriyoruz. (Ve buraya eklemek için, regresyon iki değişkenli normallik gerektirmez.)