Küçültülmüş


22

Kafamda, Pearson korelasyon katsayısının popülasyon değerinin iki tür tahmincisi hakkında bir kafa karışıklığı oldu.

A. Fisher, (1915) iki değişkenli normal popülasyon ampirik için gösterdi a, negatif eğimli tahmincisi p'ye eğilim, sadece küçük bir numune boyutu (pratikte önemli miktarda olmasına rağmen, n < 30 ). Numune r hafife p o daha yakın olduğu anlamında 0 den p'ye . (İkinci olduğunda hariç 0 ya da ± 1 daha sonra da, r önyargısızdır.) Çeşitli yaklaşık tarafsız tahmin arasında p'ye önerilmiştir, iyi bir olasılıkla olmakrρn<30rρ0ρ0±1rρOlkin ve Pratt (1958) düzeltildi :r

runbiased=r[1+1r22(n3)]

B. Bu regresyon gözlenen söylenir abartılı ilgili nüfus R-kare. Ya da, basit regresyon ile tam o r 2 abartılı p 2 . Gerçeğine dayanarak, söyleyerek birçok metinleri gördüm r olan olumlu göreli önyargılı için p mutlak değerini, yani: r uzak dan 0 den p'ye (? Bu doğru ifadedir). Metinler, standart sapma parametresinin örnek değeri ile aşırı tahmin edilmesiyle aynı problem olduğunu söylüyor. Gözlenen "ayarlamak" için birçok formüller vardır mevcut Ar 2R2r2ρ2rρr0ρR2yakın nüfus parametresine, kayık en (1931) en iyi bilinen (ama en iyi) olmak. Bu düzeltilmiş kök R 2 adj adlandırılır büzülmüş r :Radj2radj2 r

rshrunk=±1(1r2)n1n2

İki farklı tahmin edicileri mevcut . Çok farklı: birincisi r , ikincisi r . Onları nasıl uzlaştırmak? Biri nerede kullanmalı / bildirmeli, diğeri mi?ρrr

Özellikle, bu doğru olabilir ki "tarafsız" gibi, ama sadece, çok "çekmiş" tahmincisi olan (neredeyse) tarafsız farklı bağlam - regresyon asimetrik bağlamında. Zira, OLS regresyonunda, bir tarafın (öngörücü) değerlerini, numuneden numuneye rasgele bir hata olmadan katılarak, sabit olarak değerlendiriyoruz. (Ve buraya eklemek için, regresyon iki değişkenli normallik gerektirmez.)


Acaba bu sadece Jensen'ın eşitsizliğine dayalı bir şeyden kaynaklanıyor mu? Bu ve iki değişkenli normallik çoğu durumda muhtemelen kötü bir varsayımdır.
shadowtalker

1
Ayrıca, meselenin benim anlayış B. regresyon olmasıdır regresyon uyum yordayıcılarını ekleyerek keyfi geliştirilebilir çünkü bir abartma olduğunu. Bana A'daki gibi aynı gelmiyor gibir2
shadowtalker

O aslında doğru mudur bir pozitif yanlı tahmindir p'ye 2 tüm değerleri için p'ye ? İki değişkenli normal dağılım için bu yeterince büyük ρ için geçerli görünmüyor . r2ρ2ρρ
NRH

Önyargı, tahmin edicinin karesi için ters yöne gidebilir mi? Örneğin, basit bir tahmini, bu gösterilebilir ki bazı aralıklar için İçeride ISTV melerin RWMAIWi'nin ? Θ = ρ ise bunun zor olacağını düşünüyorum , ama belki daha basit bir örnek işe yarayabilirdi. E[θ^θ]<0<E[θ^2θ2]θθ=ρ
Anthony,

Yanıtlar:


1

Korelasyondaki önyargıya ilişkin olarak: Örnek büyüklükleri önyargı için herhangi bir pratik öneme sahip olacak kadar küçük (örneğin, önerdiğiniz n <30), o zaman önyargı endişelerinizin en küçüğüdür, çünkü yanlışlık korkunçtur.

Bir önyargı ilgili R 2 çoklu regresyonda, eşit büyüklükte bağımsız örneklemde tarafsız tahmini vs tarafsız nüfus tahminine ilgilendirmeyen birçok farklı ayarlamalar vardır. Bakınız Yin, P. & Fan, X. (2001). Tahmin R 2 çoklu regresyon büzülme: Analitik yöntemlerin bir karşılaştırması. Deneysel Eğitim Dergisi, 69, 203-224.

Günümüz regresyon yöntemleri de ayrıca regresyon katsayısı çekme adres R 2 , örneğin, elastik ağ - bir sonucu olarak k kat çapraz doğrulama, bkz http://web.stanford.edu/~hastie/Papers/ elastiknet.pdf .


1
Bunun gerçekten soruyu cevaplayıp cevaplamadığını bilmiyorum
shadowtalker

1

Bence cevap basit regresyon ve çoklu regresyon bağlamında. Bir IV ve bir DV ile basit regresyonda, R sq pozitif önyargılı değildir ve gerçekte r negatif bir şekilde önyargılı ise olumsuz önyargılı olabilir. Ancak, kendileri ile ilişkilendirilebilecek birkaç IV'le yapılan çoklu regresyonda, R sq, meydana gelebilecek herhangi bir "baskılama" nedeniyle pozitif olarak önyargılı olabilir. Bu nedenle benim görüşüme göre, gözlemlenen R2 karşılık gelen popülasyon R-karesini fazla tahmin ediyor, ancak sadece çoklu regresyonda


1
R sq is not positively biased, and in-fact may be negatively biasedİlginç. Gösterebilir misin veya referans verebilir misin? - İki değişkenli normal popülasyonda, gözlemlenen örnek RSq istatistiği negatif önyargılı tahmin edici olabilir mi?
ttnphns 25:16

Bence yanılıyorsun. Talebinizi yedeklemek için bir referans verebilir misiniz?
Richard Hardy,

Üzgünüz, ama bu daha çok bir düşünce alıştırmasıydı, bu yüzden referansım yok.
Dingus

Fischer, iki değişkenli normal bir durumda, r'nin negatif önyargılı bir tahminci olduğunu gösterdiği yukarıdaki A Yorumundan ayrılıyordum. Eğer durum buysa, R sq'nin de negatif önyargılı olduğunu izlemeyecek miydi?
Dingus

Belki de bu sohbette yardımcı olacaktır digitalcommons.unf.edu/cgi/…
Dingus
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.