R kare nüfusunun tarafsız bir tahmini nedir?


14

Ben çoklu doğrusal regresyon tarafsız bir tahmin elde ilgileniyorum .R2

Yansıtma üzerine, tarafsız bir tahminin eşleşmeye çalıştığı iki farklı değer düşünebilirim .R2

  1. Örnek : örnektenR2β elde edilen regresyon denkleminin (yani ) numunenin dışında sonsuz miktarda veriye, ancak aynı verilerden uygulanması durumunda elde edilecek r-karesi üretim süreci.β^
  2. Nüfus :R2 β Sonsuz bir numune elde edilirse elde edilecek olan r-kare ve model bu sonsuz örneğe (yani, ) veya alternatif olarak sadece bilinen veri oluşturma işleminin ima ettiği R-karesine takılır .β

DüzeltilmişR2 R 2 R 2 R 2 R 2 , örneğinde gözlenen aşırı uyumu telafi etmek için tasarlandığını anlıyorum . Bununla birlikte, düzeltilmiş olup olmadığı net değil aslında tarafsız bir tahmindir ve tarafsız bir tahminidir, eğer ki yukarıdaki iki tanımlarının de tahmin hedefliyor.R2R2R2R2

Böylece, sorularım:

  • Yukarıda örnek ne dediğimin tarafsız bir tahmini nedir ?R2
  • popülasyonunun üstünde dediğim şeyin tarafsız bir tahmini nedir ?R2
  • Simülasyon veya tarafsızlığın başka bir kanıtını sağlayan referanslar var mı?

Soru için hangi formül R ^ 2 daha az önyargılıdır, örneğin burada .
ttnphns

Teşekkürler. Şimdi bahsettiğiniz referansı okuyorum: Yin, P. ve Fan, X. (2001). Çoklu regresyonda büzülmesinin hesaplanması : Farklı analitik yöntemlerin karşılaştırılması. Deneysel Eğitim Dergisi, 69 (2), 203-224. R2
Jeromy Anglim

Yanıtlar:


14

R-karesinde analitik ayarlamaların değerlendirilmesi

@ttnphns beni Yin ve Fan (2001) makalesine yönlendirerek tahmininde farklı analitik yöntemleri karşılaştırdı . Soruma göre iki tür tahminci arasında ayrım yapıyorlar. Aşağıdaki terminolojiyi kullanırlar:R2

  • ρ2 : Kare nüfus çoklu korelasyon katsayısının tahmincisi
  • ρc2 : Kare nüfus çapraz geçerlilik katsayısının tahmincisi

Sonuçları özette özetlenmiştir:

Yazarlar büzülmesini tahmin etmek için analitik formüllerin etkinliğini araştırmak için 4 tam çapraz faktör (kare nüfus çoklu korelasyon katsayısı, prediktör sayısı, örnek büyüklüğü ve çok doğrusallık derecesi) ve 500 replikasyon ile bir Monte Carlo deneyi gerçekleştirdiler . her hücre. Sonuçlar, en yaygın kullanılan Wherry formülünün (hem SAS hem de SPSS'de) muhtemelen tahmin etmek için en etkili analitik formül olmadığını gösterdi . Bunun yerine, Pratt formülü ve Browne formülü , sırasıyla ve tahmininde diğer analitik formüllerden daha iyi performans gösterdi .ρ 2 ρ 2 ρ 2 cR2ρ2ρ2ρc2

Bu nedenle, makale Pratt formülünün (s.209) tahmin etmek için iyi bir seçim olduğunu ima eder :ρ2

R^2=1(N3)(1R2)(Np1)[1+2(1R2)Np2.3]

buradaki N, örneklem büyüklüğü ve p, prediktörlerin sayısıdır.

R-kare ayarlamasının ampirik tahminleri

R2ρ2ρc2ρ2

Referanslar

  • Kromrey, JD ve Hines, CV (1995). Çoklu regresyonda ampirik büzülme tahminlerinin kullanımı: bir uyarı. Eğitim ve Psikolojik Ölçüm, 55 (6), 901-925.
  • R2
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.