Düzeltilmiş R-kare, r-kare sabit puan veya rasgele puan popülasyonu tahmin etmeye çalışıyor mu?


9

Nüfus r-kare ρ2 sabit puanlar veya rastgele puanlar varsayılarak tanımlanabilir:

  • Sabit puanlar: Örnek büyüklüğü ve öngörücülerin belirli değerleri sabit tutulur. Böylece,ρf2 yordayıcı değerleri sabit tutulduğunda popülasyon regresyon denklemi tarafından elde edilen sonuçta açıklanan varyans oranıdır.

  • Rastgele skorlar: Öngörücülerin belirli değerleri bir dağılımdan alınmıştır. Böylece,ρr2 Burada, "prediktör değerlerinin" prediktörlerin popülasyon dağılımına karşılık geldiği popülasyonda sonuçta açıklanan varyans oranını ifade eder.

Daha önce bu ayrımın aşağıdakilerle ilgili tahminlerde çok fark yaratıp yaratmadığını sordumρ2. Ayrıca genel olarak tarafsız bir tahminin nasıl hesaplanacağını sordumρ2.

Örneklem büyüklüğü büyüdükçe, sabit-puan ve rastgele-puan arasındaki farkın daha az önemli olduğunu görebiliyorum. Ancak, düzeltilmiş olup olmadığını onaylamaya çalışıyorumR,2 sabit puanı veya rastgele puanı tahmin etmek için tasarlanmıştır ρ2.

Sorular

  • Ayarlandı R,2 sabit puanı veya rastgele puanı tahmin etmek için tasarlanmıştır ρ2?
  • Düzeltilmiş r-kare formülünün bir veya başka formuyla nasıl ilişkili olduğuna dair ilkeli bir açıklama var mı? ρ2?

Karışıklığımın arka planı

Yin ve Fan'ı okuduğumda (2001, s.206) yazıyorlar:

Çoklu regresyon modelinin temel varsayımlarından biri, bağımsız değişkenlerin değerlerinin bilinen sabitler olduğu ve deneyden önce araştırmacı tarafından sabitlendiği yönündedir. Sadece bağımlı değişken numuneden numuneye değişmekte serbesttir. Bu regresyon modeline sabit doğrusal regresyon modeli .

Bununla birlikte, sosyal ve davranış bilimlerinde bağımsız değişkenlerin değerleri nadiren araştırmacılar tarafından sabitlenir ve rastgele hatalara da maruz kalır. Bu nedenle, bağımlı ve bağımsız değişkenlerin değişmesine izin verilen uygulamalar için ikinci bir regresyon modeli önerilmiştir (Binder, 1959; Park ve Dudycha, 1974). Bu modele rastgele model (veya düzeltme modeli) denir. Rastgele ve sabit modellerden elde edilen regresyon katsayılarının maksimum olabilirlik tahminleri normallik varsayımları altında aynı olsa da, dağılımları çok farklıdır. Rasgele model o kadar karmaşıktır ki, yaygın olarak kullanılan sabit doğrusal regresyon modeli yerine kabul edilmeden önce daha fazla araştırmaya ihtiyaç vardır. Bu nedenle, sabit model genellikle uygulanır, varsayımlar tam olarak karşılanmadığında bile (Claudy, 1978). Varsayımların ihlal edildiği sabit regresyon modelinin bu tür uygulamaları "fazla sığmaya" neden olur, çünkü mükemmel olmayan örnek verilerinden gelen rastgele hata işlemden büyük yararlanma eğilimindedir. Sonuç olarak, bu şekilde elde edilen örnek çoklu korelasyon katsayısı, gerçek popülasyon çoklu korelasyonunu fazla tahmin etme eğilimindedir (Claudy, 1978; Cohen ve Cohen, 1983; Cummings, 1982).

Bu yüzden yukarıdaki ifadenin, R,2 rastgele modelin getirdiği hatayı veya bunun rastgele modelin varlığını işaretleyen kağıttaki bir uyarı olup olmadığını, ancak kağıdın sabit modele odaklanacağını telafi eder.

Referanslar

  • Yin, P. ve Fan, X. (2001). tahminR,2çoklu regresyonda büzülme: Farklı analitik yöntemlerin karşılaştırılması. Deneysel Eğitim Dergisi, 69 (2), 203-224. PDF

Yanıtlar:


6

Raju ve diğerleri (1997)

Pedhazur (1982) ve Mitchell & Klimoski (1986),
Ns en az orta büyüklükte olduğunda (yaklaşık 50) seçilen modelden [sabit-x veya rastgele-x] nispeten etkilenmediğini iddia etmişlerdir .

Bununla birlikte, Raju ve arkadaşları (1997) bazı R,2 tahmin formülleri ρ2 "Sabit X formülleri" ve "Rastgele X formülleri" olarak adlandırılmıştır.

Sabit X formülleri: Çoğu istatistiksel yazılımda standart olan Ezekiel (1930) tarafından önerilen formülü içeren çeşitli formüller belirtilmiştir:

ρ^(E)2=1-N--1N--p-1(1-R,2)

Böylece, sorunun kısa cevabı düzeltilmiş standarttırR,2 tipik olarak rapor edilen ve standart istatistiksel yazılım içine yerleştirilen formül, sabit x ρ2.

Rastgele X formülleri:

Olkin ve Pratt (1958) bir formül önerdi

ρ^(ÖP)2=1-[N--3N--p-1](1-R,2)F[1,1;N--p+12;(1-R,2)]
burada F, hipergeometrik fonksiyondur .

Raju ve ark. (1997) Pratt's ve Herzberg'in "beklenen hipergeometrik fonksiyona nasıl yaklaştığını" gibi çeşitli diğer formüllerin nasıl olduğunu açıklar. Pratt'ın formülü,

ρ^(P)2=1-(N--3)(1-R,2)N--p-1[1+2(1-R,2)N--p-2.3]

Tahminler arasındaki farklar nelerdir? Leach ve Hansen (2003) raporunda, farklı formüllerin psikolojide yayınlanmış farklı veri kümelerinin bir örneği üzerindeki etkisini gösteren güzel bir tablo sunulmuştur (bkz. Tablo 3). Ortalama HezekielR,birdj2 Olkin ve Pratt ile karşılaştırıldığında .2864 oldu R,birdj2 .2917 ve Pratt R,birdj2.2910. Raju ve arkadaşlarının sabit ve rastgele x formülleri arasındaki farkın küçük örneklem boyutlarıyla en ilgili olduğu ilk alıntısına göre, Leach ve Hansen'in tablosu Ezekiel'in sabit x formülü ile Olkin ve Pratt'ın random-x formülü arasındaki farkın en belirgin olduğunu göstermektedir küçük numune boyutlarında, özellikle 50'den küçük boyutlarda.

Referanslar

  • Leach, LF ve Henson, RK (2003). Düzeltilmiş R2 etkilerinin yayınlanmış regresyon araştırmalarında kullanımı ve etkisi. Southwest Eğitim Araştırmaları Derneği, San Antonio, TX yıllık toplantısında. PDF
  • Mitchell, TW ve Klimoski, RJ (1986). Çapraz geçerlilik tahmininin geçerliliğini tahmin etme. Uygulamalı Psikoloji Dergisi, 71 , 311-317.
  • Pedhazur, EJ (1982). Davranışsal Araştırmalarda Çoklu Regresyon (2. baskı) New York: Holt, Rinehart ve Winston.
  • Raju, NS, Bilgic, R., Edwards, JE ve Fleer, PF (1997). Metodoloji incelemesi: Nüfus geçerliliği ve çapraz geçerlilik tahmini ve eşit ağırlıkların tahminlerde kullanılması. Uygulamalı Psikolojik Ölçüm, 21 (4), 291-305.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.