Farklı Düzeltilmiş formülleri arasında nasıl seçim yapılır ?


15

Aklımda tarafından ayarlanmış R kare formülleri var:

  • Hâlâ SPSS'de kullanılan olduğuna inanıyorum Ezekiel (1930).

    Radjusted2=1(N1)(Np1)(1R2)
  • Olkin ve Pratt (1958)

    Runbiased2=1(N3)(1R2)(Np1)2(N3)(1R2)2(Np1)(Np+1)

Hangi koşullarda (eğer varsa) 'tarafsız' R ^ 2'ye 'ayarlanmış'ı tercih etmeliyim R2?

Referanslar

  1. Hezekiel, M. (1930). Korelasyon analizi yöntemleri . John Wiley ve Oğulları, New York.
  2. Olkin I., Pratt JW (1958). Belirli Korelasyon Katsayılarının Tarafsız Tahmini. Yıllık Matematik İstatistikleri , 29 (1), 201-211.

Yanıtlar:


5

@Ttnphns'ın cevabı için kredi almak istemeden, cevabı yorumların dışına çıkarmak istedim (özellikle makaleye olan bağlantının öldüğünü düşünerek). Matt Krause'un cevabı, ve arasındaki ayrımın faydalı bir tartışmasını sağlar, ancak belirli bir durumda hangi formülünün kullanılacağı kararını tartışmaz .R 2 a d j R 2 a d jR2Radj2Radj2

Ben ele aldığımız gibi bu cevap , Yin ve Fan (2001) açıklandığı nüfus değişimini tahmin etmek için birçok farklı formüller iyi bir genel bakış sağlamak , potansiyel olarak ayarlanmış bir tür olarak adlandırılabilen bütün bunların .R 2ρ2R2

Çok çeşitli ayarlanmış r-kare formüllerinden hangisinin farklı örnek boyutları, ve prediktör ara korelasyonları için en iyi tarafsız tahmini sağladığını değerlendirmek için simülasyon yaparlar. Pratt formülünün iyi bir seçenek olabileceğini öne sürüyorlar , ancak çalışmanın bu konuda kesin olduğunu düşünmüyorum.ρ2

Güncelleme: Raju ve arkadaşları (1997), düzeltilmiş formüllerinin, sabit x veya rasgele-x prediktörleri varsayarak, düzeltilmiş tahmin etmek üzere tasarlanıp tasarlanmadığına bağlı olarak farklılık gösterdiğini belirtmektedir. Spesifik olarak, Ezekial formül tahmin etmek için tasarlanmıştır sabit x bağlamında ve Olkin-Pratt ve Pratt formülleri tahmin etmek için tasarlanmış içinde rasgele x içeriği. Olkin-Pratt ve Pratt formülleri arasında fazla bir fark yoktur. Sabit-x varsayımları planlanan deneylerle, rasgele-x varsayımları ise öngörücü değişkenlerin değerlerinin gözlemsel çalışmalarda olduğu gibi olası değerlerin bir örneği olduğunu varsaydığınızda hizalanır. Daha fazla tartışma için bu cevaba bakınızR 2 ρ 2 ρ 2R2R2ρ2ρ2. Ayrıca, örnek boyutları orta derecede büyüdükçe, iki formül türü arasında çok fazla fark yoktur ( farkın boyutu hakkında bir tartışma için buraya bakın ).

Temel Kuralların Özeti

  • Tahmin değişkenleri için gözlemlerinizin bir popülasyondan rastgele bir örnek olduğunu varsayarsanız ve hem yordayıcıların hem de ölçütlerin (yani rastgele-x varsayımı) tam nüfusu için değerini tahmin etmek istiyorsanız , Olkin-Pratt formülünü kullanın (veya Pratt formülü).ρ2
  • Gözlemlerinizin sabit olduğunu varsayarsanız veya gözlemleyicinin gözlemlediğiniz düzeylerinin ötesinde genelleme yapmak istemezseniz , Ezekiel formülü ile değerini tahmin edin.ρ2
  • Örnek regresyon denklemini kullanarak örnek dışı tahmin hakkında bilgi edinmek istiyorsanız, bir çeşit çapraz doğrulama prosedürüne bakmak istersiniz.

Referanslar

  • Raju, NS, Bilgic, R., Edwards, JE ve Fleer, PF (1997). Metodoloji incelemesi: Nüfus geçerliliği ve çapraz geçerlilik tahmini ve eşit ağırlıkların tahminlerde kullanılması. Uygulamalı Psikolojik Ölçüm, 21 (4), 291-305.
  • Yin, P. ve Fan, X. (2001). Çoklu regresyonda büzülmesinin hesaplanması : Farklı analitik yöntemlerin karşılaştırılması. Deneysel Eğitim Dergisi, 69 (2), 203-224. PDFR2

13

veya ayarlanmış seçimi ne yapmaya çalıştığınıza bağlıdır. Regresyon bağlamında, modeliniz için uyum iyiliğinin bir ölçüsü olarak normal kullanılır. Ancak, farklı sayıda parametreye sahip birkaç modeli karşılaştırdığınızı düşünün. Her şey eşit olduğunda, daha fazla parametreye sahip model gözleminize daha uygun olacaktır. Sınırda, her veri noktası için bir tane olmak üzere parametreleri olan bir modeliniz olabilir; bu, gözlemlerinize mükemmel bir uyum sağlar, ancak hem temel 'sinyali' VE ilişkili herhangi bir gürültüyü yakalayacağından yeni tahmin için işe yaramaz. Ayarlanmış ayarlanmasıyla, bu sorunu çözmek için bir girişimR 2 R 2 R 2 R 2R2R2R2R2R2 Modeldeki parametre sayısına göre değer.

Bu nedenle, biraz farklı amaçlara sahiptirler. , farklı veri kümelerinin bir modele ne kadar iyi uyduğunu açıklar. "Yukarıda açıklanan model, standart test koşulları altında Widget B'yi ( = 0,05) değil , Kısım A'nın performansını ( = 0,9) doğru bir şekilde tahmin eder ." Düzeltilmiş , farklı modellerin aynı verilere (veya benzer verilere) ne kadar iyi uyduğunu açıklar. Örneğin, "Kısa ve uzun biçimli anket sonuçları, müşterinin yıllık harcamalarını eşit derecede iyi öngördü ( her ikisi için Düzeltilmiş = 0,8)."R2r2r2R2R2


2
Teşekkürler, R-kare ve düzeltilmiş R-kare arasındaki farkın çok açık bir açıklaması olduğunu buldum. Sizce tarafsız R-karesi bu resme nasıl uyuyor?
user1205901 - Monica

5
Gerçekten de R ^ 2 popülasyonunu tahmin etmek için çeşitli formüller vardır. Örneğin studyforquals.pbworks.com/f/yin.pdf adresine bakın . Fisher'ın (= Wherry's) "Düzeltilmiş R ^ 2" nin hafif negatif yönlü olduğu söylenir (tahmin edicilere bağlı olmamakla birlikte yine de örnek büyüklüğüne bağlıdır), bu nedenle Olkin-Pratt versiyonu muhtemelen biraz daha iyidir.
ttnphns

1
@ttnphns, belki bu bir yorum yerine bir cevap olmalıdır. Bana göre, orijinal soruyu bu cevaptan daha çok ele alıyor gibi görünüyor.
gung - Monica'yı eski durumuna getir

1
bir örnekten hesaplanan değer "doğru" popülasyonun değerden biraz daha küçük olacaktır. Sayfa 6/138 ile arsa uv.es/psicologica/articulos1.03/9.ZUMBO.pdf gösteren önyargı örnek büyüklüğü ile nasıl değiştiğini R 2 değeri. Olkin-Pratt formülü, bu örnek boyutu sapmasını düzeltir. Olkin-Pratt formülünün etrafında yüzen iki versiyonu var gibi görünüyor, bunlardan biri de parametre sayısını düzeltiyor (bkz. Ttnphns bağlantısı). Aslında, bu kağıt, özel uygulamanız için bir düzeltme yöntemi seçmenize yardımcı olacak birkaç tablo içerir, bu yüzden bir göz atmaya değer. R2R2
Matt Krause

1
@ttnphns, Gung'a katılıyorum! Bir cevap yazmalı ve biraz kredi almalısınız. Ayrıca, ne yazdığımı teyit edebilir misiniz? JStor bugün garip davranıyor ve orijinal Olkin ve Pratt gazetesini okumama izin vermiyor.
Matt Krause
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.