için% 95 güven aralığı formülü


13

Googled ve stats.stackexchange üzerinde arama yaptım, ancak doğrusal bir regresyon için bir değeri için % 95 güven aralığı hesaplamak için formül bulamıyorum . Herkes sağlayabilir mi?R2

Daha da iyisi, R'de aşağıdaki doğrusal regresyonu çalıştırdığımı varsayalım . R kodunu kullanarak R R2 değeri için% 95 güven aralığını nasıl hesaplayabilirim .

lm_mtcars <- lm(mpg ~ wt, mtcars)

1
Iyi korelasyon ilişkisi biliyorum r ve R2 almak için korelasyon katsayısı kare alma edilir yani R2 niçin güven aralığını hesaplamak o kadar r kare ardından aralığının alt ve üst sınırları ve?

1
@ZERO: basit bir doğrusal regresyonda, yani tek bir öngörücü ve bir kesişme ile çalışacaktır. Birden fazla öngörücü ile çoklu doğrusal regresyon için çalışmaz.
Stephan Kolassa

@StephanKolassa, çok doğru! Sanırım Rsadece bir regressor var onun kodunu dayandı ama bu açıklığa kavuşturmak için çok iyi bir nokta.


Merkezi olmayan F dağıtımının özelliklerine göre çok küçük bir R işlevi github.com/mayer79/R-confidence-intervals-R-squared kullanabilirsiniz .
Michael M

Yanıtlar:


16

Her zaman önyükleme yapabilirsiniz:

> library(boot)
> foo <- boot(mtcars,function(data,indices)
        summary(lm(mpg~wt,data[indices,]))$r.squared,R=10000)

> foo$t0
[1] 0.7528328

> quantile(foo$t,c(0.025,0.975))
     2.5%     97.5% 
0.6303133 0.8584067

Carpenter & Bithell (2000, Tıpta İstatistikler) , özellikle odaklanmamış olsa da, önyükleme güven aralıklarına okunabilir bir giriş sağlar .R2


1
(+1) @Durden tarafından belirtilen yaklaşık formülün, ve aralığı . Bu formülde SE'yi çarpan faktörünü düşürürsek neredeyse mükemmel olur ! k = 1 ( 0.546 , 0.960 ) 2n=32k=1(0.546,0.960)2
whuber

Ayrıca, önyükleme yeniden örnekleme dağıtımını kullanarak başka tür güven aralıkları (örneğin BCa) alabileceğinizi belirtmek gerekir boot.ci().
Jeffrey Girard

7

R'de, psikometrik paketin CI.Rsq()sağladığı işlevi kullanabilirsiniz . Uyguladığı formüle gelince, Cohen ve ark. (2003) , Davranış Bilimleri için Uygulamalı Çoklu Regresyon / Korelasyon Analizi , s. 88:

SER2=4R2(1R2)2(nk1)2(n21)(n+3)

Sonra% 95 CI, .R2±2SER2


3
(1) referansınızda kare. (2) " " nin popülasyon değeri yerine örnek değer olması amaçlandığını belirtmek önemlidir (bu açıkça " " nin ne anlama geldiğini ve karışıklık potansiyeline sahiptir). (3) Bunun sadece "asktotik (" büyük örnek ") bir sonuç olması ve" " için" yeterli tahminler "verilmesi de önemlidir . ( bir kesişim artı bağımsız değişkenlerin sayısı olduğuna inanıyorum .) Simülasyon tarafından desteklenen çalışan bir örnek görmek yararlı olacaktır, çünkü bu aralık çok geniş görünüyor. R, 2 R, 2 N - k - 1 > 60 k + 1(1R2)R2R2nk1>60k+1
whuber

Wishart'a (1931) göre formül normal olmayan dağılımlar için uygun değildir.
abukaj
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.