T istatistiklerim çok büyük olduğunda R-karem neden bu kadar düşük?


18

4 değişkenli bir regresyon çalıştırdım ve hepsi çok yüksek ve açıkça önemli olan T değerleri 7,9,26 ve 31 ( ondalıkları dahil etmek önemsiz görünüyor çünkü söylüyorum) ile çok istatistiksel olarak anlamlıdır. Ama sonra R2 sadece .2284'tür. Buradaki t değerlerini, olmadığı bir şeyi ifade etmek için yanlış mı yorumluyorum? T değerlerini gördüğümde ilk tepkim, R2 oldukça yüksek olacağı, ancak belki de yüksek bir R2 ?


1
Bahse girerim n orta derecede büyük, değil mi?
Glen_b

@Glen_b evet, yaklaşık 6000.
Kyle

11
Daha sonra , küçük R ^ 2 ile ilişkili büyük t özellikleri tamamen dikkate değer değildir. Standart hatalar 1 / \ sqrt {n} olarak düştüğünden , t- oranları \ sqrt {n} olarak artacaktır , R ^ 2 ise artan n ile sabit kalma eğilimindedir . Neden umursuyorsun R ^ 2 nedir? Neden t oranlarının umurunda? R21/ntnR2nR2
Glen_b

Yanıtlar:


46

t -değerleri ve R2 çok farklı şeyler yargılamak için kullanılır. t -değerleri arasında da tahmin accurary yargılamak için kullanılan βi sitesindeki, ancak R2 , yanıt değişkeni varyasyonun ölçülmesi miktarı eş değişken ile açıklanabilir. Eğer bir regresyon modeli tahmin varsayalım n , gözlemler

Yi=β0+β1X1i+...+βkXki+ϵi

burada ϵii.i.dN(0,σ2) , i=1,...,n .

Büyük değerleri (mutlak değerde), olan sıfır hipotezini reddetmenize neden olur . Bu, katsayının işaretini doğru bir şekilde tahmin ettiğinizden emin olabileceğiniz anlamına gelir. Ayrıca,> 4 ve sahipseniz , 0, katsayı için% 99 güven aralığında değildir. katsayısı için-değeri tahmini arasındaki farktır standart hata ile normalize ve 0 .tβi=0|t|n>5tβiβi^se{βi^}

t=βi^se{βi^}

tahminin değişkenliğinin bir ölçüsüdür. Yeterince büyük bir veri kümeniz varsa, her zaman istatistiksel olarak önemli (büyük) değerlerine sahip olursunuz . Bu, zorunlu değişkenlerin yanıt değişkenindeki varyasyonların çoğunu açıkladığı anlamına gelmez.t

@Stat'ın belirttiği gibi, yanıt değişkeninizde bağımlı değişkenleriniz tarafından açıklanan varyasyon miktarını ölçer. hakkında daha fazla bilgi için wikipedia'ya gidin . Sizin durumunuzda, 'leri doğru bir şekilde tahmin etmek için yeterince büyük bir veri var gibi görünüyor , ancak ortak değişkenleriniz yanıt değerlerini açıklama ve \ veya tahmin etme konusunda zayıf bir iş yapıyor.R2R2βi


1
(+1) En başından beri bunun iyi düşünülmüş, bilgilendirici bir açıklama olduğu açıktır.
whuber

Güzel cevap. "Pratik önem" ve "istatistiksel önem" terimlerinin bu konuyu düşünmede sıklıkla yardımcı olduğunu düşünüyorum.
Aaron Stack Overflow'dan ayrıldı

3
İki istatistik arasında da basit bir dönüşüm var:R2=t2t2+df
Jeff

8

Caburke ile aynı şeyi söylemek, ancak daha basit bir ifadeyle, değişkenlerinizin neden olduğu ortalama yanıtın sıfır olmadığı konusunda çok eminsiniz. Ancak, regresyonda yanıtın atlamasına neden olan başka birçok şey var.


0

Öngörücüleriniz yanıt değişkeniniz (eğim sıfırdan önemli ölçüde farklıdır) açısından doğrusal olarak trend olmasına rağmen, t değerlerini önemli kılar, ancak R karesi düşüktür, çünkü hatalar büyüktür, yani verileriniz büyüktür ve bu nedenle regresyon modeliniz iyi bir uyum değildir (tahminler doğru değildir)?

Sadece 2 sentim.

Belki de bu yazı yardımcı olabilir: http://blog.minitab.com/blog/adventures-in-statistics/how-to-interpret-a-regression-model-with-low-r-squared-and-low-p- değerler


0

Verilen bazı cevaplar yakın ama yine de yanlış.

"T-değerleri βi 'nin tahmininizin doğruluğunu değerlendirmek için kullanılır" Beni en çok ilgilendiren odur.

T-değeri sadece rastgele meydana gelme olasılığının bir göstergesidir. Büyük olasılıkla anlamına gelir. Küçük, çok muhtemeldir. Olumlu ve Olumsuz olasılık yorumunun önemi yoktur.

"R2, değişkenlerinizin değişkenleriniz tarafından açıklanan değişkenlik miktarını ölçer" doğrudur.

(Yorum yapardım, ancak bu platform tarafından henüz izin verilmiyordu.)


2
T-değerleri hakkında sanki p-değerleriymiş gibi yazıyorsunuz.
whuber

-4

Küçük bir R kare ile baş etmenin tek yolu, aşağıdakileri kontrol edin:

  1. Numune boyutunuz yeterince büyük mü? Evet ise, 2. adımı uygulayın, ancak hayır ise, örnekleminizin boyutunu artırın.
  2. Model tahmininiz için kaç tane ortak değişken kullandınız? Durumunuzda olduğu gibi 1'den fazla ise, ortak değişkenlerin çok doğrusal doğrusallığı sorunuyla ilgilenin veya basitçe, regresyonu beta sıfır olarak bilinen sabit olmadan tekrar çalıştırın.

  3. Bununla birlikte, sorun devam ederse, kademeli bir regresyon yapın ve yüksek R kare olan modeli seçin. Ama size tavsiye edemem çünkü ortak değişkenlerde önyargıya neden oluyor

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.