Gidermek için ilk soruyu , modelini dikkate
Y=X+sin(X)+ε
iid ile ortalama sıfır ve sonlu varyans. aralığı (sabit veya rastgele olarak düşünülür) arttıkça, olur. Bununla birlikte, varyansı küçükse (yaklaşık 1 veya daha az), veriler "gözle görülür şekilde doğrusal değildir" olur. Grafiklerde, .XεX ε v bir R ( ε ) = 1R2εvar(ε)=1
Bu arada, küçük bir elde etmenin kolay bir yolu bağımsız değişkenleri dar aralıklarda dilimlemek. Her aralığın içindeki regresyon ( tam olarak aynı modeli kullanarak ) , tüm verilere dayalı tam regresyonun yüksek bir sahip olması durumunda bile düşük olacaktır . Bu durumu düşünmek bilgilendirici bir alıştırma ve ikinci soru için iyi bir hazırlıktır.R 2 R 2R2R2R2
Aşağıdaki grafiklerin her ikisi de aynı verileri kullanır. , tam regresyon için 0.86 olduğunu. (5/2 -5/2 için eni 1/2) dilimleri vardır .16, .18, .07, .14, .08, .17, .20, .12, .01 için .00, soldan sağa okuma. Herhangi bir şey olursa , dilimlenmiş durumda uyumlar daha iyi olur çünkü 10 ayrı çizgi dar aralıkları içindeki verilere daha yakın olabilir. Her ne kadar , tüm dilimleri kadar tam altında , ne ilişkinin kuvveti, doğrusallık , ne de gerçekten bir veri yönünde (aralığı dışında regresyon analizi için kullanılır) değişmiştir.R 2R2R2R, 2 xR2R2X
(Bu dilimleme prosedürünün dağılımını değiştirmesine itiraz edilebilir . Bu doğru, ancak yine de sabit etki modellemesinde en yaygın kullanımı ile uyuşuyor ve bize ne derece anlattığını gösteriyor varyans rastgele etki durumda. özellikle de, doğal dizi daha küçük bir aralık içinde değişebilir şekilde sınırlanmıştır genellikle düşer.)RXR, 2 x x R ' 2R2R2XXR2
ile ilgili temel problem , çok fazla şeye (çoklu regresyonda ayarlandığında bile), fakat özellikle bağımsız değişkenlerin varyansına ve artıkların varyansına bağlı olmasıdır. Normalde bize , bir model sırasını karşılaştırmak için "doğrusallık" veya "ilişkinin gücü" veya "uyumun iyiliği" hakkında hiçbir şey söylemez .R2
Çoğu zaman daha iyi bir istatistik bulabilirsiniz . Model seçimi için AIC ve BIC; Bir modelin yeterliliğini ifade etmek için, artıkların varyansına bakın. R2
Bu bizi nihayet ikinci soruya getiriyor . bazı kullanımlarının olabileceği bir durum , bağımsız değişkenlerin standart değerlere ayarlanmasıdır, esasen değişkenliklerinin etkisini kontrol eder. Öyleyse , artıkların standartlarına göre ayarlanan artıkların varyansı için gerçekten bir vekil. 1 - R ' 2R21−R2