Regresyon analizinde standart artık nasıl anlaşılır?


9

Göre , Örnek ile regresyon analizi standardize artıkları dikkate almak gerekir, kalıntı yanıt ve tahmin edilen değer arasındaki fark, o zaman, her bir kalıntı farklı varyans sahip olduğu söylenir.

Ancak varyans bir grup değer içindir, tek bir değerin nasıl varyansı olabilir?


2
Ders kitabını doğrudan alıntılamak veya (çevrimiçi olarak mevcutsa) bir bağlantı sağlamak için yardımcı olacaktır. Tek bir kelime bile düzensiz veya bağlam dışı alınırsa çok şey kaybolabilir. (Örneğin, artıklar genellikle tam
tersi

Tek rastgele değişkenlerin varyansları vardır. Artıklar rastgele değişkenlerdir - verilerin işlevleri. Yani, tek artıkların (standartlaştırılmış veya standartlaştırılmamış) varyansları vardır.
konuk

#whuber Ders kitabı "Regresyon.Analiz.by.Örnek", sayfa 89. Görüşmede, kalıntı türleri tartışıldı. sıradan artık tepki tahminidir. @guest "Tek rastgele değişkenlerin varyansları vardır", ben anlamadım budur, değişkenler bir örnek için bir özelliktir, değil mi? bir örnekteki tek bir değer (artık gibi) neden varyansa sahiptir?
ccshao

Kitabın bir yazarı var mı? Bu genellikle bulmayı kolaylaştırır. Örnek varyans ve popülasyon varyansının kafası karıştığını düşünüyorum. Kalıntı, deney yapılmadan önce bilinmemektedir. Yanıt rasgele ve rezidü de öyle, çünkü cevabın bir fonksiyonu. Kalıntı varyansı hakkında konuştuğumuzda, altta yatan rastgele değişkenin varyansı hakkında konuşuyoruz.
MånsT

verdiğimiz rahatsızlıktan dolayı yazarlar SAMPRIT CHATTEFUEE ve ALI S. HADI, Örnek Regresyon Analizi, dördüncü baskıdır.
ccshao

Yanıtlar:


9

Bir olasılık dağılımından rastgele bir çekilmeden kaynaklanan bireysel bir sayının (artık gibi) rastgele bir değişken değil, gerçekleşmiş bir değer olduğunu söyleyebilirim . Aynı şekilde şunu söyleyebilirim kiN verilerinizden hesaplanan artıklar ve modeliniz e=yy^, gerçekleşen değerler kümesidir. Bu sayı kümesi, temeldeki bir dağıtımdan bağımsız çekiliş olarak gevşek bir şekilde kavramsallaştırılabilirϵ ~ N(μ,σ2). (Ne yazık ki, burada birkaç ek karmaşıklık var. Örneğin, aslındaN bağımsız bilgi parçaları, çünkü artıklar, e, iki koşulu karşılamalıdır: ei=0, ve xiei=0.)

Şimdi, bazı sayılar kümesi göz önüne alındığında, artıklar ya da her neyse, bir varyansları olduğu kesinlikle doğrudur, (eie¯)2/N, ama bu ilginç değil. Önem verdiğimiz şey, veri oluşturma süreci hakkında bir şeyler söyleyebilmektir (örneğin, nüfus dağılımının varyansını tahmin etmek). Önceki formülü kullanarak, bu formülü değiştirerekNkalan serbestlik dereceleriyle, ancak bu iyi bir yaklaşım olmayabilir. Bu çok hızlı bir şekilde karmaşıklaşabilen bir konudur, ancak birkaç olası neden heterossedastisite olabilir (yani, popülasyonun varyansı farklı seviyelerde farklı olabilir)x) ve aykırı değerlerin varlığı (yani, belirli bir artık tamamen farklı bir popülasyondan çekilir). Neredeyse kesinlikle, pratikte, bir aykırı değer çizilen nüfusun varyansını tahmin edemezsiniz, ancak yine de teoride, bir varyansı vardır. Bu satırlar boyunca yazarların aklında olan şeylerden şüpheleniyorum, ancak o kitabı okumadığımı not etmeliyim.

Güncelleme: Soruyu tekrar okuduktan sonra, teklifinx- bir noktanın değeri, takılan regresyon hattını ve dolayısıyla o nokta ile ilişkili tortunun değerini etkiler. Burada anlaşılması gereken temel fikir kaldıraçtır . Bu konuları şu cevabımda tartışıyorum : Interpreting plot.lm () .


1
Teşekkürler! Kaldıraç daha önce anlamadığım bir şey. Avg (x) 'e yakın, dolayısıyla yüksek varyansa sahip veriler için hiç veya çok az regresyon etkisi yoktur.
ccshao
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.