Varyans ve ortalama kare hatası arasındaki fark nedir?


27

Bunun daha önce sorulmadığına şaşırdım, ancak soruyu stats.stackexchange'te bulamıyorum.

Normalde dağıtılmış bir örneğin varyansını hesaplamak için kullanılan formül:

Σ(X-X¯)2n-1

Basit bir doğrusal regresyonda gözlemlerin ortalama kare hatasını hesaplayan formül:

Σ(yben-y^ben)2n-2

Bu iki formül arasındaki fark nedir? Görebildiğim tek fark, MSE'nin . Öyleyse, tek fark buysa, neden bunlara her ikisi de varyans olarak değil, farklı serbestlik derecelerinde değiniyoruz?n-2


Burada belli olmayan wikipedia sayfasının konusu nedir?
TrynnaDoStat 5:15

3
Varyans, gözlemlerin ortalamadan kare sapma ortalamasıdır. Buna karşın, MSE, tahminlerin gerçek değerlerden karelenmiş sapmalarının ortalamasıdır.
random_guy

3
Hem "varyans" hem de "kare hata" ortalamaları birden fazla formüle ve değişken uygulamalara sahiptir. Sorunuzu netleştirmek için (a) bu kavramları ne tür veriler uyguladığınızı ve (b) onlara formüller verdiğinizi açıklayabilir misiniz? (Muhtemelen bunu yaparken de sorunuzun cevabını da keşfedeceksiniz.)
whuber

6
Her ikisi de özel durumlar olan daha genel bir formül var: burada , elde edilmesinde tahmin edilen parametre sayısıdır s yΣben(yben-y^ben)2n-ppy^
Glen_b -Reinstate Monica

@Glen_b, bu genel formül hakkında daha fazla bilgi için referans verebilir misiniz?
trianta2

Yanıtlar:


28

OLS için yazdığınız ortalama kare hata bir şey saklıyor:

Σbenn(yben-y^ben)2n-2=Σbenn[yben-(β^0+β^xxben)]2n-2

Uyarı, her iki fonksiyonu üzerinde pay toplamları y ve x Eğer bu nedenle, her bir değişken için bir serbestlik derecesi kaybeder, böylece n-2 . Örneklem varyansı formülünde pay, tek bir değişkenin işlevidir, bu nedenle paydada yalnızca bir serbestlik derecesini kaybedersiniz.

Bununla birlikte, bunların kavramsal olarak benzer miktarlar olduğunu farketme yolundasınız. Örneklem varyansı, verilerin ortalamanın etrafına yayılmasını (kare birimler halinde), MSE ise verilerin örnek regresyon çizgisi etrafındaki düşey yayılımlarını (kare birimler halinde) ölçer.


@ amoeba Hey! İlginiz için teşekkürler. Bu düzenlemeyi isteyen resmi bir CV stili kılavuzu var mı? Eğer öyleyse bunu öğrenmek istiyorum. Olmazsa, Glen_b bir keresinde haklı olarak kişisel stil tercihlerimle kolonileştirdiğim için beni uyardı ve başkalarına Qs ve As olarak düzenledi. Ne düşünüyorsun? (Ve bunu kollegial bir tonda soruyorum: Düzenlemenizin bir şeyler eklediğini düşünüyorum. Düzenleme değerlerimizi daha iyi anlamak istiyorum.)
Alexis

1
Bu öneriyi yapan herhangi bir resmi CV tarzı kılavuz olduğunu sanmıyorum, ancak LaTeX'te doğrudan metin bloğunda işlenen satır içi formüller (bir dolar işareti ile işaretlenmiş) ve görüntülenen formüller (iki dolar işareti ile işaretlenmiş) var. ayrı bir satırda oluşturulur. Görüntülenen formüller farklı düzen kullanır. Formülünüz başlangıçta ayrı bir satırdaydı ancak bir dolar işareti ile işaretlendi; Bunun anlamlı olduğunu sanmıyorum. Ancak, kişisel tercihler konusunda haklısınız, bu nedenle özür dileriz. Düzenlememin nedeni, yine de Q'da bir yazım hatası düzeltmemdi.
amip Reinstate Monica

β0n-1n-2

1

nn-1nn-1

=β0+β1xxβ0β1n-2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.