Ortalama Kareler Hatası ve Artık Kareler Toplamı


31

Vikipedi tanımlarına bakarak:

Bana öyle geliyor ki

MSE=1N-RSS=1N-Σ(fben-yben)2

burada örnek sayısıdır ve bizim .N-fbenyben

Ancak, Wikipedia makalelerinden hiçbiri bu ilişkiden bahsetmiyor. Niye ya? Bir şey mi kaçırıyorum?


6
Bunun yararsız ve düşmanca göründüğünü biliyorum, ama bariz olduğu için bundan bahsetmiyorlar. Ayrıca, burada biraz dikkatli olmak istiyorsun. Genellikle, gerçek ampirik çalışmalarda bir MSE ile karşılaştığınızda, , bölünmez, fakat , bölünür; burada , bazı regresyon modelinde sağ taraf değişkenlerin sayısıdır (kesişme dahil). R,SSN-R,SSN--KK
Bill,

10
@Bill: Evet, tam olarak Vikipedi ile bağlantılı makalelere yol açan bir ilişki türüdür. Özgürlüklerin derecesiyle ilgili düşünceniz, bunun açıkça belli olmadığını ve kesinlikle söylemeye değer bir şey olduğunu gösteriyor.
bluenote10

2
@Bill: Kabul, ancak barizlik çok özneldir. İstatistik / makine öğrenen gri alan, gösterim cehennemiyle doludur ve bu nedenle açık olması iyidir.
rnoodle

Yanıtlar:


30

Aslında Vikipedi'de Ortalama kare hata Regresyon bölümünde söz edilir :

Regresyon analizinde, ortalama kare hata terimi bazen hata varyansının tarafsız tahminine atıfta bulunmak için kullanılır: artık karelerin toplamı serbestlik derecelerinin sayısına bölünür.

Ayrıca burada bazı bilgileri de bulabilirsiniz: İstatistiklerdeki hatalar ve artıklar Bu, ortalama kareler hatası ifadesinin farklı durumlarda farklı anlama gelebileceğini söylüyor, bu bazen zor.


4

Ancak, Kare Erros (SSE) ve Kalıntı Kareler (RSS) toplamının bazen değişmeden kullanıldığını ve okurların kafasını karıştırdığını unutmayın. Örneğin , lineer regresyon hakkında daha fazla bilgi için bu URL’yi kontrol edin: https://365datascience.com/sum-squares/ .

İstatistiksel açıdan kesinlikle konuşursak, Hatalar ve Kalıntılar tamamen farklı kavramlardır. Hatalar esas olarak gerçek gözlemlenen örnek değerler ile öngörülen değerler arasındaki farkı ifade eder ve çoğunlukla Kök anlamına gelir Karekök Hatalar (RMSE) ve Ortalama Absollute Hataları (MAE) gibi istatistik ölçümlerinde kullanılır. Aksine, artıklar yalnızca bağımlı değişkenler ve doğrusal regresyondan elde edilen tahminler arasındaki farkları ifade eder.


0

MSE'nin RMSE'nin yüzdesi olduğunu düşünürsek, bunun doğru olduğunu sanmıyorum. Örneğin, tahminler ve gözlemlerle ilgili bir dizi örneklenmiş veriye sahipsiniz, şimdi doğrusal bir regresyon yapmaya çalışıyorsunuz: Observation (O) = a + b X Prediction (P). Bu durumda, MSE, O ve P arasındaki kare farkının toplamıdır ve örneklem büyüklüğü N'ye bölünür.

Ancak, doğrusal regresyonun nasıl performans gösterdiğini ölçmek istiyorsanız, Ortalama Kare Kalıntısını (MSR) hesaplamanız gerekir. Aynı durumda, ilk önce gerçek gözlem değerleri ile lineer regresyondan elde edilen tahmin edilen gözlemler arasındaki kareler arasındaki farkların toplamına karşılık gelen Artık Kareler Toplamı (RSS) hesaplanırdı. Sonra, RSS için N-2'ye bölünür . MSR'yi al.

Basitçe söylemek gerekirse, örnekte MSE, RSS / N kullanılarak tahmin edilemez, çünkü RSS bileşeni artık MSE'yi hesaplamak için kullanılan bileşen için aynı değildir.


1
Bu cevabı anlamıyorum.
Michael R. Chernick

Bahsedilen örneklenmiş tahmin örneğine ve gözlemlenen veri değerlerine dayanarak, doğrusal regresyon oluşturulmuştur: Gözlem (O) = a + b X Tahmin (P) (a, b sırasıyla kesişme ve eğimdir). Bu durumda, MSE = Σ (OP) ^ 2 / n, ki burada Σ (OP) ^ 2, Kare Erros (SSE) toplamı ve n, örneklem büyüklüğüdür. Ancak, Ortalama Kare Kalıntıları (MSR) = Σ (OO´) ^ 2 / n-2, Σ (OO) ^ 2, Kalan Toplam Kareler (RSS) ve O = a + b X P. MSR değerine eşittir ve RSS, genellikle lineer regresyonun genel önemini test etmek için kullanılır. Ayrıca not edin, SSE = Sistematik Erros (SE) + RSS, burada SE = Σ (PO´) ^ 2
Dr.CYY
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.