Vikipedi tanımlarına bakarak:
- Ortalama Kare Hatası (MSE)
- Kalan Kareler Toplamı (RSS)
Bana öyle geliyor ki
burada örnek sayısıdır ve bizim .
Ancak, Wikipedia makalelerinden hiçbiri bu ilişkiden bahsetmiyor. Niye ya? Bir şey mi kaçırıyorum?
Vikipedi tanımlarına bakarak:
Bana öyle geliyor ki
burada örnek sayısıdır ve bizim .
Ancak, Wikipedia makalelerinden hiçbiri bu ilişkiden bahsetmiyor. Niye ya? Bir şey mi kaçırıyorum?
Yanıtlar:
Aslında Vikipedi'de Ortalama kare hata Regresyon bölümünde söz edilir :
Regresyon analizinde, ortalama kare hata terimi bazen hata varyansının tarafsız tahminine atıfta bulunmak için kullanılır: artık karelerin toplamı serbestlik derecelerinin sayısına bölünür.
Ayrıca burada bazı bilgileri de bulabilirsiniz: İstatistiklerdeki hatalar ve artıklar Bu, ortalama kareler hatası ifadesinin farklı durumlarda farklı anlama gelebileceğini söylüyor, bu bazen zor.
Ancak, Kare Erros (SSE) ve Kalıntı Kareler (RSS) toplamının bazen değişmeden kullanıldığını ve okurların kafasını karıştırdığını unutmayın. Örneğin , lineer regresyon hakkında daha fazla bilgi için bu URL’yi kontrol edin: https://365datascience.com/sum-squares/ .
İstatistiksel açıdan kesinlikle konuşursak, Hatalar ve Kalıntılar tamamen farklı kavramlardır. Hatalar esas olarak gerçek gözlemlenen örnek değerler ile öngörülen değerler arasındaki farkı ifade eder ve çoğunlukla Kök anlamına gelir Karekök Hatalar (RMSE) ve Ortalama Absollute Hataları (MAE) gibi istatistik ölçümlerinde kullanılır. Aksine, artıklar yalnızca bağımlı değişkenler ve doğrusal regresyondan elde edilen tahminler arasındaki farkları ifade eder.
MSE'nin RMSE'nin yüzdesi olduğunu düşünürsek, bunun doğru olduğunu sanmıyorum. Örneğin, tahminler ve gözlemlerle ilgili bir dizi örneklenmiş veriye sahipsiniz, şimdi doğrusal bir regresyon yapmaya çalışıyorsunuz: Observation (O) = a + b X Prediction (P). Bu durumda, MSE, O ve P arasındaki kare farkının toplamıdır ve örneklem büyüklüğü N'ye bölünür.
Ancak, doğrusal regresyonun nasıl performans gösterdiğini ölçmek istiyorsanız, Ortalama Kare Kalıntısını (MSR) hesaplamanız gerekir. Aynı durumda, ilk önce gerçek gözlem değerleri ile lineer regresyondan elde edilen tahmin edilen gözlemler arasındaki kareler arasındaki farkların toplamına karşılık gelen Artık Kareler Toplamı (RSS) hesaplanırdı. Sonra, RSS için N-2'ye bölünür . MSR'yi al.
Basitçe söylemek gerekirse, örnekte MSE, RSS / N kullanılarak tahmin edilemez, çünkü RSS bileşeni artık MSE'yi hesaplamak için kullanılan bileşen için aynı değildir.