Neden “Artık standart hata” diyoruz?


14

Bir standart hata tahmini standart sapma σ ( θ ) kestiricinin bir parametre için .σ^(θ^)θ^θ

Kalıntıların tahmini standart sapmasına neden summary.lm"artık standart sapma" değil , "artık standart hata" (örn. R fonksiyonunun çıktısında) denir ? Burada hangi parametre tahminini standart bir hatayla donatıyoruz?

Her bir kalıntıyı "kendi" hata terimi için bir tahminci olarak mı değerlendiriyor ve tüm bu tahmincilerin "havuzlanmış" standart hatasını tahmin ediyor muyuz?


6
Bence bu bir R şey. Başka yazılımların, örneğin 'artık standart sapma' ifadelerinin ders kitaplarında yaygın olarak kullanıldığını düşünmüyorum, örneğin. Cevabım yok, ama her zaman R'nin bu ifadeyi kullanmasının garip olduğunu düşündüm.
gung - Reinstate Monica

@gung: bu açıklama olabilir! Alıntılarda "artık standart hata" googling tırnak olmadan isabet sadece% 0.1 olsun ...
Michael M

İsterseniz (cevapsız) bir cevap olarak koyabilirim.
gung - Monica'yı eski

1
@gung bu özel yazılım kullanarak düşüncelerinizi şekillendirir komik: Ben asla "artık sd" olarak adlandırmazdım - artıklar veri değil, hatalar, bu yüzden artık hata doğru ad gibi görünüyor. Ama bunu düşünürseniz gerçekten bir R-şey gibi görünüyor.
Tim

2
@ Zaman, hataların standart sapmasının bir tahmini olarak kabul edilebilir , ancak artıklar teknik olarak hataların kendileri değildir. Ayrıca, değerinin ne olduğu için SD hatasının standart hatası da değildir.
gung - Monica'yı eski

Yanıtlar:


12

İfadenin R'nin summary.lm()çıktısına özgü olduğunu düşünüyorum . Temel değerin aslında "sigma" ( summary.lm()$sigma) olarak adlandırıldığına dikkat edin . Diğer yazılımların bu adı artıkların standart sapması için kullandığını düşünmüyorum. Buna ek olarak, örneğin 'artık standart sapma' ifadesi ders kitaplarında yaygındır. Bunun R'nin summary.lm()çıktısında kullanılan ifadenin nasıl geldiğini bilmiyorum , ama her zaman garip olduğunu düşündüm.


Nasıl summary.lm(reg)$sigmafarklı gelen sd(reg$residuals)?
hava saldırısı

3
@ AndréTerra, doğru özgürlük dereceleri n - p'dir, bu da özetin kullandığı şeydir. sd, n - 1 serbestlik derecesini kullanan var kullanır. Eğer n - p'ye bölünen artıkların standart sapmasını manuel olarak hesaplarsanız, özetin sağladığı cevapla aynı cevabı alırsınız.
Jdub

3
Gung'u doğrulamak için, aşağıdakilerin R belgelerinden alıntı yapıyorum stats::sigma: “Artık standart hata” yanlış adı, orada kolayca değiştirilebilecek çok fazla R (ve S) çıkışının bir parçası olmuştur.
NRH

2

Ekonometri eğitimimden buna "artık standart hata" denir çünkü gerçek "artık standart sapmanın" bir tahminidir. Bu terminolojiyi doğrulayan bu ilgili soruya bakın .

Artık standart hata terimi için bir Google araması da çok sayıda isabet gösterir, bu nedenle hiçbir şekilde bir R tuhaflığı değildir. Her iki terimi de tırnak işareti ile denedim ve her ikisi de yaklaşık 60.000 kez görünüyor.


İlginç. Ama neden herhangi bir rastgele değişkenin standart sapmasının tahminini (bir hata terimi gibi; belirli bir tahminci değil) "standart hata" olarak adlandırıyorsunuz?
Michael M

Benim düşüncem, tahmin için bir isme sahip olmamız gerektiğidir (gerçek değerden ayırt etmek için), herhangi bir isim diğeri kadar iyidir. Ancak, etimoloji hakkında daha bilgili biri daha iyi bir neden sunabilir. Katsayı tahmininin standart sapmasının tahmini olan katsayı standart hatasıyla kesinlikle paralel olduğunu unutmayın.
Heisenberg

0

Basitçe ifade etmek gerekirse, numunenin standart hatası, numune ortalamasının popülasyon ortalamasından ne kadar uzakta olabileceğinin bir tahminidir, oysa numunenin standart sapması, numune içindeki bireylerin numune ortalamasından ne kadar farklı olduğudur.

Standart hata - Vikipedi, özgür ansiklopedi


6
Bu doğrudur, ama aslında soruya cevap vermez. R'nin "artık standart hata" olarak adlandırdığı şey "örnek ortalamasının popülasyon ortalamasından ne kadar uzakta olabileceğine dair bir tahmin" değildir.
gung - Monica'yı eski

0

Uygun bir regresyon modeli, çalışmayı aynı XX değerleriyle sonsuz sayıda ( doğrusal model doğru olduğunda ) çoğaltırsanız, gözlemlenen yanıtların aracı olan nokta tahmini tahminleri oluşturmak için parametreleri kullanır .

Bu öngörülen değerler ile modele uymak için kullanılanlar arasındaki farka veri toplama işlemi kopyalanırken rastgele değişkenlerin özellikleri 0 vasıta olan " Artıklar " denir . Gözlenen artıklar daha sonra bu değerlerde değişkenliği tahmin etmek ve parametrelerin örnekleme dağılımını tahmin etmek için kullanılır.

Not:

Kalan standart hata tam olarak 0 olduğunda, model verilere mükemmel bir şekilde uyuyor (muhtemelen aşırı sığması nedeniyle).

Kalan standart hatanın koşulsuz yanıttaki değişkenlikten önemli ölçüde farklı olduğu gösterilemiyorsa, doğrusal modelin herhangi bir tahmin yeteneğine sahip olduğunu gösteren çok az kanıt vardır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.