Bunu sormamın nedeni, dahili olarak öğrencileştirilmiş artıkların, ham tahmini kalıntılarla aynı örüntüye sahip gibi görünmeleridir. Birisi bir açıklama sunabilseydi harika olurdu.
Bunu sormamın nedeni, dahili olarak öğrencileştirilmiş artıkların, ham tahmini kalıntılarla aynı örüntüye sahip gibi görünmeleridir. Birisi bir açıklama sunabilseydi harika olurdu.
Yanıtlar:
Varsayalım bir regresyon modeli tasarım matrisi ile X (bir 1 için belirleyici faktörler, ardından kolon), tahminler y = x ( X ' X ) - 1 x ' y = H , Y ( H olan "hat- matris "), ve artıklar e = y - y . Regresyon modeli, gerçek hataların ϵ hepsinin aynı varyansa (homoskedastisite) sahip olduğunu varsayar :

Kalıntıların kovaryans matrisi . Bu, ham kalıntılar e i'nin farklı varyansları σ 2 ( 1 - h i i ) - σ 2 ( I - H ) matrisinin köşegenidir . Köşegen elemanları H hat-değerler h ı i .
Varyans 1 boyunca gerçekten standartlaştırılmış artıklar
Test alanlarınızda ne tür veriler yaptınız? Tüm varsayımlar tutulduğunda (veya yaklaştığında), ham ve öğrenci kalıntıları arasında çok fazla bir fark beklemezdim, ana avantajı, çok etkili noktaların olmasıdır. Pozitif doğrusal eğilimi ve oldukça etkili bir aykırı değeri olan bu (simüle edilmiş) verileri düşünün:

İşte ham artıklara karşı takılmış değerlerin grafiği:

Etkili noktamızın kalıntısının değerinin, geri kalan noktalardan minimum ve maksimum kalıntılardan 0'a daha yakın olduğuna dikkat edin (en aşırı 3 ham kalıntıda değildir).
Şimdi standartlaştırılmış (dahili olarak öğrenci) artıklara sahip arsa:
Bu arsada, standardize edilmiş kalıntı göze çarpmaktadır çünkü etkisi açıklanmıştır.