“Şirket içi öğrenci kalıntıları” potansiyel tahmini veri noktalarını teşhis etmek için ham tahmini kalıntılara göre ne gibi avantajlar sunar?


Yanıtlar:


13

Varsayalım bir regresyon modeli tasarım matrisi ile X (bir 1 için belirleyici faktörler, ardından kolon), tahminler y = x ( X ' X ) - 1 x ' y = H , Y ( H olan "hat- matris "), ve artıklar e = y - y . Regresyon modeli, gerçek hataların ϵ hepsinin aynı varyansa (homoskedastisite) sahip olduğunu varsayar :y=Xβ+ϵX1y^=X(XX)1Xy=HyHe=yy^ϵ

homoskedasticity

Kalıntıların kovaryans matrisi . Bu, ham kalıntılar e i'nin farklı varyansları σ 2 ( 1 - h i i ) - σ 2 ( I - H ) matrisinin köşegenidir . Köşegen elemanları H hat-değerler h ı i .V(e)=σ2(IH)eiσ2(1hii)σ2(IH)Hhii

Varyans 1 boyunca gerçekten standartlaştırılmış artıklar e/(σ1hii)σ e/(σ^1hii)σ^

ϵ


İki farklı artık (ve dışarıdan öğrenilen kalıntılar) arasındaki tanım farklılıkları bana açıktır. Bununla birlikte, uygulamada, dahili olarak öğrencileşen artıkların tahmini kalıntılara kıyasla farklı bir örüntüye sahip olduğu vakalarla (en azından kendi verilerimle) karşılaştığımı sanmıyorum. Öte yandan, dışarıdan öğrenilen artıklar potansiyel olarak tahmini kalıntılardan farklı bir model sergileyebilir. * İki tür artık aynıdır demiyorum. Onların genel modellerinden bahsediyorum.

@AlexH. Eklediğim avantajın teorik olduğunu kabul ediyorum . Ham artıkların yanıltıcı olduğu simüle edilmiş ampirik bir durum oluşturmak ve öğrenci kalıntıları koşullu dağılımların daha doğru bir resmini sağlamak iyi bir ek olacaktır.
caracal

12

Test alanlarınızda ne tür veriler yaptınız? Tüm varsayımlar tutulduğunda (veya yaklaştığında), ham ve öğrenci kalıntıları arasında çok fazla bir fark beklemezdim, ana avantajı, çok etkili noktaların olmasıdır. Pozitif doğrusal eğilimi ve oldukça etkili bir aykırı değeri olan bu (simüle edilmiş) verileri düşünün:

resim açıklamasını buraya girin

İşte ham artıklara karşı takılmış değerlerin grafiği:

resim açıklamasını buraya girin

Etkili noktamızın kalıntısının değerinin, geri kalan noktalardan minimum ve maksimum kalıntılardan 0'a daha yakın olduğuna dikkat edin (en aşırı 3 ham kalıntıda değildir).

Şimdi standartlaştırılmış (dahili olarak öğrenci) artıklara sahip arsa:

resim açıklamasını buraya girin

Bu arsada, standardize edilmiş kalıntı göze çarpmaktadır çünkü etkisi açıklanmıştır.

x

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.