Standardizasyon varyansının öğrencileşme sırasında bilinmesi bilinmemektedir ve bu nedenle tahmin edilmiştir? Teşekkür ederim.
Standardizasyon varyansının öğrencileşme sırasında bilinmesi bilinmemektedir ve bu nedenle tahmin edilmiştir? Teşekkür ederim.
Yanıtlar:
Kısa bir özet. Verilen örnek , burada X, bir n x P , β = ( X ' X ) - 1 x ' y ve y = x β = X ( X ' X ) - 1 x ' y = H y , burada H = X ( X ′ X " şapka matrisi "dir. Yüzeyde kalan olan E = y - y = y - H y = ( I - H ) Y kitle varyansı σ 2 bilinmemektedir ve tahmin edilebilir M S , E , ortalama kare hatası.
Semistudentized artıklar olarak tanımlanmıştır , ancak, artıkların varyansı iki bağlı olduğuσ2veX, tahmin edilen varyansı:V(ei)=KSD(1-hii) buradahııolanIinci çapraz eleman şapka matrisi.
Dahili olarak öğrenci kalıntısı olarak da adlandırılan standart artıklar şunlardır:
Bununla birlikte tek bir ve M S E , yani sigara bağımsız r ı bir olamaz t dağılımı. Prosedür silmek için daha sonra i inci gözlem kalan regresyon fonksiyonu uygun N - 1 gözlem ve yeni elde Y ile temsil edilebilir 's y ı ( i ) . Farkı: d i = y ı - y ı ( i ) olarak adlandırılır
Bkz. Kutner ve ark., Uygulamalı Doğrusal İstatistiksel Modeller , Bölüm 10.
Düzenleme: rpierce tarafından cevap mükemmel olduğunu söylemeliyim. OP'nin standartlaştırılmış ve öğrencileştirilmiş artıklarla ilgili olduğunu düşündüm (ve standart artıkların bana garip görünmesini sağlamak için nüfus standart sapmasına böldüm), ama yanılmışım. Umarım OT olsa bile cevabım birine yardım edebilir.
Bununla birlikte, alanlar arasında bazı terminolojik farklılıklar olduğu görülmektedir (lütfen bu cevaptaki yorumlara bakın). Bu nedenle, bu ayrımlarda dikkatli olunmalıdır. Dahası, öğrenci puanlarına nadiren böyle denir ve kişi genellikle regresyon bağlamında 'öğrenci' değerleri görür. @Sergio, cevabında bu tür öğrenci silinen artıklar hakkında ayrıntılar veriyor.
Bu soruya cevap vermek için çok geç kaldım !! Ama cevabı çok basit bir dilde bulamadık, bu yüzden mütevazi bir cevap vermeye çalışın.
Neden standardizasyon yapıyoruz? İki modeliniz olduğunu düşünün.
artıkların her ikisinin de farklı birimlerde olduğunu anlamak zor olurdu. Bu yüzden onları standartlaştırıyoruz. (Z-skoruna benzer teori)
Standart kalıntılar: - Kalıntılar standart sapma tahmini ile bölündüğünde. Genel olarak mutlak değer> 3 ise endişe sebebidir.
Bunu modeldeki aykırı değerleri araştırmak için kullanıyoruz.
Öğrenci Kalıntısı: Bunu modelin kararlılığını incelemek için kullanıyoruz.
İşlem basittir. Bireysel test senaryosunu modelden kaldırırız ve yeni öngörülen değeri buluruz. Yeni değer ile orijinal gözlemlenen değer arasındaki fark, standart hatanın bölünmesiyle standardize edilebilir. bu değer kalan Öğrenci
R kullanarak statik bilgileri keşfetmek için daha fazla bilgi için - http://www.statisticshell.com/html/dsur.html
Wikipedia, https://en.wikipedia.org/wiki/Normalization_(statistics) adresinde iyi bir genel bakışa sahiptir :