İlk olarak, cevap için bu sitede arama yaptığımı belirtmeliyim. Soruma cevap veren bir soru bulamadım ya da bilgi seviyem o kadar düşük ki cevabı zaten okuduğumu fark etmedim.
AP İstatistik Sınavı için okuyorum. Doğrusal regresyonu öğrenmek zorundayım ve konulardan biri artıklar. İstatistik ve Veri Analizine Giriş sayfasının 253. sayfasında bir kopyası var .
İki değişkenli veri kümesindeki olağandışı noktalar, dağılım grafiğindeki diğer noktaların çoğundan yönünde veya y yönünde düşen noktalardır.
Gözlem, verilerin geri kalanından ( x yönündeki verilerin geri kalanından ayrılır) uzakta bir x değerine sahipse potansiyel olarak etkili bir gözlemdir . Gözlemin gerçekten etkili olup olmadığını belirlemek için, bu gözlemin kaldırılmasının eğim değeri veya en az kare çizginin kesişmesi üzerinde büyük bir etkisi olup olmadığını değerlendiririz.
Bir gözlem, büyük bir kalıntıya sahipse bir aykırı değerdir . Aykırı gözlem yönündeki en küçük kare çizgiden çok uzaktadır .
Stattreck.com , artıklardan bir aykırı değer belirlemek için dört yöntem belirtir:
Genel kalıptan büyük bir şekilde sapan veri noktalarına aykırı değerler denir. Bir veri noktasının aykırı olarak değerlendirilmesinin dört yolu vardır.
- Diğer veri noktalarına kıyasla aşırı bir X değerine sahip olabilir.
- Diğer veri noktalarına kıyasla aşırı Y değerine sahip olabilir.
- Aşırı X ve Y değerlerine sahip olabilir.
- Aşırı X veya Y değerleri olmasa bile verilerin geri kalanından uzak olabilir.
Bu iki kaynak birbiriyle çelişiyor gibi görünüyor. Herkes kafa karışıklığımı gidermeye yardımcı olabilir. Ayrıca, aşırı nasıl tanımlanır. AP İstatistikleri, veri noktası (Q1-1.5IQR, Q3 + 1.5IQR) dışındaysa, bir aykırı değerse kuralı kullanır. Bunu sadece artıklardan kalan bir grafikten nasıl uygulayacağımı bilmiyorum.