Cook'un mesafe grafiklerini nasıl okuyabilirim?


40

7., 16. ve 29. noktaların etkili nokta olup olmadığını bilen var mı? Bir yerlerde, Cook'un mesafesi 1'den düşük olduğundan, olmadıklarını okudum. Ben haklı mıyım?

görüntü tanımını buraya girin


1
Çeşitli görüşler var. Bazıları gözlem sayısıyla veya parametre sayısıyla ilgilidir. Bunlar en.wikipedia.org/wiki/… adresinde çizilmiştir .
whuber

@whuber Teşekkürler. Bu benim için veri araştırma yaparken her zaman gri bir alandır. Yukarıdaki veri noktası 16, model sonuçlarını büyük ölçüde etkiler, böylece Tip I hatalarını arttırır.
Platypezid

2
Biri "Tip III" hatalarını da arttırdığını, bunun da (genel ve gayrı resmi olarak), temel olasılık modelinin uygulanamamasıyla ilgili hatalar olduğunu iddia edebilir.
whuber

@whuber evet, çok doğru!
Platypezid

Yanıtlar:


43

Bazı metinler size Cook'un mesafesinin 1'den yüksek olduğu noktaların etkili sayılacağını söyler. Diğer metinler size veya eşiğini verir ; burada , gözlemlerin sayısıdır ve , açıklayıcı değişkenlerin sayısıdır. Sizin durumunuzda, ikinci formül 0.1 civarında bir eşik vermelidir.4/N4/(Nk1)Nk

John Fox (1), regresyon teşhisi kitabında, sayısal eşikler söz konusu olduğunda oldukça temkinlidir. Grafiklerin kullanılmasını ve "diğerlerinden büyük ölçüde D değerleri" olan noktaları daha ayrıntılı olarak incelemesini tavsiye eder. Fox'a göre, eşikler sadece grafiksel gösterimleri geliştirmek için kullanılmalıdır.

Sizin durumunuzda gözlemler 7 ve 16 etkili olarak kabul edilebilir. En azından onlara daha yakından bakardım. Gözlem 29, birkaç diğer gözlemden büyük ölçüde farklı değildir.


(1) Tilki, John. (1991). Regresyon Teşhisi: Bir Giriş . Adaçayı Yayınları.


9
+1 Özeti temizle. Ben parametresini bırakacaktı veri kümesi onların çıkarılması temelde değişmemiş tahmin zaman o nüfuzlu vakalar genellikle bir sorun değildir eklersiniz: Biz Merak olanlar hakkında Varlığı gerçekten olanlardır gelmez sonuçları değiştirin.
whuber

1
@lejohn Yanıtınız için çok minnettarım. Whuber cevabında doğru mükemmel açıklıktır. Bu çok bilgilendirici. Size Fox'un görüşlerini ve wikipedia sayfasındaki görüşlerinizi vurgulamanızı öneririm!
Platypezid

29

Her ikisi de @lejohn ve @whuber için +1. @ Whuber'nın yorumuna biraz genişletmek istedim. Cook'un mesafesi dfbeta ile karşılaştırılabilir. Cook'un mesafesi , söz konusu gözlem veri setinden çıkarılırsa ortalama olarak tahmin edilen y değerlerinin ne kadar uzağa gideceği anlamına gelir . dfbeta, söz konusu gözlem veri setinden çıkarılırsa bir parametre tahmininin ne kadar değiştiğini belirtir . değişkenleri ile birlikte dfbeta olacağına dikkat edin ( her değişken için kesişme, ve 1 ). Prediktif modelleme yapıyorsanız Cook'un mesafesi muhtemelen sizin için daha önemliyken, açıklayıcı modellemede dfbeta daha önemlidir. kk+1β0β

Burada yapmaya değer bir nokta daha var. Gözlemsel araştırmada, yordayıcı alan boyunca düzenli olarak örnekleme yapmak zordur ve belirli bir alanda yalnızca birkaç noktaya sahip olabilirsiniz. Bu tür noktalar diğerlerinden ayrılabilir. Birkaç farklı vakaya sahip olmak rahatsız edici olabilir, ancak aykırı aykırılıklar düşmeden önce kayda değer bir düşünceye değer. Öngörüler arasında yasal bir etkileşim olabilir veya tahminde bulunma değerleri aşırı olduğunda sistem farklı davranmaya başlayabilir. Ek olarak, colinear prediktörlerin etkilerini çözmenize yardımcı olabilirler. Etkili noktalar kılık değiştirmiş bir lütuf olabilir.


6
+1 "Tahmine dayalı modelleme yapıyorsanız Cook'un mesafesi muhtemelen sizin için daha önemlidir, oysa açıklayıcı modellemede dfbeta daha önemlidir": bu çok yararlı bir tavsiyedir.
Anne Z.

Merhaba - ilginç tartışma. Fakat örneğin gözlem 16'daki etkiyi ölçmek için yapay bir değişkeni kullanmak mantıklı olamaz mı?
Pantera

@Pantera 16'yı çıkardım ve önleme-sonrası öncesi modelleri karşılaştırdım
Platypezid

Merhaba - Eğer gözlemleri kaldırırsanız, bunu yapmak için "iyi" bir tartışmanız olduğundan emin olmalısınız, örneğin gözlem yanlış ölçülür. Eğer sadece bazı istatistiksel problemler yaptıkları için gözlem atarsak, o zaman veri madenciliğine yaklaşıyoruz.
Pantera
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.