Kademeli bir seçim yaptıktan sonra p değerleri neden yanıltıcıdır?


28

Örneğin doğrusal bir regresyon modeli düşünelim. Veri madenciliğinde, AIC kriterine göre kademeli bir seçim yaptıktan sonra, her gerçek regresyon katsayısının sıfır olduğunu belirten boş hipotezi test etmek için p değerlerine bakmak yanıltıcı olduğunu duydum. Modelde kalan tüm değişkenlerin sıfırdan farklı gerçek bir regresyon katsayısına sahip olduğu düşünülmeli. Biri bana nedenini açıklayabilir mi? Teşekkür ederim.



1
Gelen theoreticalecology.wordpress.com/2018/05/03/... , I AIC seçimi tip-I enflasyonu gösteren bir R kodu göstermektedir. Kademeli ya da global olması önemli değil, asıl mesele, model seçiminin temelde çoklu test olduğudur.
Florian Hartig

Yanıtlar:


33

AIC kriterine göre kademeli bir seçim yapıldıktan sonra, her gerçek regresyon katsayısının sıfır olduğunu belirten boş hipotezi test etmek için p-değerlerine bakmak yanıltıcıdır.

Gerçekten de, p değerleri, boş hipotezin doğru olduğu durumlarda, en az sahip olduğunuz kadar uç bir test istatistiği görme olasılığını temsil eder. Eğer H0 doğrudur, p-değeri, bir homojen dağılımına sahip olmalıdır.

Ancak, kademeli seçimden sonra (ya da gerçekten, model seçimine yönelik başka çeşitli yaklaşımlardan sonra), modelde kalan terimlerin p değerleri, sıfır hipotezinin doğru olduğunu bildiğimiz halde bile, bu özelliğe sahip değildir.

Bunun nedeni, küçük p-değerlerine sahip veya sahip olma eğiliminde olan değişkenleri seçmemizdir (kullandığımız kesin kriterlere bağlı olarak). Bu, modelde bırakılan değişkenlerin p değerlerinin, tek bir modele sahip olmamızın normalden çok daha küçük olduğu anlamına gelir. Seçimin, eğer gerçeklerin gerçek modelini içermesi veya gerçeklerin gerçek modelini yakından takip edebilecek kadar esnek olması durumunda, gerçek modelden daha iyi görünen ortalama seçim modellerinde olacağına dikkat edin.

[Ek olarak ve temelde aynı sebepten ötürü, kalan katsayılar sıfırdan uzak tutulur ve standart hataları önyargılıdır; bu da güven aralıklarını ve öngörülerini etkiler - tahminlerimiz örneğin çok dar olacaktır.]

Bu etkileri görmek için, bazı katsayıların 0 olduğu ve bazılarının olmadığı çoklu regresyon yapabiliriz, adım adım bir işlem uygulayabilir ve sonra sıfır katsayılı değişkenler içeren modeller için, sonuçta ortaya çıkan p-değerlerine bakabiliriz.

(Aynı simülasyonda katsayılar için tahminlere ve standart sapmalara bakabilir ve sıfır olmayan katsayılara karşılık gelenleri de keşfedebilirsiniz.)

Kısacası, normal p-değerlerini anlamlı olarak kabul etmek uygun değildir.

Bunun, modelde kalan tüm değişkenleri anlamlı bulması gerektiğini duydum.

Modeldeki adım adımdan sonra tüm değerlerin “önemli” olarak kabul edilip edilmemesi gerektiğine gelince, bunun ne kadar yararlı bir yol olacağından emin değilim. O zaman kastedilen "önem" nedir?


İşte stepAICRs'nin n = 100 ile 1000 benzetilmiş örnek üzerinde varsayılan ayarlarla çalıştırılması ve on aday değişken (bunların hiçbiri cevap ile ilgili değil). Her durumda modelde kalan terimlerin sayısı sayıldı:

görüntü tanımını buraya girin

Zamanın yalnızca% 15,5'i seçilen doğru modeldi; modelin geri kalanı sıfırdan farklı olmayan terimler içeriyordu. Aday değişkenler kümesinde sıfır katsayılı değişkenler olması gerçekten mümkün ise, modelimizde gerçek katsayının sıfır olduğu birkaç terimimiz olabilir. Sonuç olarak, hepsini sıfır olmayan olarak kabul etmek iyi bir fikir değildir.


"Modelde kalan tüm değişkenleri anlamlı olarak kabul etmem gerektiğini duydum" ifadesiyle: "Modelde bırakılan tüm değişkenlerin sıfırdan farklı bir gerçek regresyon katsayısına sahip olduğunu düşünmeliyim" cümlesiyle cümle
John M

Tamam; Bununla ilgili bir simülasyonun sonuçlarını ekledim.
Glen_b

10
+1 Bu hafta sonu aynı simülasyonları yapıyorum, model seçme yöntemleri üzerine bir sınıfa hazırlanmak için. Aynı sonuçları elde edip araştırdım.k=3 için 39 değişkenler ve kullanma 10kgözlemler. Bir sonraki adım, Bonferroni düzeltmesinin neler yapabileceğini görmek….
whuber

7
Gerçekten de, bir Bonferroni'nin (sorunun çeşitli yönleri üzerinde) ne gibi bir etkisinin olacağını görmek, yukarıdaki simülasyonu tamamlamadaki acil eğilimimdi, ama insanların adım adım yapma eğilimi göstermediği için ele almadım. burada. Model seçim yöntemlerini tartıştığını duymak beni çok etkiledi. Umarım biraz öğrenirim.
Glen_b -Regan Monica

@Glen_b: (Cevabınızdan alıntılanmıştır) Bu, modelde bırakılan değişkenlerin p değerlerinin tipik olarak tek bir modele sahip olsaydık bile olacağından çok daha küçük olduğu anlamına gelir " veriyi oluşturan, gerçek modelin boş olup olmadığı ". Vurgulanan kısmı biraz açıklayabilir misiniz? Veri oluşturma süreci (gerçek model) ile aynı özelliklere sahip modelde p değerlerinin daha küçük olması nasıl olabilir?
shani

8

Bir analoji yardımcı olabilir. Aday değişkenlerin gösterge (kukla) olması durumunda adım adım regresyon, birbirini dışlayan kategorileri temsil eden değişkenler (ANOVA'da olduğu gibi), hangi grupların en az farklı olduğunu tespit ederek hangi grupların birleştirileceğini seçmeye karşılık gelir.t-test. Orijinal ANOVA karşı test edildi iseFp-1,n-p-1 ancak son çökmüş gruplar karşı test edildi. Fq-1,n-q-1 nerede q<pOrtaya çıkan istatistik yok değil bir varF dağılımı ve yanlış pozitif olasılık kontrol dışı olacak.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.