Çok küçük örneklem büyüklüğü ile regresyon


9

4'ten 5'e kadar açıklayıcı değişkenle regresyon yapmak istiyorum, ancak sadece 15 gözlemim var. Bu değişkenlerin normal olarak dağıtıldığını varsaymamak, parametrik olmayan veya başka bir geçerli regresyon yöntemi var mı?


5
Açıklayıcı değişkenlerin herhangi birinin normal olduğu varsayımı yoktur. Yanıtın marjinal dağılımı hakkında da bir varsayım yoktur. CI veya hipotez testleri yapıyorsanız, olağan çıkarım yanıtın koşullu normalliğini varsayar. Daha önemlisi, doğrusallık ve sabit varyans varsayımlarıdır. Yanıtınız nelerden oluşuyor (/ neden normal olmayacak)?
Glen_b-Monica'yı yeniden başlat

3
Hayır. Yeterli veriniz yok. Bu keşifsel bir analiz. Müstehcen ilişkiler iyi görmüş olabilirsiniz. Ancak p değerlerinden, güven aralıklarından ve hipotez testlerinden kaçınmalısınız.
charles

Yanıtlar:


10

@ Glen_b, regresyon 1'deki normallik varsayımının doğası hakkında haklıdır .

Bence en büyük probleminiz 4 ila 5 açıklayıcı değişkeni destekleyecek yeterli veriye sahip olmayacağınızdır. Başparmak 2'nin standart kuralı, açıklayıcı değişken başına en az 10, yani davanızda 40 veya 50 veriye sahip olmanızdır (ve bu, varsayımlar hakkında herhangi bir sorunun olmadığı ideal durumlar içindir). Çünkü modeliniz tamamen doygun olmazdı 3(sığacak parametrelerden daha fazla veriniz varsa), parametre (eğim vb.) tahminleri alabilirsiniz ve ideal koşullar altında tahminler asimptotik olarak tarafsızdır. Bununla birlikte, tahminlerinizin gerçek değerlerden çok uzak olması ve SE'lerin / CI'larınızın çok büyük olması muhtemeldir, bu nedenle istatistiksel gücünüz olmayacaktır. Parametrik olmayan veya başka bir alternatif kullanarak, regresyon analizinin sizi bu sorundan kurtaramayacağını unutmayın.

Burada yapmanız gerekenler ya alanınızdaki ya da önsezinizdeki önceki teorilere dayanarak tek bir açıklayıcı değişken (verilerinize bakmadan önce!) Seçmektir ya da açıklayıcı değişkenlerinizi birleştirmelisiniz. İkinci seçenek için makul bir strateji, bir temel bileşenler analizi (PCA) çalıştırmak ve açıklayıcı değişkeniniz olarak ilk prensip bileşenini kullanmaktır.

Kaynaklar:
1. Kalanlar normal olarak dağıtılırsa, ancak Y dağıtılmazsa ne olur?
2. Çoklu regresyon için minimum örnek büyüklüğü için temel kurallar
3. Çoklu regresyon denklemine girilebilecek maksimum bağımsız değişken sayısı

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.