4'ten 5'e kadar açıklayıcı değişkenle regresyon yapmak istiyorum, ancak sadece 15 gözlemim var. Bu değişkenlerin normal olarak dağıtıldığını varsaymamak, parametrik olmayan veya başka bir geçerli regresyon yöntemi var mı?
4'ten 5'e kadar açıklayıcı değişkenle regresyon yapmak istiyorum, ancak sadece 15 gözlemim var. Bu değişkenlerin normal olarak dağıtıldığını varsaymamak, parametrik olmayan veya başka bir geçerli regresyon yöntemi var mı?
Yanıtlar:
@ Glen_b, regresyon 1'deki normallik varsayımının doğası hakkında haklıdır .
Bence en büyük probleminiz 4 ila 5 açıklayıcı değişkeni destekleyecek yeterli veriye sahip olmayacağınızdır. Başparmak 2'nin standart kuralı, açıklayıcı değişken başına en az 10, yani davanızda 40 veya 50 veriye sahip olmanızdır (ve bu, varsayımlar hakkında herhangi bir sorunun olmadığı ideal durumlar içindir). Çünkü modeliniz tamamen doygun olmazdı 3(sığacak parametrelerden daha fazla veriniz varsa), parametre (eğim vb.) tahminleri alabilirsiniz ve ideal koşullar altında tahminler asimptotik olarak tarafsızdır. Bununla birlikte, tahminlerinizin gerçek değerlerden çok uzak olması ve SE'lerin / CI'larınızın çok büyük olması muhtemeldir, bu nedenle istatistiksel gücünüz olmayacaktır. Parametrik olmayan veya başka bir alternatif kullanarak, regresyon analizinin sizi bu sorundan kurtaramayacağını unutmayın.
Burada yapmanız gerekenler ya alanınızdaki ya da önsezinizdeki önceki teorilere dayanarak tek bir açıklayıcı değişken (verilerinize bakmadan önce!) Seçmektir ya da açıklayıcı değişkenlerinizi birleştirmelisiniz. İkinci seçenek için makul bir strateji, bir temel bileşenler analizi (PCA) çalıştırmak ve açıklayıcı değişkeniniz olarak ilk prensip bileşenini kullanmaktır.
Kaynaklar:
1. Kalanlar normal olarak dağıtılırsa, ancak Y dağıtılmazsa ne olur?
2. Çoklu regresyon için minimum örnek büyüklüğü için temel kurallar
3. Çoklu regresyon denklemine girilebilecek maksimum bağımsız değişken sayısı