Veri uyumu dağıtımı için minimum 20 örnek büyüklüğünün dikkate alınmasını öneren referanslarım var.
Bunda bir anlam var mı?
Teşekkürler
Veri uyumu dağıtımı için minimum 20 örnek büyüklüğünün dikkate alınmasını öneren referanslarım var.
Bunda bir anlam var mı?
Teşekkürler
Yanıtlar:
Bunların çoğu beklenen dağılıma ve araştırma sorunuzun ne olduğuna bağlıdır. Pratik bir kural olarak, temel kurallara karşı dikkatli olmalısınız. Beklenen dağılımı biliyorsanız, farklı boyutlarda bazı simülasyonlar çalıştırın ve örnek simülasyonların gerçek dağılımı ne sıklıkta yansıttığını belirleyin. Bu, gerekli son numune boyutu olarak size rehberlik etmelidir.
Örneklem büyüklüğü sihirli sayısının 1000 olduğunu düşündüm. ABD ulusal anketlerinin çoğunun sahip olduğu hata payı yaklaşık% 3'tür: Gerçekte, etkili örnek boyutları daha düşüktür Eşit olmayan seçim olasılığı ve yanıtsız ayarlamalar nedeniyle 1.000'den fazla, yaklaşık 700 gibi, bu da% 3.7'lik hata payına yol açıyor.
Sadece 20 gözlemle, teknik olarak çok yüksek çarpıklık ve basıklık değerleri alamazsınız (elbette örnek standart sapmalar tarafından normalleştirilir):
Dağıtım yuvada başka görüş çekirdek yoğunluğu hesaplama yoluyla alınabilir: boyuttaki örneği için , en popüler kural bant genişliğini verir Gauss çekirdeğini kullanarak tüm dağılımı etkili bir şekilde kapsayan . Başka bir deyişle, belirgin bir basıklık olmadığı sürece çekirdek büyüklüğü tahminini çalıştırırsanız 20 büyüklüğündeki çoğu örnek normal görünecektir (bu, çekirdek yoğunluğunda ayrı yumrular olarak ortaya çıkacak bazı gözlemler olduğu anlamına gelir) arsa).saat = 1.06 σ n - 1 / 5 = 0.58 σ
Hayır! Uzaktan değil.
Şöyle düşünün: milyar boyutlu bir alanınız (insanlık) varsa ve hangi yöntemi (20 kişi) kullanarak 20 örnek çıkardıysanız, kazandığınız bilgileri kullanarak gezegendeki her insanı makul bir şekilde iyi anlayabilir misiniz? Uzaktan değil. Samanyolu galaksisinde 100 milyar yıldız var. 20 tanesini (rastgele) seçerek tüm galaktik astronomiyi anlayabiliyor musunuz? Asla.
1-boyutlu bir alanda kaç tane ölçüm yapmak istediğinizi açıklayan bazı sezgisel tarama, çoğunlukla geçerli başparmak kuralları vardır. Bunlar, çeşitli derecelerde fayda ve gerekçe içerir, ancak bir anlamda "20" den daha iyi korunurlar. Bunlar "uyum denkleminizde değişken başına 5 ölçüm", "Gauss yoğunluk fonksiyonundan en az 35 örnek" ve "binom fonksiyonundan en az 300 örnek" içerir. Benim gibi bir inek bombacısı değil gerçek istatistikçiler, ilk güvencesinden ve hesap makinesinden belirli güven aralıklarını ve belirsizlikleri ilişkilendirebilecektir.
"Uyum denkleminizde parametre başına 5 ölçüm" kuralını kullanırsanız ve yüksekliklerin dağılımı açısından 2 boyutlu kavisli bi-kübik yüzeyin kümülatif yoğunluğuna uymak istiyorsanız, , 5. dereceden bir polinomun kübik oran. 6 + 4 = 10 katsayısı olacaktır. Her parametre için 2 ölçüm kullanarak veya 20 ölçüm kullanarak 10 parametre değerlerinizi sığdırmaya çalışıyorsanız, bu buluşsal yöntemi ihlal edersiniz. Bu buluşsal yöntem minimum 10 * 5 = 50 ölçüm yapılmasını önerir.
"En iyinin", "iyilik ölçüsü" olmadan anlamsız bir fikir olduğunu lütfen unutmayın. En iyi yol nedir? Eğer kıyametinize gidiyorsanız, belki de son derece uzun ve hoş bir şey. Kendi taç giyme töreninize gidecekseniz, belki kısa ve muhteşem bir taç giyme törenine gidersiniz. Çölde yürürseniz, havalı gölgeli bir çöl. "En iyi" örnek sayısı nedir? Probleminize o kadar çarpıcı bir şekilde bağımlı ki, ondan önce otorite ile cevaplanmaya başlayamaz. Hepsi? Yapabildiğin kadar çok? Bunlar sadece küçük bir anlam ifade ediyor. Evet, kısmen ölü ya da hamile olmak gibidir. Kısmen anlamsız olmak, çok az tanımlanmış bir sorunun sonucudur.
Bir uçaktaki hava akışını doğru bir şekilde tahmin etmeye çalışıyorsanız? Top parkına girmek için birkaç milyon ölçüm gerekebilir. Ne kadar uzun olduğunuzu bilmek istiyorsanız, bir ya da iki işi yapabilir.
Bu, "uzay tahminini" ve "parametre tahminlerindeki varyansı en aza indiren konumlarda örneklemeyi" önemli noktalara getirmez, ancak soru daha birinci sınıf bir cevabın alakalı olacağını ileri sürdü. Bu şeyler, uygulanmadan önce sorunun doğası hakkında daha fazla bilgi sahibi olmayı gerektirir.
Not: öneri başına iyileştirmek için düzenlendi.
Belki de t-testleri veya ANOVAR yaptığınız bağlam için - temel istatistiksel uygulamalarda oldukça yaygın bir bağlam - her bir grubun ortalamalarına yaklaşık olarak daha fazla güven duymak için her grup için ihtiyacınız olan örnek büyüklüğü dağıtımın az ya da çok unimodal olduğu ve aşırı peaky olmadığı varsayıldığında normal olarak dağıtılır (merkezi limit teoremine göre). Yirmi ve on dokuz veya yirmi bir değil, çünkü bu yuvarlak bir sayıdır.
Konuyla ilgili bazı makaleler için Russ Lenth'ın Güç ve Örnek Boyutu Sayfasını kontrol edin (sayfanın ortasındaki Tavsiye bölümünde).
Numunenizdeki minimum kişi sayısı, popülasyon büyüklüğüne, boyut sayısına (verileri kategorilere ayırıyorsanız) ve ölçütlere (aldığınız örnek bireyler hakkında sürekli önlemler alıyorsanız), evreniniz, kullanmayı düşündüğünüz analiz tekniği (bu çok önemli bir noktadır - teknik, çalışmanın planlanması sırasında veya deneysel tasarım sırasında , daha sonra değil) ve önceki çalışmalarda gösterilen karmaşıklıktır.
Ve 20, "nadir hastalıklar" ve "deneysel psikoloji" (çalışmalarında tanımlanan Popper olarak psişik) konular dışında ciddi bir araştırma için yeterli değildir.
Ve 20, "nadir hastalıklar" ve "deneysel psikoloji" (çalışmasında tanımlanmış Popper olarak psişik) konularının dışındaki bir olasılık dağılımının takılmasını içeren ciddi bir araştırma için yeterli değildir .
Ve hayır, insanları büyük bir örnek büyüklüğüne ulaşmak için zehirlemeye devam etmemelisiniz. Ortak Anlam ve Sıralı Testler durmanızı emreder.