Bir makalede örnek boyutunun standart sapması için formül buldum
burada , ana örnekten ortalama alt örnek aralığıdır (boyut ). sayısı nasıl hesaplanır? Bu doğru sayı mı? 62.534
Bir makalede örnek boyutunun standart sapması için formül buldum
burada , ana örnekten ortalama alt örnek aralığıdır (boyut ). sayısı nasıl hesaplanır? Bu doğru sayı mı? 62.534
Yanıtlar:
Pdf ile bir dağılımından bağımsız değerlerden oluşan bir örnekte , ve uçlarının ortak dağılımının pdf'si ile orantılı
(Orantılılık sabiti, çok terimli katsayı . Sezgisel olarak, bu ortak PDF, aralıktaki en küçük değeri bulma şansını ifade eder. , aralığındaki en büyük değer ve aralarındaki orta değerleri aralığındadır . Tüm sürekli olduğu için, ile bu orta aralığı yerini alabilir ve böylece olasılık sadece bir "sonsuz" miktarı ihmal. İlişkili olasılıklar, diferansiyel birinci derecede, olan ve , şimdi formülün nereden geldiğini açıkça ortaya koyuyor.)
aralığında beklenti almak, standart sapma ve ile Normal dağılım için verir . katları olarak beklenen aralık , numune boyutuna bağlıdır :
Bu değerler, sayısal entegrasyonu ile hesaplanamaz edildi üzerinde , standart Normal CDF'ye ayarlanmış ve standart sapmasına bölünmüştür (sadece ).
Beklenen aralık ile standart sapma arasında benzer bir çarpımsal ilişki, herhangi bir konum ölçeğinde dağılım ailesi için geçerli olacaktır, çünkü bu sadece dağıtım şeklinin bir özelliğidir . Örneğin, düzgün dağılımlar için karşılaştırılabilir bir grafik:
ve üstel dağılımlar:
Önceki iki grafikteki değerler , her durumda ve nispeten basit cebirsel formları nedeniyle mümkün olan tam - sayısal değil - entegrasyon ile elde edilmiştir . Homojen dağılımlar için bunların eşit ve üstel dağılımlar için bunlar burada Euler sabitidir ve "poligamma" işlevidir, Euler Gamma işlevinin logaritmik türevidir.
(Bu dağılımlar şekillerin bir geniş ekran için) bu farklı olmasına rağmen, üç kabaca yaklaşık kabul çarpanı gösteren, şekline büyük ölçüde bağlı değildir ve bu yüzden, bir otobüs, standart sapma sağlam değerlendirme olarak görev yapabilir küçük alt numunelerin aralıkları bilindiğinde. (Gerçekten de, üç serbestlik derecesine sahip çok ağır kuyruklu Student dağılımının , çok uzak olmayan için civarında bir çarpanı var .)
Bu yaklaşım, gerçek örnek standart sapmasına çok yakındır. Bunu göstermek için hızlı bir R betiği yazdım:
x = sample(1:10000,6000,replace=TRUE)
B = 100000
R = rep(NA,B)
for(i in 1:B){
samp = sample(x,6)
R[i] = max(samp)-min(samp)
}
mean(R)/2.534
sd(x)
hangi verir:
> mean(R)/2.534
[1] 2819.238
>
> sd(x)
[1] 2880.924
Şimdi bunun neden işe yaradığından emin değilim (ama en azından (yüz değerinde) yaklaşımın iyi olduğu anlaşılıyor.
Düzenleme: Bunun neden işe yaradığına dair @ Whuber'ın olağanüstü yorumuna (yukarıda) bakın
mean(R)/2.474
sd(x)