Bernoulli işlemindeki olasılığı 10 hataya kadar örnekleyerek tahmin etme: önyargılı mı?


15

10 başarısızlıkla karşılaşıncaya kadar örnekleme yaptığımız başarısızlık olasılığı q olan bir Bernoulli sürecimiz olduğunu varsayalım (ki bu küçük olacaktır, örneğin q 0.01 ) . Bu suretle olarak başarısızlık olasılığının tahmini q : = 10 / K burada N numune sayısıdır.qq0.0110q^:=10/NN

Soru : mi q bir önyargılı tahmin ait q ? Ve eğer öyleyse, düzeltmenin bir yolu var mı?q^q

Son numunenin başarısız olduğu konusunda ısrar etmenin tahmini önyargıya sokması.


5
Mevcut cevaplar asgari varyans tarafsız tahmin edicisini sağlamaktan kaçınmaktadır . Bkz negatif binom dağılımına Wikipedia makalesinin örnekleme ve nokta tahmini bölümü . (101)/(N1)
A. Webb

Yanıtlar:


10

Doğrudur q bir önyargılı tahminidir q anlamında E ( q ) q , ama mutlaka bu sizi caydırmak izin verilmemelidir. Bu kesin senaryo, daima tarafsız tahmin ediciler kullanmamız gerektiği fikrine karşı bir eleştiri olarak kullanılabilir, çünkü burada önyargı, yaptığımız belirli deneyin bir yapaylığıdır. Veriler, örnek sayısını önceden seçmiş olsaydık tam olarak göründükleri gibi, neden çıkarımlarımız değişmeli?q^qE(q^)q

İlginç bir şekilde, bu şekilde veri toplayacak ve daha sonra hem binom (sabit örnek boyutu) hem de negatif binom modelleri altında olabilirlik fonksiyonunu yazacak olsaydınız, ikisinin birbiriyle orantılı olduğunu görürdünüz. O Bu araçlar q elbette son derece mantıklı bir tahmindir negatif binom modeli altında gayet sıradan maksimum olabilirlik tahmindir.q^


Harika! Görünüşe göre (benim amacım için) bu önyargı bir sorun değil.
becky

9

Son örneğin tahminin önyargılı olduğu bir başarısızlık olduğu konusunda ısrar etmiyor, N'nin karşılığını alıyorN

Yani örneğinizde fakat E[10E[N10]=1q. Bu aritmetik ortalamanın harmonik ortalama ile karşılaştırılmasına yakındırE[10N]q

Kötü haber şu ki, küçüldükçe önyargı artabilir , ancak q zaten küçük olduğunda çok fazla değil . İyi haber, gerekli hata sayısı arttıkça önyargıların azalmasıdır. Görünüşe göre f başarısızlıklarına ihtiyacınız varsa , önyargı yukarıda çarpımsal bir f faktörü ile sınırlıdır.qqfküçükqiçin f - 1 ; ilk başarısızlıktan sonra durduğunuzda bu yaklaşımı istemezsiniz ff1q

başarısızlıktan sonra durmak , q = 0.01 ile E [ N alırsınız10q=0.01ama E[10E[N10]=100,q=0.001ileE[NalırsınızE[10N]0.011097q=0.001ama E[10E[N10]=1000. Kabaca bir10önyargıE[10N]0.001111 çarpım faktörü 109


7

Dsaxton cevabı bir tamamlayıcı olarak, burada örnekleme dağılımını gösteren R bazı simülasyonları q k = 10 ve q, 0 = 0.02 :q^k=10q0=0.02

n_replications <- 10000
k <- 10
failure_prob <- 0.02
n_trials <- k + rnbinom(n_replications, size=k, prob=failure_prob)
all(n_trials >= k)  # Sanity check, cannot have 10 failures in < 10 trials

estimated_failure_probability <- k / n_trials
histogram_breaks <- seq(0, max(estimated_failure_probability) + 0.001, 0.001)
## png("estimated_failure_probability.png")
hist(estimated_failure_probability, breaks=histogram_breaks)
abline(v=failure_prob, col="red", lty=2, lwd=2)  # True failure probability in red
## dev.off()

mean(estimated_failure_probability)  # Around 0.022
sd(estimated_failure_probability)
t.test(x=estimated_failure_probability, mu=failure_prob)  # Interval around [0.0220, 0.0223]

E gibi görünüyor [değişkenliğe oldukça küçük bir eğilim görecelidir, q .E[q^]0.022q^

q_hat histogramı


1
Bu gerçekten faydalı. Bu seviyede endişelenmeme değmez.
becky

2
Bu simülasyonu daha kısaca şöyle yazabilirsiniz10+rnbinom(10000,10,0.02)
A. Webb

@ A.Webb teşekkür ederim, bu iyi bir nokta. Tekerleği gerçekten yeniden keşfediyordum. Okumam gerekiyor? Rnbinom ve sonra yazımı düzenleyeceğim
Adrian

1
Bu olurdu 10/(10+rnbinom(10000,10,0.02)). Parametreleme, toplam deneme sayısı yerine başarı / başarısızlık sayısı bakımından yapılır, bu nedenle k = 10'u tekrar eklemeniz gerekir. Nötr tahmin edicinin 9/(9+rnbinom(10000,10,0.02))pay ve paydada bir tane daha az olacağını unutmayın.
A. Webb
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.