Takip yorumunuza dayanarak, gerçek hata varyansı sabit olmadığında sürekli hata varyansı varsaydığınızda bir güven aralığının kapsama olasılığını tahmin etmeye çalıştığınız anlaşılıyor.
Bunu düşündüğüm şekilde, her çalışma için güven aralığı ya gerçek değeri kapsıyor ya da etmiyor. Bir gösterge değişkeni tanımlayın:
Yben= { 10ben f t h e i n t e r v a l c o v e r s ben f i t d o e s n o t
O halde ilgilendiğiniz kapsam olasılığı bu da teklif ettiğiniz şey olduğunu düşündüğüm örnek oranına göre tahmin edebilirsiniz.E( Yben) = p
Yineleme çalıştırma sayısını nasıl ayarlayabilirim?
Biz Bernoulli yargılama varyans olduğunu biliyoruz , ve simülasyonları nedenle sizin simülasyon tabanlı tahminin varyansı IID bernoulli denemeleri, üretecektir olan , nerede ise simülasyon sayısı. Bu varyansı istediğiniz kadar küçültmek için seçebilirsiniz . olduğu bir gerçektirp ( 1 - p )pp ( 1 - p ) / nnn
p ( 1 - p ) / n ≤ 1 / 4 , n
Bu nedenle, varyansın önceden belirlenmiş bir eşik değerden daha az olmasını istiyorsanız, , o zaman seçerek bunu sağlayabilirsiniz .δn ≥ 1 / 4 δ
Daha genel bir ortamda, bir tahmin edicinin örnekleme dağılımının özelliklerini simülasyonla araştırmaya çalışıyorsanız (örneğin, ortalama ve varyans), benzer bir şekilde ne kadar hassasiyet elde etmek istediğinize bağlı olarak simülasyon sayınızı seçebilirsiniz. burada tarif edilen moda.
Ayrıca, bir değişkenin ortalaması (veya başka bir an) ilgilenilen nesne olduğunda, burada olduğu gibi, normal yaklaşımı (yani merkezi limit teoremi) kullanarak simülasyonlara dayanarak bunun için bir güven aralığı oluşturabileceğinizi unutmayın. MansT'ın güzel cevabında tartışıldığı gibi. Bu normal yaklaşım, örnek sayısı arttıkça daha iyidir, bu nedenle, merkezi limit teoremine hitap ederek bir güven aralığı oluşturmayı planlıyorsanız, uygulanacak kadar büyük olmasını istersiniz . İkili durumda, burada olduğu gibi, bu yaklaşım ve oldukça ılımlı olsa bile iyi görünüyor - örneğin, .nn pn ( 1 - p )20
Gerekenden daha büyük tekrarların sahte önyargılara neden olabileceği doğru mu? Eğer öyleyse, bu nasıl?
Bir yorumda belirttiğim gibi - bu sahte ile ne demek istediğinize bağlıdır. Daha fazla sayıda simülasyon, istatistiksel anlamda önyargı üretmeyecektir, ancak yalnızca astronomik olarak büyük bir örneklem büyüklüğü ile fark edilebilen önemsiz bir önyargı ortaya çıkarabilir. Örneğin, yanlış tanımlanmış güven aralığının gerçek kapsama olasılığının olduğunu varsayalım . Öyleyse, bu gerçekten pratik anlamda bir sorun değil, ama bu farkı sadece bir ton simülasyon çalıştırdıysanız alabilirsiniz.94.9999 %