Simülasyon çalışması: yineleme sayısı nasıl seçilir?


11

"Model 1" ile veri oluşturmak ve bunları "Model 2" ile sığdırmak istiyorum. Temel fikir "Model 2" nin sağlamlık özelliklerini araştırmaktır. Özellikle% 95 güven aralığının kapsama oranı ile ilgileniyorum (normal yaklaşıma dayanarak).

  • Yineleme çalıştırma sayısını nasıl ayarlayabilirim?
  • Gerekenden daha büyük tekrarların sahte önyargılara neden olabileceği doğru mu? Eğer öyleyse, bu nasıl?

"% 95 güven aralığının kapsama oranı" ile ne demek istiyorsun? Güven aralığı tam veya yaklaşık bir iyi aralık ise, parametrenin gerçek değerini yaklaşık% 95 oranında kapsar.
Michael R.Chernick

1
Model 1 altında oluşturulan veriler için Model 2'ye dayalı bir güven aralığı oluşturuyorsanız, bu, iki modelin ilişkili olduğunu ve aynı parametrelerin bazılarını içerdiğini gösterir. Biraz daha açıklayabilir misiniz? Ayrıca, ikinci mermi noktanızda "sahte" derken yanlış mı, yoksa önemsiz mi demek istediniz? Daha fazla sayıda simülasyon önyargı üretmemelidir, ancak daha az sayıda göremeyeceğiniz pratik bir öneme sahip olmayan bir önyargı ortaya çıkarabilir; çok büyük bir örnek boyutuna sahip.
Makro

@Michael Chernick: Örneğin, standart hata çok küçükse yetersiz kapsama alanı elde edilebilir. Sorumumu, normal yaklaşıma dayalı güven aralıklarını kullandığımı belirtmek için düzenledim.
user7064

@Macro: "Model 1" heteroscedastik hata terimleriyle normal veriler üretir ve "Model 2" standart doğrusal modeldir.
user7064

Yanıtlar:


10

Takip yorumunuza dayanarak, gerçek hata varyansı sabit olmadığında sürekli hata varyansı varsaydığınızda bir güven aralığının kapsama olasılığını tahmin etmeye çalıştığınız anlaşılıyor.

Bunu düşündüğüm şekilde, her çalışma için güven aralığı ya gerçek değeri kapsıyor ya da etmiyor. Bir gösterge değişkeni tanımlayın:

Yben={1benf the benntervbirl cÖvers0benf bent dÖes nÖt

O halde ilgilendiğiniz kapsam olasılığı bu da teklif ettiğiniz şey olduğunu düşündüğüm örnek oranına göre tahmin edebilirsiniz.E(Yben)=p

Yineleme çalıştırma sayısını nasıl ayarlayabilirim?

Biz Bernoulli yargılama varyans olduğunu biliyoruz , ve simülasyonları nedenle sizin simülasyon tabanlı tahminin varyansı IID bernoulli denemeleri, üretecektir olan , nerede ise simülasyon sayısı. Bu varyansı istediğiniz kadar küçültmek için seçebilirsiniz . olduğu bir gerçektirp(1-p)pp(1-p)/nnn

p(1-p)/n1/4n

Bu nedenle, varyansın önceden belirlenmiş bir eşik değerden daha az olmasını istiyorsanız, , o zaman seçerek bunu sağlayabilirsiniz .δn1/4δ

Daha genel bir ortamda, bir tahmin edicinin örnekleme dağılımının özelliklerini simülasyonla araştırmaya çalışıyorsanız (örneğin, ortalama ve varyans), benzer bir şekilde ne kadar hassasiyet elde etmek istediğinize bağlı olarak simülasyon sayınızı seçebilirsiniz. burada tarif edilen moda.

Ayrıca, bir değişkenin ortalaması (veya başka bir an) ilgilenilen nesne olduğunda, burada olduğu gibi, normal yaklaşımı (yani merkezi limit teoremi) kullanarak simülasyonlara dayanarak bunun için bir güven aralığı oluşturabileceğinizi unutmayın. MansT'ın güzel cevabında tartışıldığı gibi. Bu normal yaklaşım, örnek sayısı arttıkça daha iyidir, bu nedenle, merkezi limit teoremine hitap ederek bir güven aralığı oluşturmayı planlıyorsanız, uygulanacak kadar büyük olmasını istersiniz . İkili durumda, burada olduğu gibi, bu yaklaşım ve oldukça ılımlı olsa bile iyi görünüyor - örneğin, .nnpn(1-p)20

Gerekenden daha büyük tekrarların sahte önyargılara neden olabileceği doğru mu? Eğer öyleyse, bu nasıl?

Bir yorumda belirttiğim gibi - bu sahte ile ne demek istediğinize bağlıdır. Daha fazla sayıda simülasyon, istatistiksel anlamda önyargı üretmeyecektir, ancak yalnızca astronomik olarak büyük bir örneklem büyüklüğü ile fark edilebilen önemsiz bir önyargı ortaya çıkarabilir. Örneğin, yanlış tanımlanmış güven aralığının gerçek kapsama olasılığının olduğunu varsayalım . Öyleyse, bu gerçekten pratik anlamda bir sorun değil, ama bu farkı sadece bir ton simülasyon çalıştırdıysanız alabilirsiniz.94,9999%


10

Sıklıkla güven aralıklarının genişliğini, gereken yineleme sayısını belirlemek için hızlı ve kirli bir yol olarak kullanıyorum.

"Model 1" deki veriler "Model 2" ye eklendiğinde, % 95 güven aralığının gerçek kapsama oranı olsun . Eğer X- sayısı olduğu güven aralığı kapsar gerçek parametre değeri , n tekrarlamalar, o zaman X ~ B ı , n ( n , p ) .pXnX~Bbenn(n,p)

Tahmincisi p = X / n ortalama sahip p ve standart sapma p^=X/np . Büyük içinn, p yaklaşık olarak normal ve bir p ±1.96p(1-p)/nnp^size için, yaklaşık olarak% 95 güven aralığını verirp. P0.95olduğunu bildiğiniz (tahmin edeceğiniz)için, bu aralığın genişliğinin yaklaşık21,96olduğugörülür.p^±1.96p^(1-p^)/npp0.95 .21.960.950.05/n

Genişlik (diyelim) olan bir güven aralığının kabul edilebilir olduğunu düşünüyorsanız, 0.1 = 2 1.96 denklemini çözerek bunun için gereken yaklaşık yineleme sayısını n bulabilirsiniz.0.1n

0.1=21.960.950.05/n.

Bu şekilde aradığınız doğruluğu seçerek makul bir bulabilirsiniz .n


(+1) aynı anda çok benzer bir cevap gönderdiğimiz anlaşılıyor, ancak kullanılan farklı dilin bazıları için yararlı olabileceğini düşünüyorum.
Makro

Evet, gerçekten, hangi cevabı kabul edeceğimi hala bilmiyorum! Her neyse, her ikisi için +1!
user7064

1
@Macro: Size de +1. Varyans ve aralık genişliği elbette az ya da çok eşdeğerdir. Büyük akıllar benzer düşünür - bizimkiler de öyle. ;)
MånsT

@ MånsT CI genişliğim 0,01 ise% 90 kapsama oranı için gerekli yineleme sayısının olduğunu varsaymak doğru muyum?n=(21.650.950.05/0.01)2

0

Nüfus standart sapmasınd95%d=1.96xPop.Std.Devnn=(1.96xPop.Std.Dev)2d2

Daha fazla simülasyon yapmak (tüm örneklerin rastgele bir işlemle üretildiğini varsayarak), doğruluk veya yanlılık açısından tahminlere zarar verecek hiçbir şey yapmaz.

95%np(1-p)n


4
Merhaba Michael. Bence bu cevap önemli değil. OP, sabit varyans kabul ettiğinizde ancak gerçek varyans sabit olmadığında bir güven aralığının kapsama özelliklerinin nasıl değiştirildiğini araştırmaya çalışmaktadır.
Makro

@Macro: Haklısın. Sürekli değişim varsayım problemine özgü cevaplardan kaçınmak için soruyu kasıtlı olarak daha geniş bir bağlama oturttum.
user7064

@ Makro Bu cevapladığım sorunun bir parçası değildi. Görünüşe göre bu daha sonra açıklığa kavuşturuldu. Ayrıca ilgi çekici olanın, normal yaklaşımı kullanan bir güven aralığının doğruluğu olduğu da görülmektedir. Bu yanıtların hiçbirinde ele alınmamış gibi görünüyor.
Michael R.Chernick

4
@Michael, evet biliyorum - benim açımdan (ve ben) açıklama talebinde bulunduğunuz nokta daha fazlaydı ama cevabınızı göndermeden önce açıklamayı beklemediniz. Re: ikinci yorumunuz, normal yaklaşıma dayanıp dayanmadığına bakılmaksızın, herhangi bir aralığın kapsama özelliklerini bu şekilde araştırabilirsiniz. Eklemek için ayrı bir şey olduğunu düşünüyorsanız, mevcut cevaplar tarafından kaçırılırsa, lütfen yanıtınızı düzenleyin, böylece hepimiz öğrenebiliriz.
Makro

@Macro Elbette sana katılıyorum. Cevabımı OP'nin yararına düzenledim. İçerikte zaten bilmediğiniz bir şey olmadığından şüpheleniyorum.
Michael R.Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.