Monte Carlo simülasyon tahmininin hassasiyetini bulma


12

Arka fon

Model serisinin çıktılarını birleştiren bir Monte Carlo simülasyonu tasarlıyorum ve simülasyonun, simüle edilen sonucun olasılığı ve bu olasılık tahmininin kesinliği hakkında makul iddialarda bulunmamı sağlayacağından emin olmak istiyorum.

Simülasyon, belirli bir topluluktan alınan bir jürinin belirli bir sanığı mahkum etme olasılığını bulacaktır. Bunlar simülasyonun adımları:

  1. Mevcut verileri kullanarak , demografik öngörücülerdeki “jüri ilk oy oyu” na basarak bir lojistik olasılık modeli ( M ) oluşturun .

  2. M'nin 1000 versiyonunu (yani model parametreleri için katsayıların 1000 versiyonunu) simüle etmek için Monte Carlo yöntemlerini kullanın .

  3. Modelin ( M i ) 1.000 versiyonundan birini seçin .

  4. Belirlenen demografik karakteristik dağılımları olan bireylerden oluşan bir “topluluktan” ( C ) 1.000 set 12 jüri üyesini rastgele seçerek 1.000 jüriye hizmet verin .

  5. Deterministically kullanarak her jüri için bir ilk oylama suçlu oyu olasılığını hesaplamak M i .

  6. Her "jüri üyesinin" olası oyunu belirli bir oylama haline getirin (0-1 arasında rastgele seçilen değerden büyük veya küçük olmasına bağlı olarak).

  7. İlk oylamada mahkumiyet için oy kullanan jüri üyelerinin oranına bağlı olarak, bir jürinin hükümlü olma olasılığının bir modelini (ampirik verilerden türetilmiş) kullanarak her bir “jüri” nin “nihai oyunu” belirleyin.

  8. 1000 jüri için suçlu kararların oranını saklayın ( PG i ).

  9. M'nin 1.000 benzetilmiş sürümünün her biri için 3-8. Adımları tekrarlayın .

  10. PG'nin ortalama değerini hesaplayın ve C'deki mahkumiyet olasılığının nokta tahmini olarak rapor edin  .

  11. PG için 2.5 ve 97.5 persentil değerlerini tanımlayın ve 0.95 güven aralığı olarak bildirin.

Şu anda 1000 rasgele olasılık dağılımından ( C'nin demografik özellikleri veya M sürümleri) çektiği teorisinde 1.000 jüri ve 1.000 jüri kullanıyorum .

Sorular

Bu, tahminimin doğruluğunu doğru bir şekilde belirlememe izin verecek mi? Eğer öyleyse, her PG i hesaplaması için C'nin olasılık dağılımını kapsayacak şekilde kaç jüriye ihtiyacım var (bu yüzden seçim yanlılığından kaçınırım); 1000'den az kullanabilir miyim?

Her türlü yardımın için çok teşekkür ederim!


Sadece meraktan: bu modeldeki herhangi bir şey sanığın gerçekten suçlu olup olmadığına bağlı mı?
whuber

Model, tek bir olgu modeline anket yanıtlarına dayanmaktadır, bu nedenle gerçek suçluluk değişmez. Tek bir tartışmalı davada farklı jürilerin nasıl ortaya çıkacağını tahmin ediyorum.
Maggie

Tamam, şaka bir yana, üç tahmin rapor ediyorsunuz: PG ortalama ve 2.5 ve 97.5 persentilleri. Hangi (ler) için "doğru" bir belirlemeye ihtiyacınız var ve ne kadar doğru olmalı?
whuber

Ayrıca, adım (6) gizemlidir. Ne yapması gerektiğini açıklayabilir misiniz? Her jüri üyesi (5), her jüri (4), her model (3) veya bunların bir kombinasyonu için farklı bir "rastgele seçilmiş değer" var mı?
whuber

1
(Yukarıdaki yoruma bakınız) Sanırım jüri sayısını azaltabilirim (a). Örnekleme hatası, örnek sayısının bir fonksiyonudur. Model başına 1000 jüri ile toplamda bir milyon örneğim var. 10 ^ 6 numuneyle ilişkili örnekleme hatası ~% 0.1'dir. Model başına sadece 35 jüri kullanırsam, 3.5 * 10 ^ 4 örnek ve ~% 0.5 örnekleme hatası alırdım. Bu örnekleme hatası ~% 5.0 ölçüm hatamdan çok daha küçük. Bu nedenle, model başına 35 jüri kullanabilmeli ve sadece güven aralığımı tahmin etmek için ölçüm hatasını kullanmalıyım.
Maggie

Yanıtlar:


4

Monte Carlo'nun iyiliği için bir genel ve "evrende" kriteri vardır - yakınsama.

Bir M'ye sadık kalın ve PG'nin jüri sayısı ile nasıl davrandığını kontrol edin - birleşmelidir, bu nedenle size makul sayıda (uygulamanız için) önemli sayıda basamağa sahip olacağınız bir dizi tekrar gösterecektir. M seçimi ile şanslı olmadığınızdan emin olmak için bu testi diğer birkaç Ms için tekrarlayın, ardından tüm simülasyona geçin.


1
kimsenin soruya tam olarak yanıt verdiğinden emin değilim. İki bölümü vardır: (1) Açıklanan modelleme stratejisi, çözmek istediği soruna savunulabilir bir çözüm sağlıyor mu - yani, belirli bir demografik özelliklere sahip bir topluluktan ( C) rasgele alınan bir jürinin bulmak için oy kullanma olasılığı nedir? sanık suçlu mu? Ve (2) Modelleme stratejisi makul ise, kaç mahk probmiyet jürisi seçmeli ve her biri için kaç “karar” simüle etmelidir, mahkumiyet ve 0,95 CI probunun savunulabilir bir tahminini rapor etmelidir? Hesaplamada tasarruf etmek istiyor. Son yorumu görmek
dmk38

0

Bana göre buradaki problem, modelin Monte Carlo simülasyonunu kullanmadan bakmak için çok karmaşık olup olmadığı.

Eğer model göreceli olarak basit ise, o zaman konvansiyonel istatistiklerle bakmak ve modeli tekrar tekrar çalıştırmadan sorulan soruya bir çözüm bulmak mümkün olmalıdır. Bu biraz fazla bir basitliktir, ancak tüm modeliniz normal bir dağılıma dayalı puanlar üretiyorsa, aradığınız cevapları kolayca türetebilirsiniz. Tabii ki, model bu kadar basitse, cevaplarınızı bulmak için bir Monte Carlo simülasyonu yapmanız gerekmez.

Sorun karmaşıksa ve daha temel bir parçaya ayırmak mümkün değilse, Monte-Carlo kullanmak için doğru modeldir, ancak modeli çalıştırmadan güven sınırlarını tanımlamanın herhangi bir yolu olduğunu düşünmüyorum. Nihayetinde, tarif edilen güven sınırlarının türünü elde etmek için modelinin birkaç kez çalıştırılması gerekecek, olasılık dağılımının çıktılara uyması gerekecek ve oradan güven sınırları tanımlanabilecektir. Monte-Carlo simülasyonundaki zorluklardan biri, modellerin orta aralıktaki dağılımlar için iyi ve düzenli cevaplar vermesidir, ancak kuyruklar genellikle çok daha değişken sonuçlar verir, bu da sonuçta çıktıların şeklini% 2.5 ve % 97.5 persentiller.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.