Bir kümenin boyutunu tahmin etme hatası?


9

Diyelim ki bir A setimiz ve bir B B altkümemiz var. | A | 'yı biliyorsanız, | B | A'dan rastgele rasgele seçilen bir elemanın B'ye ait olma olasılığını p bularak B.

A'nın n elemanını rastgele olarak eşit olarak ürettiğimizi ve bu verileri p (B'deki elemanların sayısının n'ye bölünmesiyle) ve dolayısıyla | B | 'yi tahmin etmek için kullandığımızı varsayalım.

Bu tahmin ne kadar güvenilir? Yani hatayı nasıl hesaplayabiliriz?

Bir yan soru olarak, bu tekniğin bir adı var mı? ( markalama ve yeniden yakalama tekniğinin matematiksel bir versiyonu gibi görünüyor )


1
Bu var binom tahmin. (Hiçbir işaretleme veya yeniden yakalama yoktur. Bu da hipergeometrik kestirime yol açar.)
whuber

Yanıtlar:


8

Oranları tahmin ediyorsunuz. Somutluk için, A'nın seçmen nüfusu ve B'nin belirli bir aday için oy veren seçmen grubu olduğunu düşünün. Böylece p, o aday için oy kullanacak seçmenlerin yüzdesi olacaktır. İzin Vermek:

π aday için oy kullanacak kişilerin gerçek yüzdesi olmak

Başka bir deyişle:

π=|B||A|

Sonra örneklerinizin her biri bir bernoulli denemesidir πveya aynı şekilde örneklerinizin her birinin potansiyel seçmenlerin aday için oy verip vermeyeceklerini soran bir anket olduğunu hayal edebilirsiniz. Böylece, MLEπ tarafından verilen:

p=nBn

nerede

nB adayınıza oy vereceğini söyleyen kişi sayısı veya beden numaranızdaki B setine ait öğe sayısıdır n.

Tahmininiz için standart hata:

π(1π)n

Yukarıdakiler MLE kullanılarak π yani:

p(1p)n

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.