Karşılaştırma 0/10 ile 0/20


10

Görev başarı oranlarını tartışırken, 20 denemeden 0'ının 10 denemeden 0'ından "daha kötü" olduğunu göstermenin bir yolu var mı?


1
Kullanılacak deneyebilirsiniz en.wikipedia.org/wiki/Additive_smoothing ziyade katı kanıttan daha sallayarak eller olacak
abukaj

Daha kötü olduğunu nereden biliyorsun? Sadece 10 girişimleri mümkün olsaydı Örneğin, o zaman yok daha girişimleri ile skor ne olacağını biliyorum.
Tim

4
Tahmin edilen oran için belki bir güven aralığı?
mdewey

5
Bu benim için makul bir soru gibi görünüyor. Tartışılabilecek tamamen normal bir sezgiye dayanır ve bu sorunu ele almanın istatistiksel yolları (örn. Bayesian) vardır. Açık bırakmak için oy veriyorum.
gung - Monica'yı eski durumuna döndürün

1
@Gung ile hemfikirim. Bu iyi bir soru.
Alexis

Yanıtlar:


3

Bir denemede başarı olasılığını bildiğimizi varsayalım. Bu durumda 10 vakanın 0 ve 20 vakanın 0 olasılığını hesaplıyoruz.

Ancak, bu durumda tam tersine gidiyoruz. Olasılığı bilmiyoruz, verilerimiz var ve olasılığı tahmin etmeye çalışıyoruz.

Ne kadar fazla vakamız olursa, sonuçlarla ilgili o kadar kesin olabiliriz. Eğer bir bozuk para çevireceğim ve kafa olacaksa, çift başlı olduğundan emin olmayacaksınız. 1000 kere fırlatacaksam ve hepsi kafa olacaksa, dengeli olması pek mümkün değil.

Tahminleri verirken patika sayısını dikkate almak için tasarlanmış yöntemler vardır. Bunlardan biri @abukaj yukarıda hakkında yorum yapan ek yumuşatma . Katkı yumuşatma işleminde fazladan sözde örnekler ekliyoruz. Bizim durumumuzda, gördüğümüz patika yerine iki tane daha ekledik - biri başarılı diğeri başarısız.

  • İlk durumda yumuşatılmış olasılık = ~% 8.3 olacaktır. 11+010+1+1112
  • İkinci durumda = ~% 4,5 11+020+1+1122

Katkı düzleştirmenin sadece bir tahmin yöntemi olduğunu unutmayın. Farklı yöntemlerle farklı sonuçlar elde edersiniz. Katkı yumuşatma ile bile, 4 sözde numune ekleseydiniz farklı sonuçlar elde edersiniz.

Başka bir yöntem de mdewey'in önerdiği gibi güven aralığını kullanmaktır . Ne kadar çok örneğimiz olursa, güven aralığı o kadar kısa olacaktır. Güven aralığının boyutu, örneklerin kare kökü ile orantılıdır - . Bu nedenle, örnek sayısının iki katına çıkarılması daha kısa bir güven aralığına yol açacaktır .1n2

Her iki durumda da ortalama 0'dır. Güven düzeyini% 90 alıyoruz (z = 1.645)

  • İlk durumda 0 + 1.645 elde % 10 ~ 521.64510
  • İkinci durumda 0 + 1.645 elde % 20 ~ 361.64520

Eksik veri olması durumunda belirsizlik vardır. Yaptığınız varsayımlar ve kullanacağınız dış veriler alacağınız şeyi değiştirecektir.


1
Çok teşekkür ederim Dan Levin. Cevabınız matematikçi olmayan bir kişinin takip edebileceği kadar açıktı, ancak açıklamanızı sezgisel olarak kabul edebilecek kadar sağlamdı. Tüm yorumculara katkılarınız için teşekkür ederiz.
vinne

1

Güven aralıklarını çağırma fikrini genişleten kesin bir binom aralığı kavramı vardır.

Binom dağılımı, bağımsız denemelerde 0 (başarısızlık) veya 1 (başarı) ile sonuçlanan toplam başarı sayısıdır. 1 (başarı) elde etme olasılığı geleneksel olarak gösterilir ve tamamlayıcısı q = 1 - p'dir . O zaman standart olasılık sonucu, n denemede tam olarak k başarı olasılığınınpq=1pkn

pn,k=(nk)pkqnk=n!k!(nk)!pkqnk

Güven aralığı kavramı , gerçek parametre değerinin bu aralık içinde olup olmadığı hakkında olasılıklı (iyi, sık sık ) ifadeler yapabilmemiz için model parametrelerinin bir dizi olası değerini (burada başarı olasılıkları ) sınırlamaktır. , 10 veya 20 deneme yapma olasılığını tekrarlarsak ve güven aralığını belirli bir şekilde oluşturursak, parametrenin gerçek değerinin zamanın% 95'i aralığında olduğunu gözlemleyeceğiz).p

Bu durumda, şu formülde çözebiliriz : p n , 0 = ( 1 - p ) np

pn,0=(1p)n

Bu nedenle,% 95 tek taraflı bir aralık isteseydik, değerini, gözlenen sıfır sayısının en fazla% 5 olma olasılığını çözmek için ayarlayacağız . İçin , cevap (her denemede bir başarı olasılığı% 13.9, sıfır başarıları gözlemleme olasılık ise, yani, uç,% 5 olan). İçin , cevap . Bu nedenle bir numunesinden , daha örneğinden daha öğrenilen biz `` 'aralığı hariç tutmak için bu anlamda, bir örnek olduğu hala akla yatkın.pn,0=5%n=20[0%,13.9%]n=10[0%,25.9%]n=20n=10[13.9%,25.9%]n=10


0

Bayesci Bir Yaklaşım

Olabilirlik fonksiyonu Bernoulli ve beta dağılımı olan eşlenik önce Bernoulli dağılımı için, dolayısıyla arka beta dağılımını izler. Ayrıca, posterior aşağıdakilerle parametrelendirilir:

α^=α+i=1nXiβ^=β+ni=1nXi

Sonuç:

E[pX1,,Xn]=α^α^+β^=α+i=1nXiα+β+n

Eğer 10 arızaları görürseniz Böylece, sizin beklenti olan , ve 20 arızaları görürseniz, sizin beklenti olan . Ne kadar çok hata görürseniz, beklentiniz o kadar düşük olur .αp pααα+β+10p pαα+β+20p

Bu makul bir argüman mı? Bayes istatistikleri hakkında nasıl hissettiğinize , olasılık mekaniğini kullanarak bazı parametreler üzerindeki belirsizliği modellemeye istekli olup olmadığınıza bağlıdır . Ve bir önceki seçiminizi ne kadar makul olduğuna bağlıdır.p

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.