Görev başarı oranlarını tartışırken, 20 denemeden 0'ının 10 denemeden 0'ından "daha kötü" olduğunu göstermenin bir yolu var mı?
Görev başarı oranlarını tartışırken, 20 denemeden 0'ının 10 denemeden 0'ından "daha kötü" olduğunu göstermenin bir yolu var mı?
Yanıtlar:
Bir denemede başarı olasılığını bildiğimizi varsayalım. Bu durumda 10 vakanın 0 ve 20 vakanın 0 olasılığını hesaplıyoruz.
Ancak, bu durumda tam tersine gidiyoruz. Olasılığı bilmiyoruz, verilerimiz var ve olasılığı tahmin etmeye çalışıyoruz.
Ne kadar fazla vakamız olursa, sonuçlarla ilgili o kadar kesin olabiliriz. Eğer bir bozuk para çevireceğim ve kafa olacaksa, çift başlı olduğundan emin olmayacaksınız. 1000 kere fırlatacaksam ve hepsi kafa olacaksa, dengeli olması pek mümkün değil.
Tahminleri verirken patika sayısını dikkate almak için tasarlanmış yöntemler vardır. Bunlardan biri @abukaj yukarıda hakkında yorum yapan ek yumuşatma . Katkı yumuşatma işleminde fazladan sözde örnekler ekliyoruz. Bizim durumumuzda, gördüğümüz patika yerine iki tane daha ekledik - biri başarılı diğeri başarısız.
Katkı düzleştirmenin sadece bir tahmin yöntemi olduğunu unutmayın. Farklı yöntemlerle farklı sonuçlar elde edersiniz. Katkı yumuşatma ile bile, 4 sözde numune ekleseydiniz farklı sonuçlar elde edersiniz.
Başka bir yöntem de mdewey'in önerdiği gibi güven aralığını kullanmaktır . Ne kadar çok örneğimiz olursa, güven aralığı o kadar kısa olacaktır. Güven aralığının boyutu, örneklerin kare kökü ile orantılıdır - . Bu nedenle, örnek sayısının iki katına çıkarılması daha kısa bir güven aralığına yol açacaktır . √
Her iki durumda da ortalama 0'dır. Güven düzeyini% 90 alıyoruz (z = 1.645)
Eksik veri olması durumunda belirsizlik vardır. Yaptığınız varsayımlar ve kullanacağınız dış veriler alacağınız şeyi değiştirecektir.
Güven aralıklarını çağırma fikrini genişleten kesin bir binom aralığı kavramı vardır.
Binom dağılımı, bağımsız denemelerde 0 (başarısızlık) veya 1 (başarı) ile sonuçlanan toplam başarı sayısıdır. 1 (başarı) elde etme olasılığı geleneksel olarak gösterilir ve tamamlayıcısı q = 1 - p'dir . O zaman standart olasılık sonucu, n denemede tam olarak k başarı olasılığının
Güven aralığı kavramı , gerçek parametre değerinin bu aralık içinde olup olmadığı hakkında olasılıklı (iyi, sık sık ) ifadeler yapabilmemiz için model parametrelerinin bir dizi olası değerini (burada başarı olasılıkları ) sınırlamaktır. , 10 veya 20 deneme yapma olasılığını tekrarlarsak ve güven aralığını belirli bir şekilde oluşturursak, parametrenin gerçek değerinin zamanın% 95'i aralığında olduğunu gözlemleyeceğiz).
Bu durumda, şu formülde çözebiliriz : p n , 0 = ( 1 - p ) n
Bu nedenle,% 95 tek taraflı bir aralık isteseydik, değerini, gözlenen sıfır sayısının en fazla% 5 olma olasılığını çözmek için ayarlayacağız . İçin , cevap (her denemede bir başarı olasılığı% 13.9, sıfır başarıları gözlemleme olasılık ise, yani, uç,% 5 olan). İçin , cevap . Bu nedenle bir numunesinden , daha örneğinden daha öğrenilen biz `` 'aralığı hariç tutmak için bu anlamda, bir örnek olduğu hala akla yatkın.
Olabilirlik fonksiyonu Bernoulli ve beta dağılımı olan eşlenik önce Bernoulli dağılımı için, dolayısıyla arka beta dağılımını izler. Ayrıca, posterior aşağıdakilerle parametrelendirilir:
Sonuç:
Eğer 10 arızaları görürseniz Böylece, sizin beklenti olan , ve 20 arızaları görürseniz, sizin beklenti olan . Ne kadar çok hata görürseniz, beklentiniz o kadar düşük olur .α pα p
Bu makul bir argüman mı? Bayes istatistikleri hakkında nasıl hissettiğinize , olasılık mekaniğini kullanarak bazı parametreler üzerindeki belirsizliği modellemeye istekli olup olmadığınıza bağlıdır . Ve bir önceki seçiminizi ne kadar makul olduğuna bağlıdır.