Başarısızlık yoksa başarısızlık olasılığını nasıl anlatabilirim?


50

Sahada 1 yıl boyunca 100.000 ürünümüz olup, arızasız bir şeyin (bir ürün) arızalanma olasılığını söylemenin bir yolu olup olmadığını merak ediyordum. Satılan sonraki 10.000 üründen birinin arızalanma olasılığı nedir?


4
Bir şey bana bunun gerçek güvenilirlik sorunu olmadığını söylüyor. Böyle düşük başarısızlık oranlarına sahip hiçbir ürün yoktur.
Aksakal

Muhtemel başarı / başarısızlık oranlarının dağılımı için, istatistiklerden gerçek başarı / başarısızlık oranlarına ilişkin herhangi bir şeyi çıkarmadan önce bir modele ihtiyacınız vardır. Açıklamanız, böyle bir dağıtımı anlamak / almak için çok az temel sağlar.
RBarryYoung

1
@RBarryYoung lütfen verilen cevapları kontrol edin - sorunla ilgili birkaç ilginç ve geçerli yaklaşım sağlarlar. Bu yaklaşımlara katılmıyorsanız, yorum yapmaktan veya kendi yanıtınızı vermekten çekinmeyin.
Tim

2
@Aksakal - bu kadar düşük bir başarısızlık oranı, değeri yüksek basit bir ürün ve başarısızlık durumunda (cerrahi alet gibi) yüksek test ve inceleme seviyesinden geçmesi (ve muhtemelen bağımsız olması durumunda) yüksek bir riskse imkansız görünmüyor Sertifika) serbest bırakılmadan önce. Tabii ki, bunun tersi doğru olabilir, ürün öyle düşük bir değere sahip olabilir ki, son kullanıcılar sadece kusurlu ürünlerle ilgili sorunları rapor etmiyorlardı (kesinlikle gumball üreticilerinin 1/100000 bildirilen bir kusur oranına sahip olmaları mümkün değil mi?); o ve yeni bir dener.
Johnny

@Johnny, Motorola ile geldiğinde, 100 milyon üründe 3 hata olduğunu veya bunun gibi bir şeyle övündüğü için övünüyorlardı. 6σ
Aksakal

Yanıtlar:


43

Bir ürünün bozulma olasılığı kesinlikle zamanın ve kullanımın bir fonksiyonudur. Kullanım hakkında herhangi bir veri yok ve sadece bir yıl ile hiçbir arıza yok (tebrikler!). Bu nedenle, bu yönü ( hayatta kalma işlevi olarak adlandırılır ) verilerinizden tahmin edilemez.

Bununla birlikte, bir yıl içindeki arızaları binom dağılımından aldığı gibi düşünebilirsiniz . Hala başarısızlığın yok, ama bu şimdi yaygın bir sorundur. Basit bir çözüm, büyük (kesinlikle sahip olduğunuz) ile doğru olan 3 kuralını kullanmaktır . Spesifik olarak, bir yıllık% 95 güven aralığının üst sınırını (yani alt sınır ) bir yıl içinde olarak gerçek başarısızlık olasılığını alabilirsiniz . Sizin durumunuzda, oranın düşük olduğuna% 95 güveniyorsunuz . 0 3 / N 0,00003N03/N0.00003

Ayrıca, bir sonraki 10k'dan birinin veya daha fazlasının başarısız olma olasılığını nasıl hesaplayacağınızı sordunuz. Yukarıdaki analizi genişletmenin hızlı ve basit (aşırı da olsa) bir yolu, sadece üst sınırı temel olasılık olarak kullanmak ve karşılık gelen binom CDF'yi başarısızlığı olasılığını elde etmek için kullanmaktır . Kod kullanarak şunları yapabiliriz: bu , sonraki 10k ürünlerde bir veya daha fazla hata görme şansı veriyor. Üst sınır kullanıldığında, bu en az bir başarısızlık olasılığının en uygun nokta tahmini değildir, bunun yerine arızası olasılığının dan fazla olma ihtimalinin çok düşük olduğunu söyleyebilirsiniz.1 26 % ( K + 1 ) / ( K + 2 ) F p = 9,9998 x 10 - 06 1 +10 %0R1-pbinom(0, size=10000, prob=0.00003)0.2591851126%(bunun biraz 'el dalgalı' bir çerçeve olduğunu kabul ederek). Bir başka olasılık da @ amoeba'nın Laplace'in arka arkaya kuralıyla ilgili tahminde bulunma önerisini kullanmaktır . Ardışıklık kuralı, tahmin edilen başarısızlık olasılığının olduğunu belirtir ; burada , başarısızlıkların sayısıdır. Bu durumda, ve tahmin edilen olasılık hesaplama sonraki 10.000 hataları olduğu , sonuçta , veya . (F+1)/(N+2)Fp^=9.9998×10061+1-pbinom(0, size=10000, prob=9.9998e-06)0.0951612210%


3
+1. Daha önce "3 kuralı" nı duymamıştım. Acaba 3 kuralı ile "Laplace'nin arka arkaya kuralı" arasında bir bağlantı var mıdır? İkincisine göre (doğru uygularsam), başarısızlık olasılığı olarak tahmin edilebilir . 1/(N+2)
amip diyor Reinstate Monica

14
@ amoeba Bu 3 kuralı,% 95 tek taraflı güven sınırıdır. Arıza sayımının Binom dağılımına sahip olduğunu varsayın . O zaman hiçbir başarısızlık görme şansı . Daha büyük olmak için çözmek için . Kullanma küçük için , çözüm . Yana , elde ettiğimiz . Bu "3 kuralı" dır. Şimdi size güven düzeyini ayarlamak istiyorsanız "3" değişir bilen ve ayrıca asgari bulmak için onu çevirin verebildiği için bilerek değer bir oran tespit etmek için gerekli( 1 - p ) n, 5 % ( 1 - p ) n0.05 s günlük ( 1 - p ) - p p s - log ( 0.05 ) / N 0.05 = 1 / 20 e 3 s 3 / n n p(n,p)(1p)n5%(1p)n0.05plog(1p)ppplog(0.05)/n0.05=1/20e3p3/nnp veya daha büyük.
whuber

1
Bahsettiğim gibi @ amoeba, başarısızlık olasılığı öncesinde bir üniforma aldı. Farklı bir önceliğin oldukça farklı sonuçlara yol açacağına inanıyorum.
Yair Daon,

1
Düzenlemeniz iyi bir ilerleme (+1). Ancak, yorumlama konularını gündeme getirmektedir. Şansın fazla olmadığından "emin değiliz" çünkü gerçek temel şanstan tamamen emin değiliz. üzerinde "üst sınır" yok , yalnızca üst güven sınırı var. Gelecekteki bir etkinlik için bir tahmin yaparken, (a) tahmin etmeli ve (b) sınırlar sağlamalısınız. Şuna şöyle bakın: , bağımsız olarak, koşullu olduğunda , bize sınırlarını verin . Bu sınırlar, dayalı için bir tahmin aralığıdır .26 p Y X Binom ( n , p ) Y Binom ( m , p ) X = 0 Y X26%pYXBinomial(n,p)YBinomial(m,p)X=0YX
whuber

2
"Üçün Kuralı" için Yay. Ben yumruk "Amerikan Tıp Derneği Dergisi'nde" kısa notta yıllar önce gördüm jama.jamanetwork.com/article.aspx?articleid=385438
DWin

25

Bir bayes yaklaşımı alabilir. başarısızlık olasılığını ile belirtir ve rastgele bir değişken olarak düşünün. Bir öncül, deney sonuçlarını görmeden önce, olduğuna inanabilirsiniz . Bu ürünü güvenilir yapmak için mühendislere güveniyorsanız, belki de veya daha . Bu size kalmış. Sonra, posterior dağılımını hesaplamak için Bayes teoremini kullanabilirsiniz . Belirlediğiniz olayı belirtin ( sıfır başarısızlıkla yapılan deneyler).Θ ~ U ( 0 , 1 ) Θ ~ U ( 0 , 0.1 ) İçeride ISTV melerin RWMAIWi'nin bir nΘΘU(0,1)ΘU(0,0.1)θAn

Θp(θ)np(A|θ)nθ

p(Θ=θ|A)=p(A|Θ=θ)p(Θ=θ)p(A)=p(A|θ)p(θ)p(A|θ)p(θ)dθ.
Her şey basit: tek tip, biraz sabittir. Çalıştırmak beri deneyleri, hiçbir sadece olasılığıdır başarısızlıklar içinde yetmezliği olasılığı ile Bernouli denemeler .Θp(θ)np(A|θ)nθ

Bir kez Herhangi bir olay olasılığını hesaplayabilirsiniz: Eğer altın konum integrateion tarafından:B P ( B ) = p ( B | θ ) p ( θ | A ) d θp(θ|A)BP(B)=p(B|θ)p(θ|A)dθ

Aşağıda, yukarıdaki yaklaşımı izleyerek detaylı bir çözüm üzerinde çalışıyorum. Birkaç standart kısayol alacağım.

Birincisi . Sonra: Normalizasyon, sabit olduğu bulunmuştur - Ara sayfalara bakınız beta fonksiyonunun ve beta dağılımını . Öyleyse, , yani parametreleriyle bir beta dağılımıdır .p ( θ | A ) p ( A | θ ) 1 = ( 1 - θ ) n . p ( A ) = p ( A | θ ) p ( θ ) d θ B ( 1 , n + 1 ) p ( θ | A )U(0,1)

p(θ|A)p(A|θ)1=(1θ)n.
p(A)=p(A|θ)p(θ)dθB(1,n+1) 1,n+1p(θ|A)=(1θ)nB(1,n+1)1,n+1

Hiçbir arıza olasılığını Ifade tarafından gelecek yıl ürünlerle . En az bir arıza olasılığı . Sonra B 1 - P ( B ) 1 - P ( B ) = 1 - ( 1 - θ ) m ( 1 - θ ) n-mB1P(B)

1P(B)=1(1θ)m(1θ)nB(1,n+1)dθ=B(1,n+m+1)B(1,n+1)

kullanılarak kabaca . Çok etkileyici değil mi? Başarısızlık olasılığı üzerinde düzenli bir dağılım aldım. Belki de mühendislerinize daha iyi bir inancınız var.n = 100 , 000 , m = 10 , 0000.1n=100,000,m=10,000


3
Bu kadar basit bir problem için gerçek bir çözümün bu kadar kısa düşmesi, özellikle de yöntem çok umut verici göründüğü zaman garip görünüyor. Hesaplamaları zorlaştırıyor musun?
whuber

2
@whuber Unutmadım, bu son adımın açık olduğunu düşündüm. "Baskıcı" derken, ilk 100.000 çalışmada hiçbir başarısızlıkla karşılaştırıldığında,% 10'luk bir başarısızlık olasılığının hala büyük olduğu anlamına geliyor. Ayrıca, eşlenik çiftler hakkındaki yorumunuz için teşekkürler, OP'yi şaşırtıp, onları önemli olandan uzaklaştıracağını düşündüm, bu yüzden atladı.
Yair Daon,

3
Açıkçası, evet - ancak değeri 0.9 olarak belirlediğinizde, önceki metinde ne söylediğiniz önemli değil, insanların göreceği sayı budur. Yanlış anlaşılmadığınızdan, hangi cevabı verdiğiniz konusunda açık olmanız her zaman yardımcı olacaktır. (Btw geliştirilmiş yanıt için + 1)
whuber

3
Gerçekten de, ne olursa olsun mühendisler içinde inanç, bu gözlemlemek eğer, bu gerçekten çok şaşırtıcı değil ortalama yaklaşık bekliyoruz üzerinde yapmanız gerekir hiçbir yetmezliği olan denemeler sonraki içindeki başarısızlıkları en az birini beklemeliyim böylece denemeler ve olasılık ile başarısızlık , ki bu küçük için yaklaşık . Bu nedenle, 100.000 başarılı deneme, sonraki 10.000 deneme içinde en az bir başarısızlığın kabaca% 10'luk bir beklenen ihtimalini vermektedir. k k n 1 - e - k k kn1kkn1ekkk
Ilmari Karonen

2
@whuber Sıfır başarısızlık durumunda önceliğin önemli olmadığını kabul edersiniz. Bu, büyük ölçüde sıfıra yakın bir eğime bağlıdır, örneğin, önceki düz üniforma (beta 1,1) ve önceki Jeffreys (beta 0.5, 0.5), büyük ölçüde farklı bir posterior verecektir.
Erik

12

Bir olasılık hesaplamak yerine, neden kaç ürünün başarısız olabileceğini tahmin etmiyorsunuz ?

Gözlemlerin Modellenmesi

Vardır alanında ürünler ve başka dikkate alınmaktadır. Onların başarısızlıkları tüm bağımsız ve olasılık ile sabittir varsayalım .m = 10000 pn=100000m=10000p

Bu durumu bir Binom deneyi ile modelleyebiliriz: "başarısız" biletler ve "başarı" biletleri bilinmeyen bir oranına sahip olan bir kutudan, bilet (yerine, yani başarısızlık şansı aynı kalır). İlk bilet arasındaki başarısızlıkları say - bu olsun - ve kalan biletler arasındaki başarısızlığı sayarak adlandır .1 - p m + n = 110000 n X m Yp1pm+n=110000nXmY

Soruyu Çerçeveleme

Prensip olarak ve herşey olabilir. Ne ilgilenen şans verilen o (ile herhangi sayıyı ). Başarısızlıklar tüm arasında herhangi bir yerde oluşabilir yana aynı şansa sahip olası her yapılandırma ile, biletleri, bunun sayısını bölünmesi ile bulunur ait -subsets sayısına göre şeylerin tüm -subsets şeylerin:0 Y m , Y = U X + Y = u u { 0 , 1 , ... , m } , n + m, u m u , n + m0Xn0YmY=u X+Y=uu{0,1,,m}n+mumun+m

p(u;n,m)=Pr(Y=u|X+Y=u)=(mu)(n+mu)=m(m1)(mu+1)(n+m)(n+m1)(n+mu+1).

olduğunda hesaplama için karşılaştırılabilir formüller kullanılabilirX=1,2,.

Bu son biletindeki başarısızlıkların sayısı için bir üst tahmin limiti1α (UPL) , , en küçük ( bağlı ) olarak verilmiştir ( .mtα(X;n,m)uXp(u;n,m)α

yorumlama

UPL , veya gözlenmeden önce değerlendirildiği gibi , kullanma riski açısından yorumlanmalıdır . Başka bir deyişle, bunun bir yıl önce olduğunu ve ilk gözlendiğinde bir sonraki ürünlerindeki arıza sayısını tahmin etmek için bir prosedür önerilmesinin istendiğini varsayalım . Müşteriniz sorartαXYmn

Prosedürünüzün öngörme şansı nedir ? Gelecekte daha fazla veriye sahip olduğunuzdan bahsetmiyorum; Şu an demek istiyorum , çünkü şu anda kararlar vermek zorundayım ve benim için mümkün olacak tek şans bu anda hesaplanabilecek olanlardır. ”Y

Cevabınız,

Şu anda şans büyük değil , ancak daha küçük bir tahmin kullanmayı planlıyorsanız, şans değerini aşacaktır .αα

Sonuçlar

İçin , ve o hesaplayabilirn=105m=104X=0

p(0,n,m)=1; p(1,n,m)=1110.091; p(2,n,m)=9091099990.0083;

Böylece, gözlemlendikten sonraX=0 ,

  • İçin kadar (zaman, bir güven , en çok neden vardır tahmin) bir sonraki başarısızlık ürün.1α=90.9%9.1%αtα(0;n,m)=110,000

  • İçin kadar (zaman, bir güven , en vardır tahmin) sonraki başarısızlıklar ürün.99.2%0.8%α<9.1%tα(0;n,m)=210,000

  • Vb.


Yorumlar

Bu yaklaşım ne zaman ve neden geçerli olacak? Şirketinizin birçok farklı ürün yaptığını varsayalım. Performansını gözlemleyerek sonra alanındaki her birinin, bu gibi garantileri, üretmek sever "bir yıl içinde herhangi bir başarısızlık maliyetli değiştirme işlemini tamamlamak." Arıza sayısı için tahmin limitleri alarak, bu garantileri desteklemek zorunda kalmanın toplam maliyetini kontrol edebilirsiniz. Pek çok ürün yaptığınız ve kontrolünüzün dışındaki rastgele şartlardan kaynaklanabilecek arızalar beklediğiniz için, her ürünün deneyimi bağımsız olacaktır. Uzun vadede riskinizi kontrol etmek mantıklın. Arada bir, beklenenden daha fazla talep ödemeniz gerekebilir, ancak çoğu zaman daha az ödeme yaparsınız. Açıklanandan daha fazla ödeme yapmak yıkıcı olabilirse, değerini çok küçük olacak şekilde ayarlayacaksınız (ve muhtemelen daha karmaşık bir başarısızlık modeli de kullanırsınız!). Aksi takdirde, maliyetler düşükse, düşük bir güvenle yaşayabilirsiniz (yüksek ). Bu hesaplamalar güven ve risklerin nasıl dengeleneceğini göstermektedir.αα

Tüm prosedürü hesaplamamız gerekmediğini unutmayın . Biz beklemek gözlenir ve sonra sadece hesaplamaları yapmak o belirli için (burada , yukarıda gösterildiği gibi). Prensip olarak, başlangıçta , olası tüm değerleri için hesaplamaları yapabilirdik .tXXX=0X

Bir Bayesian yaklaşımı (diğer cevaplarda tarif edildiği gibi) çekicidir ve sonuçların öncekine büyük ölçüde bağlı olmaması koşuluyla iyi çalışacaktır . Ne yazık ki, başarısızlık oranı o kadar düşük olduğunda, çok az sayıda (veya hiç hata yok) gözlenir, sonuçlar önceki seçimine duyarlıdır.


+1, ancak doğru görünmüyor. p(0,n,m)=1
amip diyor Reinstate Monica

1
@ COOLSerdash, çünkü ve terimleri sıfıra eşit değildir. up(u,n,m)=1u=1,2...
amip diyor Reinstate Monica

1
Eğer alıyoruz nedeni senin yüzünden @amoeba notlar gibi, olduğu gerçekten , ama daha çok (ve bu nedenle gerçekten veya buna benzer bir şey olarak belirtilmelidir). Bundan sonra tam olarak ne yaptığınızı takip etmekte zorlanıyorum, ama eminim ki, ne olursa olsun, sorulan soruna göre doğru bir çözüm değil. up(u;n,m)>1p(u;n,m)=(mu)(n+mu)Pr(Y=u|X=0)Pr(Y=u|X+Y=u) = Pr(X=0|X+Y=u)p(0;n,m,u)
Ilmari Karonen

1
@IlmariKaronen Yorumlarınız için teşekkür ederiz. Ne karakterize olması gerektiğini haklısın bitti bir olasılık dağılımı olmadığı için, biraz daha net koşullu olasılık olduğunu --O - ama cevap yine kendisi doğru olduğuna inanıyoruz ve ben Tahmin limitlerini hesaplamak için bu yaklaşımın hem doğru hem de geleneksel olduğuna çok eminim. Bu noktaları açıklığa kavuşturmak için bu yazıyı düzenleyeceğim. p(u;n,m)u
whuber

1
@Ilmari Düzenlemeyi zaten yaptım - düzenleme geçmişinde görebilirsiniz. Önceden bir varsayımda bulunmadığımı ve yalnızca bu soruna bir tahmin aralığı tanımını uyguladığımı düşünüyorum . Bunun "istatistiksel olarak anlamlı olup olmadığını" zorlamak istiyorsan, kendini bu standart yapıya titizlikle zorlayacaksın. Örneğin bakınız, Hahn & Meeker, İstatistiksel Aralıklar (J. Wiley 1991).
whuber

9

Aşağıdaki, "10.000 yeni üründen, üretilen ilk 100.000'in tamamının başarısız olması durumunda kaç tanesinin başarısız olması bekleniyor?" Sorusuna verilen bir Bayesian cevabıdır, ancak farklı önceliklere duyarlılığı düşünmelisiniz.

Varsayalım ki verilen şartlı birbirinden bağımsız ve özdeş dağıtılır , bu şekilde , ve önceki eşleniğin kullanılması , .X1,,XnΘ=θX1Θ=θBernoulli(θ)ΘBeta(a,b)a,b>0

İçin , var m<n

E[i=m+1nXi|X1=0,Xm=0]=i=m+1nE[XiX1=0,Xm=0].

İçin , elimizdeki kullandığımız .m+1in

E[XiX1=0,Xm=0]=Pr(Xi=1X1=0,Xm=0)=01Pr(Xi=1Θ=θ)fΘX1,,Xm(θ0,,0)dθ=Γ(m+a+b)Γ(m+a+b+1)Γ(a+1)Γ(a)=am+a+b,
ΘX1=0,,Xm=0Beta(a,m+b)

Numaralarınızı girerek, bir üniforma önceliğiyle ( ) , civarında bir başarısızlık oranı beklerken, bir Jeffreys benzeri önceki ( 1/2 1/2) başarısızlık oranı yakın .a=1,b=110%a=1/2,b=1/25%

Bu öngörücü beklenti iyi bir özet gibi görünmüyor, çünkü öngörücü dağılım oldukça eğridir. Daha ileri gidebilir ve tahmin dağılımını hesaplayabiliriz. Yana koşula başlamadan önce yaptığımız gibi koşullanma için .

i=m+1nXi|Θ=θBin(nm+2,θ),
Pr(i=m+1nXi=t|X1=0,Xm=0)=(nm+2t)Γ(m+a+b)Γ(a)Γ(m+b)Γ(t+a)Γ(nt+2)Γ(n+a+2),
t=0,1,,nm+2

Bunu daha sonra bitireceğim, tahmin aralığı.95%


3
Sonucun 0'a yakın öncekinin şekline duyarlı olduğunu göstermek için + 1 ( olabilir, olabilirlik fonksiyonunun sıfıra yakın kuvvetli bir şekilde yoğunlaştığından, büyük olması durumunda önceliğin tek kısmı budur). örneğin, bir için önce, beklenti yaklaşık olarak orantılıdır , ancak hemen hemen bağımsız . Buna benzer şekilde, üniform bir öncelik, önceliğin veya olup olmaması pek önemli değil , fakat eğer gibi bir öncelik kabul edersek her şey çarpıcı bir şekilde değişecekti .)mBeta(a,b)am+a+bamabU(0,1)U(0,0.01)U(0.01,1)
Ilmari Karonen

6

Laplace'in gün doğumunda sorun yaklaşımı kullanarak , bir ürünün bir yıl içinde başarısız olma ihtimalini elde ediyoruz . Daha sonra, bu olasılık yeni ürünler hiçbiri, bir yıl içinde başarısız olduğunu Bu nedenle, en az bir ürün olasılığı sonraki yıl içinde başarısız olacaktır için değeri . Whuber davasında , aslında oldukça yüksek.

p=1100000+1
n
(1p)n
n
1(11100001)n
n=10000P100000.095P2000000.87

Elbette, daha fazla ürün satılırken verilerinizi güncellemeye devam etmelisiniz, sonuçta biri başarısız olacaktır.


Bu cevap yanlış görünüyor: hesaplaması bir gelecek gündoğumu çarpma yoluyla basitçe uzatmaz. Sonuçta, sayısının ile değiştirildiğini varsayalım . Başarısızlık olasılığının olduğunu iddia eder misiniz ? Cevabınızı Yair Daon'un cevabındaki analizle ve yorumlarla karşılaştırmalısınız. 10,000200,000200000/1000012
whuber

@whuber, düzeltti
Aksakal

1
(1) Ya yanlış hesapladınız ya da “200000”, “20000” için bir yazım hatasıdır. (Yaklaşık almanız gerekir .) (2) Analiziniz şimdi Yair bir kısmını yeniden üretiyor, ancak tam posterior dağıtımı üretmenin yararı yok. 0.865
whuber

@whuber, evet bir daha az sıfır oldu
Aksakal

5

Bu soruya birkaç iyi cevap verildi, ancak son zamanlarda bu konuda birkaç kaynak inceleme şansım oldu ve bu yüzden sonuçları paylaşmaya karar verdim.

Sıfır hata verisi için birden fazla tahmin edici vardır. Diyelim ki , başarısızlık sayısı, ise örneklem büyüklüğü. Bu veri verilen başarısızlık olasılığı için maksimum olabilirlik tahmincisik=0n

(1)P(K=k)=kn=0

Bu tahmin, örneklemimizde hiçbir arıza gözlemlemediğimiz gerçeğinin, genel olarak imkansız olduklarını kanıtlamadığından oldukça tatmin edicidir. Veri dışı bilgi, gözlemlenmemiş olsa bile bazı başarısızlık ihtimallerinin olduğunu göstermektedir . Önceden bilgi sahibi olmak, Bailey (1997), Razzaghi (2002), Basu ve arkadaşları (1996) ve Ludbrook ve Lew (2009) tarafından incelenen Bayesian yöntemlerini kullanmamıza yol açar.

Basit tahmin ediciler arasında varsayım yapan "üst sınır" tahmincisi (Bailey, 1997)

sıfır başarısızlık durumunda P için bir tahmincinin mantıklı olmayacağının, bir başarısızlık durumunda maksimum olasılık tahmin edicisi tarafından öngörülenin üzerinde bir ihtimal yaratması, makul bir üst sınır

olarak tanımlandı

(2)1n

söz edilebilir. Ludbrook ve Lew (2009) tarafından gözden geçirildiği gibi, diğer olasılıklar “üçler kuralı” dır (bkz. Burada , Wikipedia veya Eypasch ve ark, 1995)

(3)3n

veya diğer varyasyonlar:

(4)3n+1

Newcombe ve Altman'ın (ya da 3.6) "3.7 kuralı":

(5)3.7n

"dört yeni kural":

(6)4n+4

Fakat Ludbrook ve Lew'in (2009) belirttiği gibi “üçler kuralı” “yararsız” dır ve “3.6” (ve 3.7) kuralı “ciddi sınırlamalara sahiptir - başlangıçtaki örneklem büyüklüğü 50'nin altındaysa fena halde hatalı ve onlar do tavsiye (6), daha doğrusu düşündüren uygun Bayes tahmin edicileri (aşağıya bakınız) kullanmak - yöntemleri (3).

Bayes tahmin edicileri arasında birkaç farklı söz edilebilir. Bailey (1997) tarafından önerilen ilk tahmin edici

(7)10.51n

Önceden üniforma altında ortanca tahmin için

(8)10.51n+1

veya bu önceliğin altındaki ortalamaları tahmin etmek için

(9)1n+2

sabit başarısızlık oranıyla üssel arıza paterni varsayan bir başka yaklaşım (Poisson dağılımları)

(10)1/3n

Kullandığımız eğer beta parametreleri ile önceden ve biz formülü kullanabilirsiniz (2002 Razzaghi, bakınız):bab

(11)aa+b+n

altında önceki forma (9) yol açar. Jeffreys'i varsaymadan önce olur.a = b = 0.5a=b=1a=b=0.5

(12)12(n+1)

Genel olarak, Bayesian formül (7) - (12) önerilir. Basu ve arkadaşları (1996), daha önceden bazı bilgiler mevcut olduğunda, bilgi vermeyi (11) öneriyor. Tek bir en iyi yöntem bulunmadığından analizinizden önce literatürü gözden geçirmenizi öneririm, özellikle küçükse.n


Bailey, RT (1997). Sıfır arıza verisinden tahmin. Risk Analizi, 17 , 375-380.

Razzaghi, M. (2002). Binomal başarı tahmininde numunede sıfır oluşma olasılığı. Modern Uygulamalı İstatistik Yöntemleri Dergisi, 1 (2), 41.

Ludbrook, J. ve Lew, MJ (2009). Nadir görülen komplikasyon riskini tahmin etmek: 'üçün kuralı' yeterli mi? ANZ cerrahi günlüğü, 79 (7‐8), 565-570.

Eypasch, E., Lefering, R., Kum, CK ve Troidl, H. (1995). Henüz gerçekleşmemiş advers olayların olasılığı: İstatistiksel bir hatırlatma. BMJ 311 (7005): 619-620.

Basu, AP, Gaylor, DW ve Chen, JJ (1996). Bir örnekte sıfır oluşumlu nadir bir kanser için tümörün ortaya çıkma olasılığını tahmin etmek. Düzenleyici Toksikoloji ve Farmakoloji, 23 (2), 139-144.


1
Orada olanların mükemmel bir daha gözden geçirme!
AlefSin

"Bayesyen tahmin ediciler arasında birkaç kişi ..." ile başlayan yorumlar için, verilen bir yorumun üstünde veya altında bulunan formüle ait olup olmadığı genellikle açık değildir. Bunu daha net yapabilir misin?
gung - Monica’yı eski

2

Gerçekten ürünlerinizin tasarımcılarına geri dönmeniz gerekir. Bu, gözlemsel bir istatistik değil, temel bir mühendislik problemidir. Her bir bileşenin arıza olasılığına ve toplam montajlı ürünün net arıza olasılığına ilişkin bir fikirleri olacaktır. Ürünün tüm tasarım ömrü boyunca beklenen arıza sayısını size verebilirler.

Bir inşaat mühendisi 120 yıllık tasarım ömrüne sahip bir köprü tasarlar. Köprünün her bir parçasının hafif bir arıza olasılığı vardır. Her yükleme işleminin aşılma olasılığı azdır. Köprünün inşa edilmesini ekonomik hale getirmek için, toplam çöküş, köprünün korunacağından çok daha uzun olan 2400 yılda yalnızca bir kez gerçekleşecekti. Köprünün 1. yılda, 2. veya 120. yılda başarısız olmaması şaşırtıcı değildir. Bu, çökmediği için size çok az şey söyler. Zamandaki çeşitli başarısızlık şansları yalnızca orijinal tasarımcılar tarafından tahmin edilebilir.


0

Bu, üretimdeki bir hatayı ortadan kaldırmak için yeni bir üretim süreci başlattığımızda karşılaştığım bir soruna benzer.

Yeni sistem hiçbir hata üretmedi, bu yüzden insanlar aynı soruyu soruyorlardı: başarısızlık oranını nasıl öngörürüz? Davanızda, başarısızlığın o dönemde gerçekleştiği zaman endişe duymadan arızanın ortaya çıkabileceği bir süre öngördüğünüzden, geçici etkiler ortadan kalkmıştır. Ve bu basitçe bir şeyin başarısız olup olmamasının bir örneğidir. Bu şartnameyle - cevabım üzerine.

Sezgisel olarak, başarısızlık oranını hesaplayabilmek için en az bir hataya ihtiyacımız var gibi görünüyor. Ancak, bu varsayımın içinde örtülü bir hata vardır. Arıza oranını asla hesaplamayacağız. Çünkü biz bir örnek ile uğraşıyoruz. Bu nedenle, yalnızca bir dizi olası başarısızlık oranı tahmin edebiliriz. Bunu yapmanın yolu, başarısızlık oranı için bir dağıtım bulmaktır. Bu durumda işi yapan dağıtım, parametrelerin olduğu bir Beta dağılımıdır: α = n + 1 ve β = N - n + 1

Not: N , örneklem büyüklüğü ve n , başarısızlıkların sayısıdır (sizin durumunuzda 0)

Senaryonuz için, başarısızlık oranının dağılımı aşağıda gösterilmiştir. görüntü tanımını buraya girin .

Daha sonra bir ünitenin arızalanma olasılığı için bir dağılım elde etmek için bu dağılımı ilgili binom olasılık formülüne beslersiniz (analitik olarak veya Monte Carlo kullanılarak yapılabilir). Sayıların çok düşük olacağından şüpheleniyorum.

Yumruk setinizdeki hataların sayısı ne olursa olsun, bu işlemin uygulanabilir olduğuna dikkat edin.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.