Sahada 1 yıl boyunca 100.000 ürünümüz olup, arızasız bir şeyin (bir ürün) arızalanma olasılığını söylemenin bir yolu olup olmadığını merak ediyordum. Satılan sonraki 10.000 üründen birinin arızalanma olasılığı nedir?
Sahada 1 yıl boyunca 100.000 ürünümüz olup, arızasız bir şeyin (bir ürün) arızalanma olasılığını söylemenin bir yolu olup olmadığını merak ediyordum. Satılan sonraki 10.000 üründen birinin arızalanma olasılığı nedir?
Yanıtlar:
Bir ürünün bozulma olasılığı kesinlikle zamanın ve kullanımın bir fonksiyonudur. Kullanım hakkında herhangi bir veri yok ve sadece bir yıl ile hiçbir arıza yok (tebrikler!). Bu nedenle, bu yönü ( hayatta kalma işlevi olarak adlandırılır ) verilerinizden tahmin edilemez.
Bununla birlikte, bir yıl içindeki arızaları binom dağılımından aldığı gibi düşünebilirsiniz . Hala başarısızlığın yok, ama bu şimdi yaygın bir sorundur. Basit bir çözüm, büyük (kesinlikle sahip olduğunuz) ile doğru olan 3 kuralını kullanmaktır . Spesifik olarak, bir yıllık% 95 güven aralığının üst sınırını (yani alt sınır ) bir yıl içinde olarak gerçek başarısızlık olasılığını alabilirsiniz . Sizin durumunuzda, oranın düşük olduğuna% 95 güveniyorsunuz . 0 3 / N 0,00003
Ayrıca, bir sonraki 10k'dan birinin veya daha fazlasının başarısız olma olasılığını nasıl hesaplayacağınızı sordunuz. Yukarıdaki analizi genişletmenin hızlı ve basit (aşırı da olsa) bir yolu, sadece üst sınırı temel olasılık olarak kullanmak ve karşılık gelen binom CDF'yi başarısızlığı olasılığını elde etmek için kullanmaktır . Kod kullanarak şunları yapabiliriz: bu , sonraki 10k ürünlerde bir veya daha fazla hata görme şansı veriyor. Üst sınır kullanıldığında, bu en az bir başarısızlık olasılığının en uygun nokta tahmini değildir, bunun yerine arızası olasılığının dan fazla olma ihtimalinin çok düşük olduğunu söyleyebilirsiniz.≥ 1 ≈ 26 % ( K + 1 ) / ( K + 2 ) F p = 9,9998 x 10 - 06 1 + ≈ 10 %R
1-pbinom(0, size=10000, prob=0.00003)
0.2591851
(bunun biraz 'el dalgalı' bir çerçeve olduğunu kabul ederek). Bir başka olasılık da @ amoeba'nın Laplace'in arka arkaya kuralıyla ilgili tahminde bulunma önerisini kullanmaktır . Ardışıklık kuralı, tahmin edilen başarısızlık olasılığının olduğunu belirtir ; burada , başarısızlıkların sayısıdır. Bu durumda, ve tahmin edilen olasılık hesaplama sonraki 10.000 hataları olduğu , sonuçta , veya . 1-pbinom(0, size=10000, prob=9.9998e-06)
0.09516122
Bir bayes yaklaşımı alabilir. başarısızlık olasılığını ile belirtir ve rastgele bir değişken olarak düşünün. Bir öncül, deney sonuçlarını görmeden önce, olduğuna inanabilirsiniz . Bu ürünü güvenilir yapmak için mühendislere güveniyorsanız, belki de veya daha . Bu size kalmış. Sonra, posterior dağılımını hesaplamak için Bayes teoremini kullanabilirsiniz . Belirlediğiniz olayı belirtin ( sıfır başarısızlıkla yapılan deneyler).Θ ~ U ( 0 , 1 ) Θ ~ U ( 0 , 0.1 ) İçeride ISTV melerin RWMAIWi'nin bir n
Θp(θ)np(A|θ)nθ
Bir kez Herhangi bir olay olasılığını hesaplayabilirsiniz: Eğer altın konum integrateion tarafından:B P ( B ) = ∫ p ( B | θ ) p ( θ | A ) d θ
Aşağıda, yukarıdaki yaklaşımı izleyerek detaylı bir çözüm üzerinde çalışıyorum. Birkaç standart kısayol alacağım.
Birincisi . Sonra: Normalizasyon, sabit olduğu bulunmuştur - Ara sayfalara bakınız beta fonksiyonunun ve beta dağılımını . Öyleyse, , yani parametreleriyle bir beta dağılımıdır .p ( θ | A ) ∝ p ( A | θ ) ⋅ 1 = ( 1 - θ ) n . p ( A ) = ∫ p ( A | θ ) p ( θ ) d θ B ( 1 , n + 1 ) p ( θ | A )
Hiçbir arıza olasılığını Ifade tarafından gelecek yıl ürünlerle . En az bir arıza olasılığı . Sonra B 1 - P ( B ) 1 - P ( B ) = 1 - ∫ ( 1 - θ ) m ( 1 - θ ) n-
kullanılarak kabaca . Çok etkileyici değil mi? Başarısızlık olasılığı üzerinde düzenli bir dağılım aldım. Belki de mühendislerinize daha iyi bir inancınız var.n = 100 , 000 , m = 10 , 000
Bir olasılık hesaplamak yerine, neden kaç ürünün başarısız olabileceğini tahmin etmiyorsunuz ?
Vardır alanında ürünler ve başka dikkate alınmaktadır. Onların başarısızlıkları tüm bağımsız ve olasılık ile sabittir varsayalım .m = 10000 p
Bu durumu bir Binom deneyi ile modelleyebiliriz: "başarısız" biletler ve "başarı" biletleri bilinmeyen bir oranına sahip olan bir kutudan, bilet (yerine, yani başarısızlık şansı aynı kalır). İlk bilet arasındaki başarısızlıkları say - bu olsun - ve kalan biletler arasındaki başarısızlığı sayarak adlandır .1 - p m + n = 110000 n X m Y
Prensip olarak ve herşey olabilir. Ne ilgilenen şans verilen o (ile herhangi sayıyı ). Başarısızlıklar tüm arasında herhangi bir yerde oluşabilir yana aynı şansa sahip olası her yapılandırma ile, biletleri, bunun sayısını bölünmesi ile bulunur ait -subsets sayısına göre şeylerin tüm -subsets şeylerin:0 ≤ Y ≤ m , Y = U X + Y = u u { 0 , 1 , ... , m } , n + m, u m u , n + m
olduğunda hesaplama için karşılaştırılabilir formüller kullanılabilir
Bu son biletindeki başarısızlıkların sayısı için bir üst tahmin limiti (UPL) , , en küçük ( bağlı ) olarak verilmiştir ( .
UPL , veya gözlenmeden önce değerlendirildiği gibi , kullanma riski açısından yorumlanmalıdır . Başka bir deyişle, bunun bir yıl önce olduğunu ve ilk gözlendiğinde bir sonraki ürünlerindeki arıza sayısını tahmin etmek için bir prosedür önerilmesinin istendiğini varsayalım . Müşteriniz sorar
Prosedürünüzün öngörme şansı nedir ? Gelecekte daha fazla veriye sahip olduğunuzdan bahsetmiyorum; Şu an demek istiyorum , çünkü şu anda kararlar vermek zorundayım ve benim için mümkün olacak tek şans bu anda hesaplanabilecek olanlardır. ”
Cevabınız,
Şu anda şans büyük değil , ancak daha küçük bir tahmin kullanmayı planlıyorsanız, şans değerini aşacaktır .
İçin , ve o hesaplayabilir
Böylece, gözlemlendikten sonra ,
İçin kadar (zaman, bir güven , en çok neden vardır tahmin) bir sonraki başarısızlık ürün.
İçin kadar (zaman, bir güven , en vardır tahmin) sonraki başarısızlıklar ürün.
Vb.
Bu yaklaşım ne zaman ve neden geçerli olacak? Şirketinizin birçok farklı ürün yaptığını varsayalım. Performansını gözlemleyerek sonra alanındaki her birinin, bu gibi garantileri, üretmek sever "bir yıl içinde herhangi bir başarısızlık maliyetli değiştirme işlemini tamamlamak." Arıza sayısı için tahmin limitleri alarak, bu garantileri desteklemek zorunda kalmanın toplam maliyetini kontrol edebilirsiniz. Pek çok ürün yaptığınız ve kontrolünüzün dışındaki rastgele şartlardan kaynaklanabilecek arızalar beklediğiniz için, her ürünün deneyimi bağımsız olacaktır. Uzun vadede riskinizi kontrol etmek mantıklı. Arada bir, beklenenden daha fazla talep ödemeniz gerekebilir, ancak çoğu zaman daha az ödeme yaparsınız. Açıklanandan daha fazla ödeme yapmak yıkıcı olabilirse, değerini çok küçük olacak şekilde ayarlayacaksınız (ve muhtemelen daha karmaşık bir başarısızlık modeli de kullanırsınız!). Aksi takdirde, maliyetler düşükse, düşük bir güvenle yaşayabilirsiniz (yüksek ). Bu hesaplamalar güven ve risklerin nasıl dengeleneceğini göstermektedir.
Tüm prosedürü hesaplamamız gerekmediğini unutmayın . Biz beklemek gözlenir ve sonra sadece hesaplamaları yapmak o belirli için (burada , yukarıda gösterildiği gibi). Prensip olarak, başlangıçta , olası tüm değerleri için hesaplamaları yapabilirdik .
Bir Bayesian yaklaşımı (diğer cevaplarda tarif edildiği gibi) çekicidir ve sonuçların öncekine büyük ölçüde bağlı olmaması koşuluyla iyi çalışacaktır . Ne yazık ki, başarısızlık oranı o kadar düşük olduğunda, çok az sayıda (veya hiç hata yok) gözlenir, sonuçlar önceki seçimine duyarlıdır.
Aşağıdaki, "10.000 yeni üründen, üretilen ilk 100.000'in tamamının başarısız olması durumunda kaç tanesinin başarısız olması bekleniyor?" Sorusuna verilen bir Bayesian cevabıdır, ancak farklı önceliklere duyarlılığı düşünmelisiniz.
Varsayalım ki verilen şartlı birbirinden bağımsız ve özdeş dağıtılır , bu şekilde , ve önceki eşleniğin kullanılması , .
İçin , var
İçin , elimizdeki kullandığımız .
Numaralarınızı girerek, bir üniforma önceliğiyle ( ) , civarında bir başarısızlık oranı beklerken, bir Jeffreys benzeri önceki ( 1/2 1/2) başarısızlık oranı yakın .
Bu öngörücü beklenti iyi bir özet gibi görünmüyor, çünkü öngörücü dağılım oldukça eğridir. Daha ileri gidebilir ve tahmin dağılımını hesaplayabiliriz. Yana koşula başlamadan önce yaptığımız gibi koşullanma için .
Bunu daha sonra bitireceğim, tahmin aralığı.
Laplace'in gün doğumunda sorun yaklaşımı kullanarak , bir ürünün bir yıl içinde başarısız olma ihtimalini elde ediyoruz . Daha sonra, bu olasılık yeni ürünler hiçbiri, bir yıl içinde başarısız olduğunu Bu nedenle, en az bir ürün olasılığı sonraki yıl içinde başarısız olacaktır için değeri . Whuber davasında , aslında oldukça yüksek.
Elbette, daha fazla ürün satılırken verilerinizi güncellemeye devam etmelisiniz, sonuçta biri başarısız olacaktır.
Bu soruya birkaç iyi cevap verildi, ancak son zamanlarda bu konuda birkaç kaynak inceleme şansım oldu ve bu yüzden sonuçları paylaşmaya karar verdim.
Sıfır hata verisi için birden fazla tahmin edici vardır. Diyelim ki , başarısızlık sayısı, ise örneklem büyüklüğü. Bu veri verilen başarısızlık olasılığı için maksimum olabilirlik tahmincisi
Bu tahmin, örneklemimizde hiçbir arıza gözlemlemediğimiz gerçeğinin, genel olarak imkansız olduklarını kanıtlamadığından oldukça tatmin edicidir. Veri dışı bilgi, gözlemlenmemiş olsa bile bazı başarısızlık ihtimallerinin olduğunu göstermektedir . Önceden bilgi sahibi olmak, Bailey (1997), Razzaghi (2002), Basu ve arkadaşları (1996) ve Ludbrook ve Lew (2009) tarafından incelenen Bayesian yöntemlerini kullanmamıza yol açar.
Basit tahmin ediciler arasında varsayım yapan "üst sınır" tahmincisi (Bailey, 1997)
sıfır başarısızlık durumunda P için bir tahmincinin mantıklı olmayacağının, bir başarısızlık durumunda maksimum olasılık tahmin edicisi tarafından öngörülenin üzerinde bir ihtimal yaratması, makul bir üst sınır
olarak tanımlandı
söz edilebilir. Ludbrook ve Lew (2009) tarafından gözden geçirildiği gibi, diğer olasılıklar “üçler kuralı” dır (bkz. Burada , Wikipedia veya Eypasch ve ark, 1995)
veya diğer varyasyonlar:
Newcombe ve Altman'ın (ya da 3.6) "3.7 kuralı":
"dört yeni kural":
Fakat Ludbrook ve Lew'in (2009) belirttiği gibi “üçler kuralı” “yararsız” dır ve “3.6” (ve 3.7) kuralı “ciddi sınırlamalara sahiptir - başlangıçtaki örneklem büyüklüğü 50'nin altındaysa fena halde hatalı ve onlar do tavsiye (6), daha doğrusu düşündüren uygun Bayes tahmin edicileri (aşağıya bakınız) kullanmak - yöntemleri (3).
Bayes tahmin edicileri arasında birkaç farklı söz edilebilir. Bailey (1997) tarafından önerilen ilk tahmin edici
Önceden üniforma altında ortanca tahmin için
veya bu önceliğin altındaki ortalamaları tahmin etmek için
sabit başarısızlık oranıyla üssel arıza paterni varsayan bir başka yaklaşım (Poisson dağılımları)
Kullandığımız eğer beta parametreleri ile önceden ve biz formülü kullanabilirsiniz (2002 Razzaghi, bakınız):b
altında önceki forma (9) yol açar. Jeffreys'i varsaymadan önce olur.a = b = 0.5
Genel olarak, Bayesian formül (7) - (12) önerilir. Basu ve arkadaşları (1996), daha önceden bazı bilgiler mevcut olduğunda, bilgi vermeyi (11) öneriyor. Tek bir en iyi yöntem bulunmadığından analizinizden önce literatürü gözden geçirmenizi öneririm, özellikle küçükse.
Bailey, RT (1997). Sıfır arıza verisinden tahmin. Risk Analizi, 17 , 375-380.
Razzaghi, M. (2002). Binomal başarı tahmininde numunede sıfır oluşma olasılığı. Modern Uygulamalı İstatistik Yöntemleri Dergisi, 1 (2), 41.
Ludbrook, J. ve Lew, MJ (2009). Nadir görülen komplikasyon riskini tahmin etmek: 'üçün kuralı' yeterli mi? ANZ cerrahi günlüğü, 79 (7‐8), 565-570.
Eypasch, E., Lefering, R., Kum, CK ve Troidl, H. (1995). Henüz gerçekleşmemiş advers olayların olasılığı: İstatistiksel bir hatırlatma. BMJ 311 (7005): 619-620.
Basu, AP, Gaylor, DW ve Chen, JJ (1996). Bir örnekte sıfır oluşumlu nadir bir kanser için tümörün ortaya çıkma olasılığını tahmin etmek. Düzenleyici Toksikoloji ve Farmakoloji, 23 (2), 139-144.
Gerçekten ürünlerinizin tasarımcılarına geri dönmeniz gerekir. Bu, gözlemsel bir istatistik değil, temel bir mühendislik problemidir. Her bir bileşenin arıza olasılığına ve toplam montajlı ürünün net arıza olasılığına ilişkin bir fikirleri olacaktır. Ürünün tüm tasarım ömrü boyunca beklenen arıza sayısını size verebilirler.
Bir inşaat mühendisi 120 yıllık tasarım ömrüne sahip bir köprü tasarlar. Köprünün her bir parçasının hafif bir arıza olasılığı vardır. Her yükleme işleminin aşılma olasılığı azdır. Köprünün inşa edilmesini ekonomik hale getirmek için, toplam çöküş, köprünün korunacağından çok daha uzun olan 2400 yılda yalnızca bir kez gerçekleşecekti. Köprünün 1. yılda, 2. veya 120. yılda başarısız olmaması şaşırtıcı değildir. Bu, çökmediği için size çok az şey söyler. Zamandaki çeşitli başarısızlık şansları yalnızca orijinal tasarımcılar tarafından tahmin edilebilir.
Bu, üretimdeki bir hatayı ortadan kaldırmak için yeni bir üretim süreci başlattığımızda karşılaştığım bir soruna benzer.
Yeni sistem hiçbir hata üretmedi, bu yüzden insanlar aynı soruyu soruyorlardı: başarısızlık oranını nasıl öngörürüz? Davanızda, başarısızlığın o dönemde gerçekleştiği zaman endişe duymadan arızanın ortaya çıkabileceği bir süre öngördüğünüzden, geçici etkiler ortadan kalkmıştır. Ve bu basitçe bir şeyin başarısız olup olmamasının bir örneğidir. Bu şartnameyle - cevabım üzerine.
Sezgisel olarak, başarısızlık oranını hesaplayabilmek için en az bir hataya ihtiyacımız var gibi görünüyor. Ancak, bu varsayımın içinde örtülü bir hata vardır. Arıza oranını asla hesaplamayacağız. Çünkü biz bir örnek ile uğraşıyoruz. Bu nedenle, yalnızca bir dizi olası başarısızlık oranı tahmin edebiliriz. Bunu yapmanın yolu, başarısızlık oranı için bir dağıtım bulmaktır. Bu durumda işi yapan dağıtım, parametrelerin olduğu bir Beta dağılımıdır: α = n + 1 ve β = N - n + 1
Not: N , örneklem büyüklüğü ve n , başarısızlıkların sayısıdır (sizin durumunuzda 0)
Senaryonuz için, başarısızlık oranının dağılımı aşağıda gösterilmiştir. .
Daha sonra bir ünitenin arızalanma olasılığı için bir dağılım elde etmek için bu dağılımı ilgili binom olasılık formülüne beslersiniz (analitik olarak veya Monte Carlo kullanılarak yapılabilir). Sayıların çok düşük olacağından şüpheleniyorum.
Yumruk setinizdeki hataların sayısı ne olursa olsun, bu işlemin uygulanabilir olduğuna dikkat edin.