Bayes istatistikleri istatistiksel süreç kontrolü için neden daha popüler değil?


18

Bayesci ve sık sık tartışma konusundaki anlayışım, sıklık istatistikleri:

  • nesneldir (veya iddia edilir)
  • veya en azından tarafsız
  • farklı varsayımları kullanan farklı araştırmacılar yine de nicel olarak karşılaştırılabilir sonuçlar elde edebilirler

bayes istatistikleri iken

  • "daha iyi" tahminlerde bulunduğunu iddia ediyor (yani daha düşük beklenen kayıp), çünkü ön bilgileri kullanabilir (diğer nedenlerin yanı sıra)
  • daha az "ad hoc" seçeneğe ihtiyaç duyuyor, bunların yerine (en azından prensipte) gerçek dünya yorumu olan önceki / model tercihleri ​​geliyor.

Buna göre, Bayes istatistiklerinin SPC'de çok popüler olmasını beklerdim: Süreç kalitemi kontrol etmeye çalışan bir fabrika sahibi olsaydım, öncelikle beklenen kaybı umursardım; Bunu azaltabilirsem, çünkü rakiplerimden daha fazla / daha iyi ön bilgiye sahibim, hatta daha iyi.

Ancak pratikte SPC hakkında okuduğum her şey sıkı bir şekilde sık görülüyor (yani önceki dağılımlar, tüm parametrelerin nokta tahminleri, örnek boyutu, p-değerleri hakkında birçok geçici seçenek vb. Yok)

Neden? SPC'nin kalem ve kağıt kullanarak yapıldığı 1960'larda sıkça istatistiklerin neden daha iyi bir seçim olduğunu görebiliyorum. Ama neden o zamandan beri kimse farklı yöntemler denemedi?


2
Bayesian istatistiklerini Dijital SLP kameram olarak düşünürken, iPhone kamera olarak da sık sık. İkisini de bir süre satın aldım ama telefon dinlendirmesi% 95 iken DSLR'yi fotoğrafların% 5'inden daha az kullanıyorum. Kolay, kullanışlı ve cebinde olduğundan ve kaliteye göre birçok zaman sağlar (DSLR becerilerime dayanarak). Öncekileri ve çalışan zincirleri samanlara dahil etmek gibi, diyafram açıklığı açma süresi, uzunluğu ve diğer parametrelerin optimum dengesini bulmam gerekiyor. Iphone popüler sonu.
Ram Sharma

@RamSharma bunu bir cevap olarak göndermelisiniz! Şef bıçağı benzetimimden daha çok hoşuma gidiyor.
shadowtalker

Yanıtlar:


18

UYARI Bu cevabı uzun zaman önce ne hakkında konuştuğumu çok az bir fikirle yazdım. Kabul edildiğinden silemiyorum, ancak içeriğin çoğunun arkasında duramıyorum.


Bu çok uzun bir cevap ve umarım bir şekilde yardımcı olacaktır. SPC benim alanım değil, ancak bu yorumların burada geçerli olacak kadar genel olduğunu düşünüyorum.

En çok atıfta bulunulan avantajın - önceki inançları dahil etme yeteneğinin - uygulanan / ampirik alanların zayıf bir avantajı olduğunu iddia ediyorum . Çünkü öncekini ölçmeniz gerekiyor . "Pekala, z seviyesi kesinlikle mantıksız" diyebilsem bile, hayatım boyunca sana z'nin altında ne olması gerektiğini söyleyemem. Yazarlar ham verilerini sürüler halinde yayınlamaya başlamadığı sürece, öncelikler için en iyi tahminlerim, önceki çalışmalardan, karşılaştığınız koşullara benzer koşullar altında takılmış veya takılmamış olabilecek koşullu anlardır.

Temel olarak, Bayesian teknikleri (en azından kavramsal bir seviyede), güçlü bir varsayım / fikir / modeliniz olduğunda ve veriye almak istediğinizde mükemmeldir, sonra ne kadar yanlış veya yanlış olduğunuzu görün. Ancak genellikle iş süreciniz için belirli bir model konusunda haklı olup olmadığınızı görmek istemezsiniz; büyük olasılıkla hayırve sürecinizin ne yapacağını görmek istiyoruz. Sonuçlarınızı iletmek istemiyorsunuz, verilerinizin sonuçlarınızı iletmesini istiyorsunuz. Yeterli veriye sahipseniz, zaten ne olacak, ama bu durumda neden öncekiyle uğraşıyorsunuz? Belki de aşırı derecede şüpheci ve riskten kaçınan bir şeydi, ama hiç de başarılı olmayan iyimser bir işadamı duymadım. Kendi inançlarınızla ilgili belirsizliğinizi ölçmenin bir yolu yoktur ve yanlış şeylere aşırı güvenme riskini almamayı tercih edersiniz . Böylece önceden bilgilendirici olmayan bir şey belirlersiniz ve avantaj ortadan kalkar.

Bu, SPC durumunda ilginçtir, örneğin dijital pazarlamanın aksine, iş süreçleriniz sonsuza dek öngörülemeyen bir akı durumunda değildir . Benim izlenimim, iş süreçlerinin kasıtlı ve aşamalı olarak değişme eğiliminde olmasıdır. Yani, iyi ve güvenli öncelikler oluşturmak için uzun zamanınız var. Ancak hatırlayın ki, öncelikler tamamen belirsizliği yaymakla ilgilidir. Öznellik bir yana, Bayesizm, derin iç içe veri üretme süreçlerinde belirsizliği nesnel olarak yayması avantajına sahiptir . Bu benim için Bayesci istatistiklerin gerçekten iyi olduğu şey. Prosesinizin 20'si 1 arada "önem" sınırının çok ötesinde güvenilirlik arıyorsanız, mümkün olduğunca fazla belirsizliği hesaba katmak isteyebileceğiniz gibi görünüyor.

Peki Bayes modelleri nerede? Öncelikle, uygulanması zor. Açıkça söylemek gerekirse, OLS'yi 15 dakika içinde bir makine mühendisine öğretebilir ve Matlab'da başka bir 5'teki regresyonları ve t-testleri çıkarmasını sağlayabilirim. ve sonra şirketimdeki bir kişinin bildiği bir dilde hazırlanmış bir kütüphane olup olmadığını görün. Değilse, HATA veya Stan kullanmalıyım. Ve sonra temel bir cevap almak için simülasyonları çalıştırmam gerekiyor ve bu 8 çekirdekli bir i7 makinesinde yaklaşık 15 dakika sürüyor. Hızlı prototipleme için çok fazla. İkincisi, bir cevap aldığınız zaman, yalnızca kümelenmiş standart hatalarla sık rastlanan rastgele efektlerle elde edebileceğinizle aynı sonucu elde etmek için iki saat kodlama ve bekleme harcadınız. Belki bunların hepsi küstah ve yanlıştır ve SPC'yi hiç anlamıyorum.

Bayesianizmi çok kaliteli bir şef bıçağına, bir tencereye ve bir sautee tavaya benzetiyorum ; sıklık, kolay drenaj için muz dilimleyici ve kapakta delikli makarna kapları gibi As-Seen-On-TV araçlarıyla dolu bir mutfak gibidir . Mutfakta çok deneyime sahip pratik bir aşçıysanız - gerçekten, temiz ve düzenli olan kendi bilgi birikim mutfağınızda ve her şeyin nerede olduğunu biliyorsanız - küçük seçiminizle inanılmaz şeyler yapabilirsiniz. zarif, yüksek kaliteli aletler. Ya da, basit, gerçekten yarı kötü olmayan ve noktayı anlayan birkaç temel aromaya sahip bir yemek yapmak için sıfır beceri gerektiren farklı küçük ad-hoc * araçlarını kullanabilirsiniz. Veri madenlerinden eve yeni geldiniz ve sonuçlara açsınız; hangi aşçısın

* Bayes tıpkı geçici, ama daha az şeffaf . Coq au vin'inize ne kadar şarap giriyor? Hiçbir fikrim yok, göz küresi çünkü bir profesyonelsin. Veya, bir Pinot Grigio ve bir Pinot Noir arasındaki farkı söyleyemezsiniz, ancak Epicurious'daki ilk tarifin 2 bardak kırmızı kullandığını söyledi, böylece yapacaksınız. Hangisi daha "ad-hoc"?


1
+1, harika cevap. Merak ediyorum: Küçük / uyarlanabilir örnek boyutları hakkında bir paragraf ekleyebilir misiniz? SPC'de 3-5 boyutlarındaki numuneler yaygın görünmektedir. Ve eğer SPC yazılımı 2 numuneden sonra teknisyene 3 numuneye gerçekten ihtiyaç duyup duymadığını söyleyebilseydi, bu harika bir özellik olurdu . Bayesli bir modelle, bu neredeyse beyinsizdir: Ölçümler, yanlış pozitifler ve negatifler için bir maliyet tanımlayın, ardından başka bir ölçüm almanın veya durmanın beklenen maliyetini tahmin edin. Sık sık istatistiklerde, garip durdurma kuralı efektleriyle uğraşmak zorunda kalacaksınız (15 dakika içinde bunları bir ME'ye öğretebilir misiniz?)
nikie

1
Örneklem büyüklüğüne gelince, sorun ve örneklerin o kadar küçük olduğunu bilseydim, bundan bahsederdim, çok az gözlemle tahminleriniz önceden seçtiğinize çok duyarlı olacaktır . Bir taştan kan alamazsınız, bu yüzden bir değiş tokuş vardır: ya sık sık bir tahminciyle aşırı derecede uyuyorsunuz, ancak bunu birkaç varsayımla yapıyorsunuz veya önceden kendi bilginizi (veya eksikliğinizi) yeterince belirsiz bir şekilde birleştiriyorsunuz ve esasen önünüzde sahip verilere hem uyum ve "veri" kafanın içinde var. Kafanızda önceden üniforma giymenize izin verilir.
shadowtalker

1
Temel olarak, Bayes analisti beynini başlangıçta kullanması için daha fazla yük bindirir. Şahsen, öncelikleri belirleme fikrine karşı olmanın ya a) çok tembel olduğunuzu ya da b) istatistiklerin nasıl çalıştığını gerçekten anlamadığınızı (birini bilmek, vb.) Anlamadığınızı gösteren bir işaret olduğunu düşünüyorum. Cevabımdaki öncelikleri ölçmenin zor olduğunu söyledim; Aslında pratikte buna katılmıyorum. Her zaman yapabileceğiniz bir şey, bir sayfaya bir çan eğrisi çizmek ve kendinize "Verilerimin böyle görünmesini bekler miydim?" Değilse, eğriyi değiştirmeye başlayın. Ve modu nereye yapıştıracağınıza karar veremiyorsanız, bir hiper prior kullanın.
shadowtalker

2
Bir soru (bratty olması amaçlanmamıştır): önceki inançları (nicel olarak) istemekle ilgili bir literatür olduğunu biliyorsunuz, değil mi? Yayınlanmış inançlar, mülakat yapılan uzman ve uzman olmayan inançlar ve öz inançlar dahil. Sormamın nedeni, daha önce bu şikayeti duymuş olmamdır, ancak bu tür şikayetlerin yazarları, itirazlarının bir soruşturmanın başlangıcı yerine tartışmanın sonu olduğunu düşündüler.
Alexis

1
@CliffAB İlginç… Bu literatürü derinlemesine okumadım (Bernardo, Kaas, Garthwaite ... birkaç on yıl öncesine ait)… ama bu sizin için değer yüklü bilim: farklı önceki inançlar birinin frekansçı mı yoksa Bayesci yöntemleri mi tercih ettiğini bildirir. ;)
Alexis

5

Benim düşünceme göre, Bayes istatistikleri yaygın kullanımı ile çelişen bazı dezavantajlardan muzdariptir (SPC'de ancak diğer araştırma sektörlerinde de):

  1. Sık sık muadiline karşı tahminler almak daha zordur (sınıfların en geniş kısmı istatistik üzerinde yaklaşımı benimser. Bu arada, Bayesçi istatistiklerin sınırlı popülaritesinin nedeni mi yoksa etkisi mi olduğunu araştırmak ilginç olacaktır. ).

  2. Çoğu zaman Bayesci istatistikler, sadece tıklat ve gör (aynı zamanda, bu yaklaşım sıklık çerçevesi altında da teşvik edilmemelidir) değil , aynı sorunla başa çıkmanın farklı yolları hakkında (örneğin, en iyi olanı?) Seçimler uygular .

  3. Bayesci istatistiklerin çok deneyimli istatistikçilerden daha azı tarafından yönetilmesi zor olan bazı konuları vardır (örn. Uygunsuz öncelikler );

  4. Bu gerektiren hassasiyet analizleri eksik veri analizi gibi bazı konular için yapılan (genellikle frequentist çerçevesinde kaçınılması) ve istisnalar.

  5. Hesaplama için yalnızca bir (övgüye değer, ücretsiz indirilebilir) yazılım vardır.

  6. Bu daha fazla zaman alır frequentist araçları ile daha Bayesian sahip özerk araştırmacı olmak.


6
İyi cevap ama 5. maddeye katılmıyorum: Bayesian analizi için birçok farklı (ücretsiz) yazılım düşünebilirim: WinBUGS, OpenBUGS, JAGS, Stan, PyMC ... ve eminim daha fazlası var. Söyleyeceğim, tüm bu yazılımların dik bir öğrenme eğrisine sahip olması ve iyi miktarda programlama ve istatistiksel bilgi gerektirmesidir.
COOLSerdash

COOLSerdash haklı ve hem açıklığa hem de yoruma hoş geldiniz. Bayesian analiz yazılımlarını listeleme konusundaki kapsamlı eksikliğim muhtemelen sadece WinBugs'a olan (gevşek) aşinalıkımdan kaynaklanıyordu.
Carlo Lazzaro

@CarloLazzaro COOLSerdash'ın # 5 konusundaki görüşüne de katılıyorum: Sürüm 14'ten itibaren, özel lisanslı ancak ana akım istatistik paketi Stata şimdi Bayes modelleri ve vanilya paketinde tahmin içeriyor. Bence Bayesçi hesaplama kullanılabilirliği sadece büyüyecek. Ancak diğer hususlarınız da önemlidir ve Bayes taraftarları için gündemi bilgilendirmeye yardımcı olmalıdır.
Alexis

@Alexis: Stata kullanıcısı olarak, son zamanlarda Bayes lezzetinden memnunum. Daha genel bir düşünce olarak, üniversitedeki istatistik dersleri sırasında hem sık, hem de Bayesci yaklaşımları öğrenmeyi kefil ederim (muhtemelen olasılık uzmanları homurdanmaya başlar!).
Carlo Lazzaro

3

Bunun bir nedeni, Bayesci istatistiklerin 1990'lara kadar ana akımdan donmuş olmasıdır. 1970'lerde istatistik eğitimi alırken neredeyse sapkınlıktı (her yerde değil, çoğu lisansüstü programda). İlginç sorunların çoğunun zorlanmasına yardımcı olmadı. Sonuç olarak, bugün istatistik öğreten (ve dergiler için makaleleri gözden geçiren ve müfredat tasarlayan) hemen hemen herkes sık sık eğitim görüyor. SAS ve Stata gibi paketlere yavaş yavaş yol alan Markov Zinciri Monte Carlo (MCMC) yöntemlerinin yaygınlaşmasıyla 1990'larda işler değişmeye başladı. Şahsen, 10 yıl içinde çok daha yaygın olacaklarını düşünüyorum, ancak özel uygulamalarda (SPC) çok fazla avantajları olmayabilir.

Uyanan gruplardan biri Bayes analizini daha yaygın bir şekilde kullanılabilir kılmaktadır STAN paketini geliştiren gruptur (mc-stan.org).


Sitemize hoşgeldiniz! Sadece "STATA" yerine "Stata" olduğunu not - Ben kendim büyük harfle Stata kullanıcılarının yanlış ucunda olmuştur! (SAS, SPSS vs gibi olduğunu düşündüm, ama görünüşe göre değil ...)
Silverfish
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.