Parçacık fiziğinde kanıt kabul etmek için “5


33

Haberlerde, CERN'in yarın , Higgs bozonunun deneysel olarak 5 kanıtı ile tespit edildiğini açıklayacağı bildirildi . Bu makaleye göre:σ

5 % 99.99994 CMS ve ATLAS dedektörlerinin gördüğü verinin rastgele bir gürültü olmadığı ve% 0.00006 şanssız gözükme şansı olduğunu; 5 , bilimsel bir “keşif” olarak resmen etiketlenecek bir şey için gerekli olan kesinliktir.σσσ

Bu süper titiz değildir, ancak ayar fizikçiler istatistik yöntemi "hipotezi test" standart kullanımı söyleyebiliriz görünmektedir için karşılık gelir, (iki uçlu)? Yoksa başka bir anlamı var mı?0.0000006 z = 5α0.0000006z=5

Bilimde, tabii ki, alfa 0,05 ayarlanması rutin olarak yapılır. Bu, "two- " kanıtlarına eşdeğer olacaktır , buna rağmen dendiğini hiç duymamıştım. Alfa çok daha katı bir tanımının standart olduğu başka alanlar (parçacık fiziğinin yanı sıra) var mı? Five- kuralının parçacık fiziği tarafından nasıl kabul edildiğine dair bir referans bilen var mı?σσσ

Güncelleme: Bu soruyu basit bir nedenden dolayı soruyorum. Sezgisel Biyoistatistik kitabımın (çoğu istatistik kitabı gibi) olağan "P <0.05" kuralının ne kadar keyfi olduğunu açıklayan bir bölümü vardır. Bu çok fazla (çok!) Daha küçük bir değerinin gerekli olduğu düşünülen bir bilimsel alan örneği eklemek istiyorum . Ancak, örneğin Bayesian yöntemlerinin kullanılmasıyla (aslında bazı yorumlarda belirtildiği gibi) örnek gerçekten daha karmaşıksa, o zaman pek uygun olmazdı veya daha fazla açıklama gerektiriyor.α


2
Hiç "Altı Sigma" yı duydun mu?
Daniel R Hicks,

Kalite kontrolünde altı sigmanın Daniel'in sorusu / yorumuyla önerdiği gibi olduğu düşünülmektedir. Bu reddetme olasılıklarının hepsi normal bir dağılımdan örneklemeyi üstlenir ve kuyruk olasılıkları diğer dağılımlar için daha büyük olabilir. 5 veya 6 sigma gibi bu uçları kullanmak sadece özel durumlarda faydalı olabilir. Uygulamada verilerdeki örneklem büyüklüğü ve değişkenlik 2 veya 3 sigmanın ötesindeki çıkarımı olanaksız kılar.
Michael R. Chernick,

1
Temel olarak, çoğu parçacık fizikçisi, parametreleri hesaplarken bayesyen düşünceler konusunda daha rahatlar, bu yüzden aslında " % , veri ve öncekiler göz önüne alındığında, kesinlikle Higgs'in sinyalinin sıfır olmadığı" dır. sadece "sinyalin rasgele gürültü olma şansı yüzde 0.01" dir (sistematiklerden kaynaklanan rasgele olmayan dalgalanmalar da var!). [1]: physics.stackexchange.com/questions/8752/…X%
Néstor

3
@ Néstor: Şimdi Higgs basın konferansının canlı yayınını izliyorum ve kimse Bayesian yorumlarından bahsetmiyor. "p-değerleri" ve "anlamlılık düzeyi" kullanılır, ancak sadece korkunç biçimde yanlış biçimlendirilmiş Bayesian, bunları sinyalin rastgele gürültü olması ihtimalleri olarak yorumlardı. OP'nin sorusundaki alıntıdaki metnin sadece bir p-değerinin gerçekte ne olduğuna dair yanlış bir yorum olduğunu düşünüyorum.
MånsT

1
BTW Bu konuda blogumda bir blog yazısı yaptım: randomastronomy.wordpress.com .
Néstor,

Yanıtlar:


13

Çoğu istatistik uygulamasında “bütün modeller yanlış, bazıları yararlıdır” şeklinde eski kestane olduğu görülmektedir. Durum böyle olunca, bir modelin sadece belli bir seviyede performans göstermesini beklerdik, çünkü bazı basit modelleri kullanarak inanılmaz derecede karmaşık bir işlemi tarif ettik.

Fizik çok farklı, bu yüzden istatistiksel modellerden geliştirilen sezgi pek uygun değil. Fizikte, özellikle doğrudan temel fiziksel yasalarla ilgilenen parçacık fiziğinde, modelin gerçekliğin tam bir açıklaması olduğu varsayılmaktadır. Modelin öngördüklerinden ayrılma, modelin bir kısıtlaması değil, deneysel gürültü ile tamamen açıklanmalıdır. Bu, eğer model iyi ve doğru ise ve deneysel aparat, istatistiksel önemin çok yüksek olması gerektiği , dolayısıyla ayarlanan yüksek çubuğun olması gerektiği anlamına gelir.

Diğer bir neden ise tarihseldir, parçacık fiziği topluluğu geçmişte daha düşük oranlarda geri çekilen 'keşifler' ile yakılmıştır, bu nedenle genel olarak daha temkinlidirler.


1
Fiziğin çok düşük alfa ile standart istatistiksel hipotez testi kullandığını kabul ediyor musunuz (bu durumda, yine de). Yoksa Nestor'un yukarıdaki yorumda söylediği gibi bir tür Bayesian yaklaşımı mı kullanıyorlar?
Harvey Motulsky

2
ATLAS'ta çalışan tanıdığım bazı insanlarla konuşma anlayışım analizin tamamen Bayesçi olduğu. Ancak bunlar düşük seviyeli erkeklerdir (yani işi gerçekten yapanlar). Konuşan kafaların bazıları yükselirse, zincirin yorumu daha kötü anlaması beni şaşırtmazdı. Olduğu söyleniyor, LHC sonuçlarının sunumu oldukça zayıftı ve diğerlerinin de belirttiği gibi gerçekten de Bayesian ile karşılaşmadı.
Bogdanovist

2
Özellikle parçacık fiziğinin milyarlarca olayla da uğraştığını düşündüm, bu yüzden çıtayı çok yüksek tutmanız gerekiyor.
Wayne,

11

Tarihçe ve köken

Robert D Cousins 1 ve Tommaso Dorigo 2'ye göre, 5 σ eşik orijin kökeninin 60'lı yılların ilk parçacık fiziği çalışmasında yattığı, yeni keşfedilen bazı parçacıkları gösterebilecek çok sayıda saçılma deneyi histopu araştırıldığı ve arandığı . Eşik, yapılan çoklu karşılaştırmaları hesaba katmak için zorlu bir kuraldır.125σ

Her iki yazar da, Rosenfeld 3'ün 1968 tarihli bir makalesine atıfta bulunmuş , bununla birlikte ölçülen birkaç 4 σ etkisinin olduğu uzak mide ve baryonların olup olmadığı sorusunu ele almıştır . Makale, yayınlanan iddia sayısının istatistiksel olarak beklenen dalgalanma sayısına karşılık geldiğini savunarak soruyu olumsuz olarak yanıtladı. Bu argümanı destekleyen birkaç hesaplama ile birlikte, makale 5 σ seviyesinin kullanılmasını destekledi:34σ5σ

Rosenfeld: Biz uzak dışarı kütle spektrumları diken bildirilmiş olmasına araştırmaya devam Önce" (Kππ)3/2,(πρ) öncelikle istediğim 1968'de neler talep önemi eşik karar vermelidir experimentalists muhtemelen dikkat gerekli olmakla beraber size göstermek için 3σ daha iyi yapacağını -Etkileri, kuramcı ve fenomenologların etkisi ulaşır kadar beklemek >4σ ."

ve daha sonra gazetede (vurgu benimdir)

4σ3σ5σ

Tommaso, Rosenfeld makalesiyle başladığını belirtmekte dikkatli görünüyor.

Tommaso: "Bununla birlikte, makalenin 1968'de yazılmış olduğunu, ancak keşif iddiaları için beş standart sapmanın kesin kriterinin yetmişlerde ve seksenlerde kabul edilmediğini not etmeliyiz. Örneğin, beş sigma kriteri gibi bir şey kullanılmadı 1984 yılında Nobel Fizik Ödülü'ndeki Rubbia ve Van der Meer'i kazanan W ve Z bozonlarının keşfi için. "

5σ4

Schneider: "Sıklıkla,% 95 veya% 99 'güven seviyeleri' görünüşte Tutarsız veriler için cinsindendir, ancak sadece iki veya üç istatistiksel Sigmas bu tutarlar. Ben öğretildi beş sigma daha az bir şey inanmamamı sen düşünüyorsanız, hangi Bu saçma bir zorunluluktur -% 99,9999'luk bir güven seviyesi gibi bir şey.Ama tabii ki, böyle bir sınır kullanılıyor çünkü sigmanın gerçek büyüklüğü neredeyse hiç bilinmiyor, astronomide çok fazla serbest değişken var. "Kontrol etme ya da bilme."

4σ5σ5

Franklin: 2003 yılına kadar “gözlem” için 5 standart sapma kriterinin etkili olduğu görülüyor.

...

BaBar işbirliğinin bir üyesi, bu zamana kadar 5-sigma kriterinin Fiziksel İnceleme Mektupları editörleri tarafından bir rehber olarak verildiğini hatırlıyor


Modern kullanım

5σ67

Z=55σ2.87×107

5σ

  • 5σ3σ4σ

  • 5σ

  • σσσ6σ

  • 5σ

5σ8,912


Diğer alanlar

Diğer birçok bilimsel alanın benzer eşikleri olmadığını veya bir şekilde konuyla ilgilenmediğini not etmek ilginçtir. Bunun, 0,05 veya 0,01 önem kazandıran bir deneyi uzatmanın çok maliyetli (veya imkansız) olduğu insanlarla yapılan deneylerde biraz mantıklı olduğunu hayal ediyorum.

1011


  1. Kuzenler, RD (2017). Jeffreyler-Lindley paradoksu ve yüksek enerji fiziğinde keşif kriterleri. Synthese, 194 (2), 395-432 sayılı belge. arxiv bağlantısı

  2. Dorigo, T. (2013) Beş Sigma Kriterini Azaltmak, science20.com 2019-03-07

  3. Rosenfeld, AH (1968). Herhangi bir uzak meson veya bariyer var mı? web kaynağı: escholarship

  4. Burbidge, G., Roberts, M., Schneider, S., Sharp, N., ve Tifft, W. (1990, Kasım). Panel tartışma: Kırmızıya kayma ile ilgili problemler. NASA Konferans Yayınında (Cilt 3098, s. 462). harvard.edu'da fotokopi bağlantısı

  5. Franklin, A. (2013). Değişen standartlar: Yirminci yüzyılda parçacık fiziğinde deneyler. Pittsburgh Üniversitesi Yayınları.

  6. 5 sigmanın anlamı nedir? physics.org'dan 2019-03-07

  7. Beringer, J., Arguin, JF, Barnett, RM, Copic, K., Dahl, O., Damat, DE, ... & Yao, WM (2012). Parçacık fiziğinin tekrarı. Fiziksel İnceleme D-Parçacıklar, Alanlar, Gravitasyon ve Kozmoloji, 86 (1), 010001. (bölüm 36.2.2. Önemlilik testleri, sayfa 394, link aps.org )

  8. Lyons, L. (2013). 5 sigmanın önemini keşfetme. arXiv ön baskı arXiv: 1310.1284. arxiv bağlantısı

  9. Lyons, L. (2014). Yeni Fizik Araştırmalarında İstatistiksel Konular. arXiv ön baskı arxiv link

  10. Baker, M. (2015). Psikoloji çalışmalarının yarıdan fazlası tekrarlanabilirlik testinde başarısız olmaktadır. Doğa Haberleri nature.com sitesinden 2019-03-07

  11. Horton, R. (2015). Çevrimdışı: ilacın 5 sigması nedir? Lancet, 385 (9976), 1380. thelancet.com adresinden 2019-03-07


4

Fizik olandan tamamen farklı bir nedenden ötürü, hipotez testlerine girdiklerinde çok daha katı alfalara sahip başka alanlar da vardır. Genetik Epidemiyoloji, aralarında özellikle hastalık için çeşitli genetik belirteçlere bakmak için "GWAS" (Genom-Wide Association Study) kullandıklarındadır.

Bir GWAS çalışması, çoklu hipotez testlerinde büyük bir egzersiz olduğu için , modern analiz tekniklerinin tümü, 0.05'ten çok daha katı alfalar etrafında inşa edilmiştir. Genomik çalışmaların ardından izleyen diğer "aday tarama" çalışma teknikleri de aynı şekilde olacaktır.


2
α

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.