Fisher bu alıntı ile ne anlama geliyor?

14

Bu ünlü alıntıyı her yerde görmeye devam ediyorum, ancak her seferinde vurgulanan kısmı anlayamıyorum.

Alışılmış bir uygulama olarak, önemi% 1 veya daha yüksek bir seviyede olduğunda, bir hipotezi geçici olarak 'reddeden' bir adam, kesinlikle bu tür kararların% 1'inden fazlasında yanılmayacaktır. Çünkü hipotez doğruysa, bu vakaların sadece% 1'inde yanılıyor olacak ve yanlış olduğunda asla reddedilmeyecek. [...] Bununla birlikte, hesaplama saçma akademiktir, çünkü aslında hiçbir bilimsel çalışanın yıldan yıla sabit bir önemi yoktur ve her durumda hipotezleri reddeder; daha ziyade aklını her bir davaya kanıtları ve fikirleri ışığında verir.Bir test uygulamak için seçilen vakaların açıkça yüksek oranda seçilmiş bir grup olduğu ve seçim koşullarının tek bir işçi için bile belirlenemeyeceği unutulmamalıdır; ne de kullanılan argümanda, belirli bir duruşma tarafından belirtilen gerçek önem düzeyini, sanki sadece bu seviyeyi kullanmak gibi yaşam boyu alışkanlığı olarak seçmenin açıkça gayri meşru olacağını.

(İstatistiksel Yöntemler ve Bilimsel Çıkarım, 1956, s. 42-45)

Daha spesifik olarak, anlamıyorum

Neden "yüksek oranda seçilmiş" bir test uygulamak için vakalar seçilir? Bir bölgedeki insanların ortalama yüksekliğinin 165 cm'den az olup olmadığını merak ettiğinizi ve bir test yapmaya karar verdiğinizi varsayalım. Standart prosedür, bildiğim kadarıyla , bölgeden rastgele örnekler çizmek ve yüksekliklerini ölçmektir. Bu nasıl yüksek oranda seçilebilir?
Olguların yüksek oranda seçildiğini varsayalım, ancak bu önem düzeyinin seçimi ile nasıl ilişkilidir? Yukarıdaki örneği tekrar düşünün, eğer örnekleme yönteminiz (sanırım Fisher'ın seçim koşulları olarak bahsettiği şey ) çarpıksa ve bir şekilde uzun boylu insanları destekliyorsa, o zaman tüm araştırma mahvedilir ve önem seviyesinin öznel belirlenmesi onu kurtaramaz.
$p$

— nalzok
kaynak

15

İşte Fisher'ın cesurca alıntısında söylediklerini benim açıklamam. Unutulmamalıdır ki, hangi hipotezin test edileceğini çok fazla seçer, o kadar ki tek bir kişinin kararı için bile, hepsini belirleyemezsiniz. Unutulmamalıdır ki, yukarıda belirtilen nedenlerden dolayı, belirli bir araştırmanın önem seviyesine, yaşam boyu alışkanlık olarak her zaman aynı şekilde karar veremezsiniz.

Bilimsel bir hipotez, araştırmacının önyargısı ve mevcut bilgi durumu nedeniyle diğer birçok rakip hipoteze karşı test edilmeye değer olarak seçilir. Hipotezler değil, numune "oldukça seçilmiş" vardır; hipotezler zaman testleri uygulamak vakaları vardır.
Hipotezlerin seçim süreci önem seviyemizi etkiler. Bir hipotezden çok eminsek, bu önem düzeyini kendimizi tatmin etmek için daha az sıkı yapmalıdır. Emin olmadığımız takdirde daha yüksek kanıt yükü vardır. Uyuşturucu denemelerinde Tip I hatasının Tip II'den daha kötü olması gibi diğer faktörler de devreye girer.
Bence "tarafından belirtildi" derken "seçilen" anlamına gelir. Evet, p değeri daha aşırı ise hipotezi reddettiğimiz önceden belirlenmiş bir değerdir.

— Drew N
kaynak

10

Fisher'ın bahsettiği vakalar gözlem değil testlerdir. Yani, test etmek için hipotezler seçiyoruz. Sadece rastgele hipotezleri test etmiyoruz - onları gözlem, edebiyat, bilimsel teoriler vb.

Eğer varsa yaptığımız testi rastgele hipotezler, daha sonra kaç kez sen% 1 olacaktır (senin alıntı ilk cümlesinde) hatalıyız (ya da her türlü değer seçilir). Örneğin,

Bir kişinin sosyal güvenlik numarasının paritesi IQ'su ile ilişkilidir
Sarı saçlı insanlar Frisbees koyu saçlı insanlardan daha iyi atmak
Çapraz Onaylı için cevap alma süresi, adınızdaki hece sayısı ile ilgilidir.

Ve bir demetini% 1'de test ettik, boşluğu yaklaşık% 1 oranında reddederdik ve yanlış yaparız. (Tabii ki, yukarıdaki saçmalıklarla bir şey yapmaya devam etmiyorum).

Bir keresinde saç rengi ve Frizbi fırlatma hakkında bir makale gördüm - ve bir fark buldu! Ben de buna "Frizbi araştırması" diyorum.

Ama alıntıdan en çok hoşlandığım kısım şudur:

aslında hiçbir bilimsel çalışanın yıldan yıla sabit bir önemi yoktur ve her koşulda hipotezleri reddeder; daha ziyade aklını her bir davaya delilleri ve fikirleri ışığında verir.

Mezarında dönüyor olmalı.

— Peter Flom - Monica'yı eski durumuna döndürün
kaynak

4

Bu iyi bir cevap, ama "Frizbi araştırması" nı kötü şeyler olarak görmekten çekiniyorum. Metodolojiler uygun şekilde kullanıldığı sürece (etki büyüklüğü, vb. Dikkate alınarak), sonucun makul olduğunu düşünürdüm. Demek istediğim, saç renginin Frizbi fırlatmayla hiçbir ilgisi olmadığına inanılıyor, ancak yüzlerce yıl öncesine kadar Dünya'nın evrenin merkezinde olduğu kabul edildi! İnsanları bir şeyleri yanlış yaptığı için eleştirebiliriz, ancak soru sormaktan kimseyi suçlamamalıyız. Bununla birlikte, bazı hipotezlerin diğerlerinden daha az yararlı olduğunu kabul ediyorum , ancak yine de doğru olabilirler .

— nalzok

Ayrıca tip I hataları da olabilirler.

— Peter Flom - Monica'yı eski durumuna döndürün

1

İlgili: xkcd.com/882

— jkdev

2

Teklifin arka planını görmeye çalışarak kitabın biraz farklı bir teklifi olan bir sürümüne geldim (hangi sürümün olduğundan emin değilim)

https://archive.org/details/in.ernet.dli.2015.134555/page/n47

Bilimsel araştırmada anlamlılık testlerinin tutarlılığını açıklamak için yapılan girişimler, doğru veya yanlış olmalarına dayanarak olası ifadelerin varsayımsal frekanslarına atıfta bulunarak, bu tür testlerin temel niteliğini kaçırmaktadır. Alışılmış bir uygulama olarak, önemi% 1 veya daha yüksek bir seviyede olduğunda, bir hipotezi geçici olarak "reddeden" bir adam, bu tür kararların% 1'inden fazlasında kesinlikle yanılmayacaktır. Çünkü hipotez doğruysa, bu vakaların sadece% 1'inde yanılıyor olacak ve yanlış olduğunda asla reddedilmeyecek. Bu nedenle bu eşitsizlik bildirimi yapılabilir. Bununla birlikte, hesaplama saçma akademiktir, çünkü aslında hiçbir bilimsel çalışanın yıldan yıla ve her durumda, hipotezleri reddeder; daha ziyade aklını her bir davaya kanıtları ve fikirleri ışığında verir. Ayrıca, hesaplama sadece kanıtların ışığında, çoğu zaman doğru olmadığına inanılmayan bir hipoteze dayanmaktadır, böylece böyle bir ifadenin herhangi bir anlamı olduğu varsayılarak, hatalı kararın gerçek olasılığı önem düzeyini belirten frekanstan çok daha az. Bir hipotezi reddeden pratik bir adam için, elbette, hipotezi yanlış bir şekilde kabul etmesine neden olabilecek bir kayıtsızlık meselesidir, çünkü durumunda kabul etmemektedir. çoğu zaman doğru olmadığına inanılmaz, böylece böyle bir ifadenin herhangi bir anlamı olduğu varsayılarak hatalı kararın gerçek olasılığı, önem düzeyini belirten frekanstan çok daha az olabilir. Bir hipotezi reddeden pratik bir adam için, elbette, hipotezi yanlış bir şekilde kabul etmesine neden olabilecek bir kayıtsızlık meselesidir, çünkü durumunda kabul etmemektedir. çoğu zaman doğru olmadığına inanılmaz, böylece böyle bir ifadenin herhangi bir anlamı olduğu varsayılarak hatalı kararın gerçek olasılığı, önem düzeyini belirten frekanstan çok daha az olabilir. Bir hipotezi reddeden pratik bir adam için, elbette, hipotezi yanlış bir şekilde kabul etmesine neden olabilecek bir kayıtsızlık meselesidir, çünkü durumunda kabul etmemektedir.

Bu bana reddetme olasılıklarının, tip I hataların matematiksel ifadesini bazı titiz argümanlar olarak kullanmak için bir eleştiri gibi görünüyor. Bu ifadeler genellikle alakalı olan şeyler için iyi bir ifade değildir ve titiz de değildir.

Neden "yüksek oranda seçilmiş" bir test uygulamak için vakalar seçilir?

Bu cümle ile ilişkili gibi görünüyor

Ayrıca, hesaplama sadece kanıtlar ışığında çoğu zaman doğru olduğuna inanılmayan bir hipoteze dayanmaktadır.

Biz test ediliyor hipotezi karşı kayıtsız değildir ve çoğu zaman test ediliyor bir hipotez olduğunu değil gerçek olduğuna inanılan.
bu önem düzeyinin seçimi ile nasıl ilişkilidir?

Bu,

böylece, böyle bir ifadenin herhangi bir anlamı olduğu varsayılarak, hatalı kararın gerçek olasılığı, önem düzeyini belirten frekanstan çok daha az olabilir.

P-değeri sıfır-hipotez zaman hata yapma sadece sıklığıdır olduğu doğrudur. Ancak gerçek hata yapma sıklığı farklı olacaktır (daha düşük).
"belirli bir denemede belirtilen gerçek önem düzeyi" ne

Bu bölümün bir çeşit p-değeri korsanlığına atıfta bulunduğuna inanıyorum. Gözlemler gerçekleştikten sonra gözlemlenen p-değerini eşleştirmek için önem düzeyini alfa olarak değiştirmek ve bunun baştan beri kesme değeri olduğunu iddia etmek.

— Sextus Empiricus
kaynak