Geoff Cumming'in 2008 makalesinde Replikasyon ve Aralıkları'nı okuyordum : p değerleri geleceği yalnızca belirsiz bir şekilde öngörüyor, ancak güven aralıkları çok daha iyi sonuç veriyor [Google Akademik'te 200 alıntı] - ve merkezi iddialarından biriyle kafam karıştı. Bu Cumming karşı savunuyor gazetelerin dizi biridir -değerlerinin ve güven aralıkları lehine; Ancak benim sorum, bu tartışma ile ilgili değil ve sadece p değerleri ile ilgili özel bir iddia ile ilgilidir .
Özetten alıntı yapmama izin verin:
Bu makalede, bir ilk deney sonuçları, iki-kuyruklu ise göstermektedir ki, , bir orada 80 % tek kuyruklu şans p , bir replikasyon-değeri aralığı düşecek ( 0,00008 , .44 ) bir 10 şansı % p < .00008 ve tamamen % 10 şansı p > .44 . Dikkat çekici bir şekilde, aralık - p aralığı olarak adlandırılan - bu geniş ancak örneklem büyüklüğüdür.
Cumming, bu "iddia aralığı" ve aslında bütün dağıtım (aynı sabit numune boyutu ile), özgün deney çoğaltma zaman bir, bağlı elde söyledi -değerleri sadece orijinal ilgili -değeri ve gerçek efekt boyutuna, gücüne, örneklem büyüklüğüne veya başka bir şeye bağlı değilsiniz:
[...] olasılık dağılımı δ (veya güç) için bir değer bilmeden veya üstlenmeden elde edilebilir . [...] Biz hakkında herhangi bir ön bilgi kabul etmez ö ve sadece bilgi kullanma E d i f f [gözlenen grup arası fark] ilgili verdiği δ belirli bir hesaplama esas olarak p o b t bölgesinin p ve p aralıklarının dağılımı .
Bana bunun dağılımı gibi görünüyor çünkü ben bu karıştı orijinal oysa-değerlerinin güçlü, güç bağlıdır p o b t kendi başına bu konuda herhangi bir bilgi vermez. Gerçek etki büyüklüğü δ = 0 olabilir ve ardından dağılım tekdüze olabilir; ya da belki gerçek etki boyutu çok büyük ve o zaman çoğunlukla çok küçük beklemelisiniz p -değerlerine. Elbette kişi önceden muhtemel etki büyüklükleri üzerinde biraz varsaymakla başlayabilir ve onun üzerinde bütünleşebilir, ancak Cumming bunun yaptığı şey olmadığını iddia ediyor gibi görünüyor.
Soru: Burada tam olarak neler oluyor?
Bu konunun bu soru ile ilgili olduğuna dikkat edin: İlk denemenin% 95 güven aralığında etki tekrarı deneylerinin ne kadarı olacaktır? @whuber tarafından mükemmel bir cevap. Cumming'in bu konuyla ilgili bir makalesi var: Cumming & Maillardet, 2006, Güven Aralıkları ve Çoğaltma: Gelecek Ortalama Nereye Düşecek? - ama bu açık ve sorunsuz.
Ayrıca, Cumming'in iddiasının 2015 Doğa Yöntemleri belgesinde birkaç kez tekrarlandığına da dikkat çekiyorum . Fickle değeri , bazılarınızın karşılaşmış olabileceği yeniden üretilemez sonuçlar veriyor (Google Akademik'te zaten ~ 100 alıntı var):
[...] tekrarlanan deneylerin değerlerinde önemli farklılıklar olacaktır . Gerçekte, deneyler nadiren tekrarlanır; Bir sonraki P'nin ne kadar farklı olabileceğini bilmiyoruz . Ancak çok farklı olabileceği muhtemel. Örneğin, bir deneyin istatistiksel gücüne bakılmaksızın, tek bir kopya P değeri 0.05 P değerini verirse , % 80'lik bir tekrar deneyinin 0 ile 0.44 arasında P değeri döndürme olasılığı (ve % 20 değişiklik [sic ] bu P daha da büyük olurdu).
(Bakılmaksızın Cumming ifadesi doğru olup olmadığına bakılmaksızın, Doğa Yöntemleri kağıt yanlış da alıntı nasıl, bu arada, tarafından Not: Cumming göre, sadece var üzerinde olasılık 0.44 . Ve evet, kağıt% 20 chan" diyor g e ". Pfff.)