Aslında, p-değerleri nihayet 'modası geçmiştir': http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 . Boş hipotez anlamlılık testi (NHST) örnek büyüklüğünüzün açıklamasından biraz daha fazlasını üretir. (*) Herhangi bir deneysel müdahalenin bir etkisi olacaktır , yani ' etkisiz'in basit sıfır hipotezinin katı anlamda her zaman yanlış olduğu söylenebilir . Bu nedenle, 'anlamlı olmayan' test basitçe örnek büyüklüğünüzün yeterince büyük olmadığı anlamına gelir; 'anlamlı' test, bir şeyi 'bulmak' için yeterli veri topladığınız anlamına gelir.
'Etki büyüklüğü', sorunun doğal ölçeğine bir ölçü getirerek bunu düzeltmeye yönelik bir girişimi temsil eder. Tedavilerin her zaman bir etkisi olduğu tıpta (plasebo etkisi olsa bile), bir 'tedavinin' bulunma olasılığından% 50 daha fazla korunma olasılığına karşı korunmak için 'klinik olarak anlamlı bir etki' kavramı ortaya çıkar. istatistiksel olarak anlamlı derecede önemli bir etki '(ancak küçük).
Çalışmanızın doğasını anlarsam, Klarnetçi, o zaman günün sonunda, meşru amacı, sizin görüşünüz altındaki okullarda eğitimi geliştiren eylemleri / müdahaleleri bilgilendirmektir . Bu nedenle, ortamınız bir karar teorik olanıdır ve Bayesci yöntemler en uygun (ve benzersiz olarak tutarlı [1] ) yaklaşımdır.
Gerçekten de, sık kullanılan yöntemleri anlamanın en iyi yolu Bayesci yöntemlere yaklaşmaktır . Tahmini etki büyüklüğü Bayesci posterior dağılım için bir merkeziyet ölçüsüne yönelik olarak anlaşılabilirken , p-değeri bu posteriorun bir kuyruğunu ölçmeye yönelik olarak anlaşılabilir. Bu nedenle, bu iki miktar birlikte , probleminizle ilgili karar-teorik bir bakış açısının doğal girdisini oluşturan Bayes posteriorunun kaba bir özünü içerir. (Alternatif olarak, etki büyüklüğü üzerinde sıkça bir güven aralığı da aynı şekilde güvenilir bir aralık olarak anlaşılabilir .)
Psikoloji ve eğitim alanlarında, Bayesci yöntemler aslında oldukça popülerdir. Bunun bir nedeni, Bayes modellerine gizli değişkenler olarak 'konstrüksiyonlar' kurmanın kolay olmasıdır. Bir psikolog olan John K.Kruschke'nin 'köpek yavrusu kitabını' kontrol etmek isteyebilirsiniz . Eğitimde (öğrencilerin sınıflara yerleştirildiği, okullara yerleştirildiği, ilçelere yerleştirildiği, ...), hiyerarşik modelleme kaçınılmazdır. Bayes modelleri de hiyerarşik modelleme için mükemmeldir. Bu hesapta Gelman & Hill [2] 'e göz atmak isteyebilirsiniz.
[1]: Robert, Christian P. Bayesci Seçim: Karar Kuramsal Temellerden Hesaplamalı Uygulamaya. 2. baskı. İstatistiklerde Springer Metinleri. New York: Springer, 2007.
[2]: Gelman, Andrew ve Jennifer Hill. Regresyon ve Çok Düzeyli / Hiyerarşik Modeller Kullanarak Veri Analizi. Sosyal Araştırmalarda Analitik Yöntemler. Cambridge; New York: Cambridge University Press, 2007.
Bayes-tuğla-ile-baş-baş-at gerek-olmayan bir şekilde ' dayak ' bir bakış açısından 'tutarlılık' hakkında daha fazla bilgi için , bkz [3].
[3]: Robins, James ve Larry Wasserman. “Koşullama, Olasılık ve Tutarlılık: Bazı Temel Kavramların İncelenmesi.” Amerikan İstatistik Derneği Dergisi 95, no. 452 (1 Aralık 2000): 1340-46. DOI: / 01621459.2000.10474344 10.1080.
(*) [4] 'te Meehl, NHST'yi benden çok daha zarif, ancak daha az aşındırıcı bir şekilde yok ediyor:
Sıfır hipotezi her zaman yarı yanlış olduğundan, “önemli farklılıklar” örüntüleri açısından araştırmayı özetleyen tablolar, istatistiksel güç fonksiyonlarının karmaşık, nedensel olarak yorumlanamayan sonuçlarından biraz daha fazladır.
[4]: Meehl, Paul E. “Teorik Riskler ve Tablo Yıldızları: Sir Karl, Sir Ronald ve Yumuşak Psikolojinin Yavaş Gelişimi.” Danışmanlık ve Klinik Psikiyatri Dergisi 46 (1978): 806-34. http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf
İşte Tukey'den ilgili bir alıntı: /stats//a/728/41404