Bir priori güç analizi esasen işe yaramaz mı?


23

Geçtiğimiz hafta Kişilik ve Sosyal Psikoloji Derneği toplantısına katıldım ; Uri Simonsohn tarafından örneklem büyüklüğünü belirlemek için priori güç analizi kullanmanın sonuçların varsayımlara karşı çok duyarlı olduğu iddiasıyla bir konuşma gördüm.

Tabii ki, bu iddia benim yöntemler sınıfımda öğretildiklerime ve birçok önde gelen metodolojistin tavsiyelerine (en önemlisi Cohen, 1992 ) tavsiyelerine aykırıdır . Aşağıdaki bu kanıtların bir kısmını yeniden yaratmaya çalıştım.

Basit olması için, iki gözlem grubunuzun olduğu bir durumu hayal edelim ve etki büyüklüğünün (standartlaştırılmış ortalama farkıyla ölçüldüğü gibi) olduğunu tahmin edelim . Standart bir güç hesaplaması ( aşağıdaki paketi kullanarak yapılır ), bu tasarımla% 80 güç elde etmek için gözlem yapmanız gerektiğini söyleyecektir .128.5Rpwr128

require(pwr)

size <- .5
# Note that the output from this function tells you the required observations per group
# rather than the total observations required
pwr.t.test(d = size, 
           sig.level = .05, 
           power = .80, 
           type = "two.sample", 
           alternative = "two.sided")

Ancak, genellikle, etkinin beklenen büyüklüğü hakkındaki tahminlerimiz (en azından benim çalışma alanım olan sosyal bilimlerde) sadece bu - çok kaba tahminlerdir. O zaman etkinin büyüklüğü hakkındaki tahminimiz biraz azalırsa ne olur? Hızlı bir güç hesaplama etkinin büyüklüğü ise söyleyen yerine ihtiyacınız - gözlemleri Eğer bir etki boyutu için yeterli güce sahip gerekir ki kat sayı . Etkinin büyüklüğü ise Aynı şekilde, , sadece ihtiyaç gözlem, sen bir etki büyüklüğünü tespit etmek için yeterli güce sahip gerekir ne% 70.5. 200 1.56 .5 .6. 90 .50.4.52001.56.5.690.50. Pratik olarak konuşursak, tahmin edilen gözlemlerdeki aralık oldukça geniştir - - .20090200

Bu sorunun bir cevabı, etkinin büyüklüğünün ne olabileceği konusunda kesin bir tahminde bulunmak yerine, etkinin büyüklüğü hakkında geçmiş literatür veya pilot testler yoluyla kanıt toplamanızdır. Elbette, pilot testler yapıyorsanız, pilot testinizin, çalışmayı çalıştırmak için gereken örnek boyutunu belirlemek için çalışmanızın bir sürümünü çalıştırmadığınızdan yeterince küçük olmasını istersiniz (örneğin, Pilot testinde kullanılan örneklem büyüklüğünün çalışmanızın örnek büyüklüğünden daha küçük olmasını isteyin).

Uri Simonsohn, güç analizinizde kullanılan etki büyüklüğünü belirlemek amacıyla yapılan pilot testlerin faydasız olduğunu savundu. Çalıştığım aşağıdaki simülasyonu göz önünde bulundurun R. Bu simülasyon, popülasyon etki büyüklüğünün olduğunu varsayar . Daha sonra 40'lık boyutta "pilot testi" yapar ve önerilen , 10000 pilot testinin her birinde sıralar.1000 N.51000N

set.seed(12415)

reps <- 1000
pop_size <- .5
pilot_n_per_group <- 20
ns <- numeric(length = reps)

for(i in 1:reps)
{
  x <- rep(c(-.5, .5), pilot_n_per_group)
  y <- pop_size * x + rnorm(pilot_n_per_group * 2, sd = 1)
  # Calculate the standardized mean difference
  size <- (mean(y[x == -.5]) - mean(y[x == .5])) / 
          sqrt((sd(y[x == -.5])^2 + sd(y[x ==.5])^2) / 2)

  n <- 2 * pwr.t.test(d = size,
                      sig.level = .05, 
                      power = .80,
                      type = "two.sample", 
                      alternative = "two.sided")$n

  ns[i] <- n
}

Aşağıda bu simülasyonu temel alan bir yoğunluk grafiği bulunmaktadır. Görüntünün daha iyi yorumlanabilmesi için üzerinde bir takım gözlemler öneren pilot testlerden 204'ünü . Simülasyonun daha az aşırı sonuçlarına odaklanmakla birlikte , pilot test tarafından önerilen büyük farklılıklar vardır .500 N s 1000204500Ns1000

görüntü tanımını buraya girin

Tabii ki, varsayım sorununa olan duyarlılığın, birinin tasarımı daha karmaşık hale geldikçe daha da kötüleştiğinden eminim. Örneğin, rastgele etkiler yapısının özelliklerini gerektiren bir tasarımda, rastgele etkiler yapısının doğası tasarımın gücü için çarpıcı etkilere sahip olacaktır.

Peki, bu argüman hakkında ne düşünüyorsunuz? Bir priori güç analizi esasen işe yaramaz mı? Öyleyse, araştırmacılar çalışmalarının boyutunu nasıl planlamalı?


10
Bu , güç analizinin kendisinden değil, akılsız güç analizinin kınanmasına benziyor . Asıl soru, bunun samanlıklı bir adama yapılan bir saldırı mı yoksa gerçekten de varsayımlara duyarlılıklarına bakılmaksızın güç analizlerini (veya başka analizleri) yapan pek çok kişi varsa. İkincisi doğruysa, onları aydınlatmak iyidir, ama onların deneylerini planlamak için tüm çabalarını bırakacak kadar cesareti kırılmadıklarını umarım!
whuber

2
Bana oldukça fazla istatistik.stackexchange.com/q/2492/32036 hatırlatıyor ve sadece başlık sorusunun ifadedeki sözdizimsel benzerliği yüzünden değil. Varsayımların nasıl anlaşılacağı konusunda bir soru gibi görünüyor. Her ikisinde de önemli bir nokta, bu analizlerin, süpürülmeyi önleme konusundaki hassasiyetlerini, varsayımlarının (a) kesinlikle çok önemli olduğu veya (b) tamamen ihmal edilebilir olduğuna karar vermesidir. Bu, genel olarak faydalı ve zararlı olmayan çıkarımın anahtarıdır. Korkarım saman adam değil; insanlar bilmediği ya da bilmediği ya da umursamadığı zaman çok sık olarak mutlak düşünürler.
Nick Stauner

5
Bunu soruya eklemek istemedim çünkü başkalarının yaptığı önerilere ilgi duydum, ancak Uri Simonsohn'un konuşmanın sonunda yaptığı öneri, çalışmanızı umursayacağınız en küçük etkiyi belirlemeye ikna etmekti.
Patrick S. Forscher

9
@ PatrickS.Forscher: Her şey söylendikten ve yapıldıktan sonra, önceden yapılan bir güç analizine inanıyor. Sadece etki büyüklüğünün akıllıca seçilmesi gerektiğini düşünüyor: ne olabileceğine dair bir tahmin değil, umursayacağınız minimum değer. Güç analizinin ders kitabı açıklaması gibi gözüküyor: pratik olarak anlamlı bir fark olduğuna inandığınızın istatistiksel olarak anlamlı bir fark olarak ortaya çıkacağına dair yeterli veriye sahip olduğunuzdan emin olmak.
Wayne,

2
Uri'nin konuşmayı çerçevelendirme biçimi, bence priori bir güç analizinin genellikle sosyal bilimlerde yapıldığı gibi işe yaramaz olduğuna inanıyor, ancak başka bir yerde öğretildiği gibi değil. Aslında, güç analizimi, aradığım etkinin büyüklüğü hakkında makul bir tahminde bulunmaya dayandı, pratik olarak hangi etkiyi umursacağım öğretildi.
Patrick S. Forscher

Yanıtlar:


20

Buradaki temel mesele, doğrudur ve istatistiklerde oldukça iyi bilinmektedir. Ancak, yorumu / iddiası aşırıdır. Tartışılması gereken birkaç konu var:

N-N-N-50%80%ddd=.5N-=1287.9%5.5%0,116.9%0,112.6%

görüntü tanımını buraya girin

d

80%

İkincisi, güç analizlerinin (a-priori veya başka bir şekilde) varsayımlara dayandığına dair daha geniş bir iddia ile ilgili olarak, bu tartışmanın ne yapılacağı açık değildir. Tabii ki yaparlar. Diğer her şey de öyle. Bir güç analizi yapmamak, yalnızca şapkadan seçtiğiniz bir sayıya dayanarak bir miktar veri toplamak ve ardından verilerinizi analiz etmek durumu iyileştirmeyecektir. Ayrıca, sonuçta ortaya çıkan analizleriniz, tüm analizlerin (güç veya başka türlü) her zaman olduğu gibi, hala varsayımlara bağlı olacaktır. Bunun yerine, veri toplamaya devam edeceğinize ve onları beğeneceğiniz bir resim elde edene ya da yorulmayacak şekilde yeniden analiz etmeye karar verirseniz, bu çok daha az geçerli olacaktır (ve konuşmacıya görünmeyecek varsayımlar gerektirecektir. bu yine de var). Basitçe söylemek gerekirse,Araştırma ve veri analizinde varsayımların yapıldığı gerçeğinin bir yolu yoktur .

Bu ilgi kaynaklarını bulabilirsiniz:


1
Uri Simonsohn'un argümanının varsayımların kötü olmadığını değil, genel olarak güç analizlerinin varsayımlara karşı örnek boyutlarını planlamada yararsız hale getirecek kadar duyarlı olduğunu düşünüyorum. Ancak, sağladığınız referanslar (+1) gibi puanlarınız mükemmel.
Patrick S. Forscher

Düzenlemeleriniz zaten bu mükemmel cevabı geliştirmeye devam ediyor. :)
Patrick S. Forscher

3
Bunun harika bir cevap olduğu konusunda hemfikirim ve sadece size (ve başkalarına) bu konu hakkında yazdığım son bir blog yazısında alıntı yaptığımı bildirmek istedim: jakewestfall.org/blog/index.php/2015/06/ 16 /…
Jake Westfall

2
@JakeWestfall, güzel yazı! Farklı bir notta, kurabiyeleri okuduğunuzda, öncelikle bunları yiyerek mi yapıyorsunuz? Bu projelerden herhangi birinde istatistiksel bir danışmana ihtiyacınız var mı?
gung - Reinstate Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.