“İstatistiksel olarak anlamlı olmayan” çalışmaların meta analizi, “önemli” bir sonuca yol açabilir mi?


29

Bir meta-analiz, tümü 0,05'ten büyük bir P değeri bildiren birçok çalışma içerir. Genel meta-analizin 0,05'in altındaki bir P değerini bildirmesi mümkün müdür? Hangi koşullar altında?

(Cevabın evet olduğundan eminim ama bir referans veya açıklama istiyorum.)


1
Meta-analiz hakkında pek bir şey bilmiyorum, ancak herhangi bir hipotez testini içermediği, sadece nüfus etkisinin bir tahmini olduğu izlenimini altında tutuyordum, bu durumda konuşmanın önemi yoktur.
Kodiolog

1
Günün sonunda bir meta-analiz sadece ağırlıklı bir anlama geliyor. Ve kesinlikle bu ağırlıklı ortalama için bir hipotez testi kurabilirsin. Örneğin, bkz. Borenstein, Michael ve ark. "Meta-analiz için sabit-etki ve rastgele-etki modellerine temel bir giriş." Araştırma Sentezi Yöntemleri 1.2 (2010): 97-111.
boscovich

1
Diğer cevaplar da iyidir, fakat basit bir durum: p = 0.9'da iki çalışma önemlidir ancak p = 0.95 değildir. İki bağımsız çalışmanın her ikisinin de p> = 0.9 gösterme olasılığı sadece 0.01, bu nedenle meta analiziniz p =
0.99'da

2
Sınırları aşın: Hiç kimse, (önemsiz) bir hipotezin küçük bir değerine sahip olması için / aleyhine yeterli kanıt sağlayamaz , ancak yeterince büyük bir ölçümler toplayabilir. p
Eric Towers

p- değerleri “istatistiksel olarak anlamlı” veya önemsiz bir etki göstermez. Önemli bir sonuçtan ne anlayabiliriz? Bu bir analitik sonuç mu?
Subhash C. Davar

Yanıtlar:


31

Teoride evet ...

Bireysel çalışmaların sonuçları önemsiz olabilir, ancak birlikte incelendiğinde sonuçlar önemli olabilir.

Sonuçları davranarak ilerleyebilir Teoride çalışmanın başka rasgele değişken gibi. ıyii

rastgele bir değişken olmasına izin verin (örneğin, çalışmasından elde edilen tahmin ). O zaman, bağımsız ve , ortalamayı aşağıdakilerle tutarlı bir şekilde tahmin edebilirsiniz: i y i E [ y i ] = μyiiyiE[yi]=μ

μ^=1niyi

Daha fazla varsayım ekleyerek, , tahmininin varyansı . Ardından , ters değişkenlik ağırlıklandırma ile verimli bir şekilde tahmin edebilirsiniz : y i μσi2yiμ

μ^=iwiyiwi=1/σi2j1/σj2

Bu durumlarda, , bireysel tahminler olmasa bile, bazı güven düzeyinde istatistiksel olarak anlamlı olabilir.μ^

AMA büyük problemler olabilir, bilinmesi gereken konular ...

  1. Eğer sonra meta-analiz yakınsaması olmayabilir (yani meta-analiz ortalama tutarsız tahmin olan).μE[yi]μμ

    Örneğin, olumsuz sonuçların yayınlanmasına karşı bir önyargı varsa, bu basit meta-analiz korkunç derecede tutarsız ve önyargılı olabilir! Bir madeni para çevirme ucunun sadece inişe geçmediği klipsleri gözlemleyerek başları çıkarma olasılığını tahmin etmek gibi bir şey olurdu!

  2. y j i j y ı y jyi ve bağımsız olmayabilir. Örneğin, eğer iki çalışma ve aynı verilere dayanıyorsa, ve meta-analizde bağımsız olarak kabul etmek, standart hataları büyük ölçüde küçümseyebilir ve istatistiksel önemini . Tahminleriniz hala tutarlı olacaktır, ancak standart hataların çalışmalarda çapraz korelasyonu makul şekilde hesaba katması gerekir.yjijyiyj

  3. (1) ve (2) 'nin birleştirilmesi özellikle kötü olabilir.

    Örneğin, ortalama oylamaların birlikte analiz edilmesi, bireysel anketlerden daha doğru olma eğilimindedir. Ancak, ortalama oylamaların bir araya gelmesi hala ilgili hataya karşı savunmasız. Geçmişte yapılan seçimlerde ortaya çıkan bir şey, genç çıkış anket çalışanlarının yaşlılardan ziyade diğer gençlerle röportaj yapma eğiliminde olabileceğidir. Tüm çıkış anketleri aynı hatayı yaparsa, iyi bir tahmin olduğunu düşündüğünüz kötü bir tahmininiz vardır (çıkış anketleri ilişkilidir çünkü çıkış anketleri yapmak için aynı yaklaşımı kullanırlar ve bu yaklaşım aynı hatayı oluşturur).

Kuşkusuz, meta-analize daha aşina olan insanlar daha iyi örnekler, daha ayrıntılı konular, daha karmaşık tahmin teknikleri vb. Bulabilirler ... ama bu, en temel teoriye ve daha büyük sorunlara bazılarına bakar. Farklı çalışmalar bağımsız, rastgele hata yaparsa, meta-analiz inanılmaz derecede güçlü olabilir. Hata çalışmalarda sistematik ise (örneğin herkes eski seçmen vb. Sayılırsa), çalışmaların ortalaması da kapalı olacaktır. İlişkili çalışmaların ne kadar ilişkili olduğunu ya da korelasyondaki hataların hafife alındığını tahmin ederseniz, toplam örneklem büyüklüğünüzü etkin bir şekilde tahmin eder ve standart hatalarınızı hafife alırsınız.

Tutarlı tanımlamalar vb. Her türlü pratik sorun da vardır.


1
Etki büyüklükleri arasındaki bağımlılıkları görmezden gelmek için bir meta-analizi eleştiriyorum (yani, birçok etki büyüklüğü aynı katılımcılara dayanıyordu, ancak bağımsız olarak değerlendirildi). Yazarlar biggie olmadığını söylüyor, biz zaten moderatörler ile ilgileniyoruz. Burada belirttiğiniz noktayı işaret ediyorum: "meta-analizde bağımsız olarak kabul etmek, standart hataları büyük ölçüde küçümseyebilir ve istatistiksel öneme sahip olabilir." Bunun neden böyle olduğunu gösteren bir kanıt / simülasyon çalışması var mı? İlişkili hataların zayıf tahmin edilen SE anlamına geldiğini söyleyen birçok referansım var ... ama nedenini bilmiyorum?
Mark White,

1
@MarkWhite Temel fikir, . Tüm Eğer elimizdeki ve için o ve standart . Diğer taraftan, kovaryans terimleri pozitif ve büyükse, standart hata daha büyük olacaktır. Var(1niXi)=1n2(iVar(Xi)+ijCov(Xi,Xj))iVar(Xi)=σ2Cov(Xi,Xj)=0ijVar(1niXi)=σ2nσn
Matthew Gunn,

@MarkWhite Ben bir meta-analiz uzmanı değilim ve dürüst olmak gerekirse, bir insanın modern, meta-analizini nasıl yapması gerektiği için neyin harika bir kaynak olduğunu bilmiyorum . Kavramsal olarak, aynı veriler üzerinde analizin çoğaltılması kesinlikle yararlıdır (bazı dersleri yoğun şekilde çalışarak olduğu gibi), ancak yeni, bağımsız konular üzerinde bir bulgu üretmek gibi değildir.
Matthew Gunn

1
Ah, yani kelimeler: Bir etki büyüklüğünün toplam varyansı (a) değişkenliğinden ve (b) diğer etki büyüklükleriyle kovaryansından kaynaklanmaktadır. Kovaryans 0 ise, standart hata tahmini iyi olur; fakat eğer diğer etki büyüklükleriyle kovaryon yaparsa, bu varyansı hesaba katmamız gerekir ve bunu gözardı etmek, varyansı hafife aldığımız anlamına gelir. Varyans, iki bölüm A ve B'den oluşur ve bağımlılıkları göz ardı etmek, B bölümünün değilken 0 olduğunu varsayar mı?
Mark White

1
Ayrıca, bu iyi bir kaynak gibi görünüyor (özellikle Kutu 2'ye bakınız): nature.com/neuro/journal/v17/n4/pdf/nn.3648.pdf
Mark White

29

Evet. bağımsız çalışmalardan p değerine sahip olduğunuzu varsayalım .NN

Fisher testi

(EDIT - aşağıda @ mdewey'nin yararlı yorumuna cevap olarak, farklı meta testleri arasında ayrım yapmak önemlidir. Aşağıda mdewey tarafından belirtilen başka bir meta testi durumunu açıklarım)

Klasik Fisher meta testi (bakınız Fisher (1932), "Araştırmacılar İçin İstatistiksel Yöntemler" ) istatistik bir null dağılımına sahip , düzgün bir rv için olarak .

F=2i=1Nln(pi)
χ2N22ln(U)χ22U

Let ifade -quantile boş dağıtım.χ2N2(1α)(1α)

Tüm p değerlerinin eşit olduğunu varsayalım , burada, muhtemelen . Daha sonra, ve zaman Örneğin, ve , tek tek değerlerinin yalnızca değerden küçük olması gerekircc>αF=2Nln(c)F>χ2N2(1α)

c<exp(χ2N2(1α)2N)
α=0.05N=20p
> exp(-qchisq(0.95, df = 40)/40)
[1] 0.2480904

Tabii ki, meta istatistik testlerinin "sadece" "toplam" olması, tüm bireysel null değerlerinin doğru olduğunu ve null değerlerinden sadece birinin yanlış olduğu anda reddedilecek olan null olduğunu gösterir.N

DÜZENLE:

İşte karşı "kabul edilebilir" p-değerlerinin bir komplodur , onaylar yetişen en kapalı seviyeye görünse de, .NcNc0.36

görüntü tanımını buraya girin

dağılımı miktarları için bir üst sınır buldum burada , böylece yukarıdan ile arasında sınırlandırılır . Şöyle bağlı bu makul keskin görünmektedir.χ2

χ2N2(1α)2N+2log(1/α)+22Nlog(1/α),
χ2N2(1α)=O(N)exp(χ2N2(1α)2N)exp(1)Nexp(1)0.3679

Ters Normal testi (Stouffer ve ark. 1949)

Test istatistiği ile verilir ile standart normal niceliksel işlev. Test, büyük negatif değerler için, yani, eğer , olduğunda reddeder . Dolayısıyla, , . Tüm , ve dolayısıyla olarak . Eğer , herhangi kabul bölgedeki değerleri alacaktır . Dolayısıyla, meta testin olarak reddedilmesi için, 0'dan küçük bir ortak p değeri yeterlidir.

Z=1Ni=1NΦ1(pi)
Φ1Z<1.645α=0.05pi=cZ=NΦ1(c)c<0.5Φ1(c)<0ZpNc0.5ZNN.

Daha spesifik olarak, eğer , aşağıda olarak eğilim gösterirse, ise .Z<1.645c<Φ(1.645/N)Φ(0)=0.5N


2
+1 ve vay! bile olsa bir üst sınır olmasını beklemiyordum . 1/e
amip diyor Reinstate Monica

Teşekkürler :-).
Araziyi görmeden

5
İlginçtir ki, Fisher kaynaklı yöntem bu özelliğe sahip yaygın olarak kullanılan yöntemlerden sadece bir tanesidir. Diğerlerinin çoğu için F dediğiniz şey, eğer $ c> 0.5 ise N ile artar ve aksi takdirde azalır. Bu Stouffer'ın metodu ve Edgington'un metodu ile loglara dayanan ve p'nin ortalamaları için geçerlidir. Wilkinson'ın yönteminin özel durumları olan çeşitli yöntemler (minimum p, maksimum p, vb.) Yine farklı özelliklere sahiptir.
mdewey

1
@mdewey, bu gerçekten ilginç, sadece Fisher'ın testini seçtim çünkü ilk önce aklıma geldi. Yani, "sadece bir tane" ile, spesifik sınır anlamına mı geliyorsunuz ? Düzenlememde hecelemeye çalıştığım yorumlarınız, bana Stouffer'ın yönteminin aynı zamanda 0,5 olduğu ortaya çıkan bir üst sınırı da olduğunu gösteriyor. 1/e
Christoph Hanck

Ben bir hafta daha bu işe gitmek için zaman var gitmiyorum ama on çalışmalar varsa bence Eğer genel bir olsun hiç farketmez olarak birliğine yakın olarak. Burada tek yönlü ve iki taraflı bir sorun olabilir. Daha fazla materyale bakmak istersen, istersen cevabını genişletmek için kullanmakta özgürsün, R paketim <code> metap </code> 'a gitmek için fazladan bir taslak taslağım var . p=0.9p
mdewey

4

Bunun cevabı, -değerlerini birleştirmek için hangi yöntemi kullandığınıza bağlıdır . Diğer cevaplar bunlardan bazılarını ele aldı, ancak burada asıl soruya verilen cevabın hayır olduğu bir yönteme odaklanıyorum.p

Tippett'in metodu olarak da bilinen minimum metodu genellikle boş hipotezin seviyesindeki bir reddetme ile tanımlanır . çalışmaları için tanımlayın . Tippett'in yöntemi daha sonra α p [ 1 ]p [ 2 ]p [ k ] k p [ 1 ] < 1 - ( 1 - α ) 1pα

p[1]p[2]p[k]
k
p[1]<1(1α)1k

O zamandan bu yana görmek kolaydır birlik daha sıkı bir birlik son dönem daha büyük olduğu daha az sayıda th kök sürece ve dolayısıyla toplam sonucu olmayan önemli olacaktır zaten az olan daha .α p [ 1 ] α kαp[1]α

Kritik değeri hesaplamak mümkündür ve örneğin, her biri 00.05 değerlerine sahip on birincil çalışmamız varsa , genel kritik değer 0,40 olabilir. Metodu, Wilkinson yöntemin özel bir durum olarak görülmektedir için ve primer çalışmalar özellikle kümesi için aslında daha önemli değildir ( )p [ r ] 1 r k r = 2 p = 0,09pp[r]1rkr=2p=0.09

LHC Tippett'in metodu bir kitapta açıklanmıştır. İstatistik metotları. 1931 (1. baskı) ve Wilkinsonun yöntemdir burada bir makalede "psikolojik araştırmalarda bir istatistik hesap"


1
Teşekkürler. Ancak, çoğu meta-analiz yönteminin efekt boyutlarını (örneklem büyüklüğündeki herhangi bir farkı hesaba katarak) birleştirdiğini ve P değerlerini birleştirmediğini unutmayın.
Harvey Motulsky

@HarveyMotulsky, p-değerlerini birleştirmenin son çare olduğunu kabul etti, ancak OP sorusunu birleştirme-p-değerleri etiketiyle etiketledi, bu yüzden o ruhla cevap verdim
mdewey

Bence cevabın doğru.
Subhash C. Davar
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.