Benjamini-Hochberg ayarlı p-değerinin formülü nedir?


14

Prosedürü ve neyi kontrol ettiğini anlıyorum. Peki çoklu karşılaştırmalar için BH prosedüründe ayarlanan p-değerinin formülü nedir?


Şimdilik, orijinal BH'nin ayarlanmış p değerleri üretmediğini, sadece (ret dışı) koşulunu ayarladığını fark ettim: https://www.jstor.org/stable/2346101 . Gordon Smyth, 2002'de BH p değerlerini yine de tanıttı, bu yüzden soru hala geçerli. p.adjustYöntemde olduğu gibi R de uygulanır BH.

Yanıtlar:


6

Ünlü seminal Benjamini & Hochberg (1995) makalesi, alfa seviyelerini ayarlamaya dayanan hipotezleri kabul etme / reddetme prosedürünü açıkladı. Bu prosedür, ayarlanmış -değerleri açısından doğrudan eşdeğer bir reformülasyona sahiptir, ancak orijinal makalede tartışılmamıştır. Gordon Smyth'e göre , R'de uygularken 2002'de ayarlanmış -değerlerini tanıttı . Ne ​​yazık ki, karşılık gelen bir alıntı yok, bu yüzden BH ayarlı -değerleri kullanıyorsa, neyin alıntı yapması gerektiği her zaman bana açık değildi .ppp.adjustp

Görünüşe göre, prosedür Benjamini, Heller, Yekutieli (2009) ' da tarif edilmiştir :

Bu prosedürün sonuçlarını sunmanın alternatif bir yolu, ayarlanmış -değerlerini sunmaktır . BH ile ayarlanan değerleri,pp

p(i)BH=min{minji{mp(j)j},1}.

Bu formül gerçekte olduğundan daha karmaşık görünüyor. Diyor ki:

  1. İlk olarak, tüm değerlerini küçükten büyüğe sıralayın . Daha sonra her bir değerini, toplam test sayısı ile çarpın ve sıralama düzenine bölün.ppm
  2. İkincisi, ortaya çıkan sekansın azalmadığından emin olun: eğer azalmaya başlarsa, önceki değerini müteakip değere eşit hale getirin (tüm sekans düşmeyene kadar tekrar tekrar).p
  3. Herhangi bir değeri 1'den büyükse, 1'e eşit yapın.p

Bu, 1995'teki orijinal BH prosedürünün basit bir şekilde yeniden formüle edilmesidir. BH ile düzeltilmiş -değerleri kavramını açıkça tanıtan daha önceki bir makale olabilir , ancak bunların hiçbirinin farkında değilim.p


Güncelleme. @Zenit, Yekutieli ve Benjamini'nin (1999) 1999'da aynı şeyi tanımladığını buldu:

resim açıklamasını buraya girin


Beklediğim cevap bu, +1. Ayarlanmış p değerinin Gordon Smyth uygulaması hakkında okuduğumu ve kimin alıntı yapacağını bilmediğini hatırlıyorum , bunun için bir "kanon" atıfının olduğunu görmek güzel.
Firebug

1
Daha erken bir referansın var olduğuna inanıyorum: Yekutieli ve Benjamini (1999) (pdf versiyonuna buradan ulaşabilirsiniz ). Tanım 2.4, orijinal 1995 FDR prosedürünün ayarlanmış p değerleri açısından nasıl yeniden ifade edilebileceğini açıklamaktadır. Kredi bu blog yayınında bu konuda buldum.
Zenit

@Zenit Oh vay! Büyük bulmak! Cevabımı güncellemeliyim.
amip diyor Reinstate Monica

@Zenit kaynağı için teşekkürler! Böyle yaygın bir istatistiksel yöntemin iyi bilinen bir referansa sahip olmaması biraz garip.
Firebug

8

İlk noktaya bir cevap. Düşünün (tek testi) değeri ile ilişkili değer test istatistiğinin. Benjamini-Hochberg FDR iki adımda hesaplanır ( = # pvalues , = # pvalues):p0pz0N0 p0N

  • FDR (p0)=p0N0N

  • FDR (pi)=min(FDR(pi),FDR(pi+1))


Şimdi bunu anlayalım. Temeldeki (Bayesci) fikir, gözlemlerin iki dağılımın bir karışımından gelmesidir:

  • π0N sıfır yoğunluğundan gözlemif0(z)
  • (1π0)N Alternatif yoğunluğundan gözlemi .f1(z)

Gözlenen bu ikisinin karışımıdır:

  • f(z)=π0f0(z)+(1π0)f1(z)

resim açıklamasını buraya girin

(Bayesian) tanımları:

  • Fdr=π0(1F0(z0))(1F(z)) (kuyruk alanlarının bir kısmı)
  • fdr=π0f0(z0)f(z) (kuyruk yoğunluklarının bir kısmı)

Aşağıda gösterildiği gibi, Fdr, olduğunda Benjamini hocherg FDR'ye eşdeğerdir (çoğu biyoinformatik çalışmada bu durumdur)π01

resim açıklamasını buraya girin

(Efron & Tibshirani'nin Bilgisayar Çağı İstatistiksel Çıkarımına Dayalı )

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.