Artan sıraya göre sıralanan bağımsız testlerden elde edilen p değerlerinin bir listesi göz önüne alındığında, birden fazla test düzeltmesi için Benjamini-Hochberg prosedürü kullanılabilir . Her p değeri için, Benjamini-Hochberg prosedürü, her p değeri için Yanlış Keşif Oranını (FDR) hesaplamanıza izin verir. Yani, sıralanan p-değerleri listesindeki her "pozisyonda", bunların ne kadarının sıfır hipotezinin yanlış reddedilmesi muhtemel olduğunu size söyleyecektir.
Sorum şu, bu FDR değerleri " q değerleri " veya " düzeltilmiş p değerleri " olarak mı yoksa tamamen başka bir şey olarak mı anılacak ?
EDIT 2010-07-12: Kullandığımız düzeltme prosedürünü daha ayrıntılı olarak açıklamak istiyorum. İlk olarak, test sonuçlarını düzeltilmemiş orijinal p-değerlerine göre sıralamasını arttırıyoruz. Daha sonra, BH düzeltmesini kullanarak, gözlenen değere eşit bir alfa ile bu listedeki boş hipotezi ve listedeki önceki tüm testleri reddetmemiz durumunda beklenen FDR'yi bekliyoruz ”olarak yorumladığım şeyi hesaplayarak listeyi tekrarlıyoruz. , ilgili yineleme için düzeltilmemiş p değeri. Daha sonra, "q-değerimiz" olarak adlandırdığımız şey olarak, monotoniteyi korumak için önceden düzeltilmiş değerin (i - 1 yinelemesinde FDR) veya mevcut değerin (i) en yüksek değerini alırız.
Aşağıda bu işlemi temsil eden bir Python kodu verilmiştir:
def calc_benjamini_hochberg_corrections(p_values, num_total_tests):
"""
Calculates the Benjamini-Hochberg correction for multiple hypothesis
testing from a list of p-values *sorted in ascending order*.
See
http://en.wikipedia.org/wiki/False_discovery_rate#Independent_tests
for more detail on the theory behind the correction.
**NOTE:** This is a generator, not a function. It will yield values
until all calculations have completed.
:Parameters:
- `p_values`: a list or iterable of p-values sorted in ascending
order
- `num_total_tests`: the total number of tests (p-values)
"""
prev_bh_value = 0
for i, p_value in enumerate(p_values):
bh_value = p_value * num_total_tests / (i + 1)
# Sometimes this correction can give values greater than 1,
# so we set those values at 1
bh_value = min(bh_value, 1)
# To preserve monotonicity in the values, we take the
# maximum of the previous value or this one, so that we
# don't yield a value less than the previous.
bh_value = max(bh_value, prev_bh_value)
prev_bh_value = bh_value
yield bh_value