Harika soru! Geri adım atalım ve Bonferroni'nin ne yaptığını ve Benjamini ve Hochberg'in alternatif oluşturması için neden gerekli olduğunu anlayalım.
Son yıllarda çoklu test düzeltmesi adı verilen bir prosedürün uygulanması zorunlu ve zorunlu hale gelmiştir. Bunun nedeni, yüksek verimlilik bilimleriyle, özellikle de tüm genom birlikteliği çalışmalarının (GWAS) ortaya çıkmasıyla birlikte genetikte) artan test sayılarıdır. Çalışma alanım olduğu için genetik referansım. aynı anda 1.000.000 test yapıyorsak , 50 , 000 yanlış pozitif bekleriz . Bu inanılmaz derecede büyük ve bu nedenle önem derecesinin değerlendirilme seviyesini kontrol etmeliyiz. Bonferroni düzeltmesi, yani kabul eşiğinin (0.05) bağımsız test sayısına ( 0.05 / ) bölünmesidir.P= 0.0550 , 000( 0.05 / M) ailedeki bilge hata oranını düzeltir ( ).FWER,
FWER testi-bazlı hata oranı ile ilgili olduğu için bu durum geçerlidir ( ) denklemi ile F W e R = 1 - ( 1 - T W e R ) M . Yani, yüzde 100 eksi 1 gerçekleştirilen bağımsız test sayısının gücüne yükseltilen test hata oranını çıkarır. Bu varsayımı yaparak ( 1 - 0.05 ) 1 / M = 1 - 0.05TWER,FWER = 1 - ( 1 - TWER )M veren, TWER≈0.05( 1 - 0.05 )1 / M= 1 - 0,05M , M için tamamen bağımsız testler için ayarlanan kabul P değeridir.TWER ≈ 0.05M
Şu anda karşılaştığımız sorun, Benjamini ve Hochberg gibi, tüm testlerin tamamen bağımsız olmamasıdır. Bu nedenle, Bonferroni düzeltmesi, sağlam ve esnek olmasına rağmen, bir düzeltmedir . Bağlantı dengesizliği denilen bir durumda iki genin bağlandığı genetikteki durumu düşünün; yani, bir gende mutasyon olduğunda, diğerinde ifade edilme olasılığı daha yüksektir. Açıkçası, bağımsız testler olmadığı açıktır, ancak bonferroni düzeltmesinde kabul edildikleri varsayılmaktadır. . P değerini M'ye bölmenin, birbirimizi gerçekten etkileyen varsayılan bağımsız testler nedeniyle yapay olarak düşük bir eşik oluşturduğunu görmeye başlıyoruz, gerçek durumumuz için çok büyük bir M yaratıyor, ergo bağımsız değil.
Benjamini ve Hochberg tarafından önerilen ve Yekutieli (ve diğerleri) tarafından artırılan prosedür Bonferroni'den daha liberaldir ve aslında Bonferroni düzeltmesi sadece şu an en çok yapılan araştırmalarda kullanılmaktadır. Bunun nedeni, FDR'de, testler kısmına biraz bağımlılık olduğumuzu varsayıyoruz ve bu nedenle çok büyük ve gerçekçi olmayan ve gerçekte umursadığımız sonuçlardan kurtulan bir M. Bu nedenle, bağımsız olmayan 1000 test durumunda, gerçek M 1000 olmaz, ancak bağımlılıklar nedeniyle daha küçük bir şey olur. Bu yüzden 0,05'i 1000'e böldüğümüzde eşik çok katıdır ve ilgilenilen bazı testlerden kaçınır.
Bağımlılık kontrolünün ardındaki mekaniği önemsiyor musunuz emin değilim, ancak bunu yaparsanız referans için Yekutieli kağıtlarını bağladım. Ayrıca bilgileriniz ve merakınız için birkaç şey daha ekleyeceğim.
Umarım bu bir şekilde yardımcı olmuştur, eğer bir şeyi yanlış bildirmişsem, lütfen bana bildirin.
~ ~ ~
Referanslar
Yekutieli olumlu bağımlılıklar hakkında bildiri - http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf
(bkz. 1.3 - Sorun.)
Nature Genetics incelemeleri - Bonferroni ve diğer ilgi alanlarının açıklaması. Büyük ölçekli genetik çalışmalarda İstatistiksel Güç ve anlamlılık testi - Pak C Sham ve Shaun M Purcell
(bkz. kutu 3.)
http://en.wikipedia.org/wiki/Familywise_error_rate
DÜZENLE:
Önceki cevabımda, doğrudan sorulan pozitif bağımlılığı tanımlamamıştım. Yekutieli belgesinde, bölüm 2.2
Olumlu bağımlılık başlığına sahiptir ve bunu çok ayrıntılı olarak öneriyorum. Ancak biraz daha özlü yapabileceğimize inanıyorum.
ben0ben0
Xben0Xben0Xben0xX
P
Özetle, pozitif bağımlılık özelliği gerçekten tüm test istatistik setlerimizdeki gerçek regresyon bağımlılığımızın gerçek null test istatistikleri grubumuzdaki pozitif regresyon bağımlılığı özelliğidir ve 0.05 FDR için kontrol ederiz; Böylece P değerleri aşağıdan yukarıya doğru yükseldikçe (yukarı-adım prosedürü), boş kümenin bir parçası olma olasılıkları artar.
Kovaryans matrisi ile ilgili yorumlardaki eski cevabım yanlış değildi, sadece biraz belirsizdi. Umarım bu biraz daha yardımcı olur.