Güven aralıklarını kullanırken çoklu karşılaştırma ayarlamaları yapmalı mıyız?


26

Toplam karşılaştırması yaptığımız, ikili istatistiklere ilişkin post-hoc çıkarımlar veya çoklu bir regresyon gibi çoklu karşılaştırma senaryosuna sahip olduğumuzu varsayalım . Ayrıca, bu katlar arasındaki çıkarımı, güven aralıkları kullanarak desteklemek istediğimizi varsayalım.m

1. CI'lara çoklu karşılaştırma ayarlamaları yapıyor muyuz? Yani çoklu karşılaştırmalar yeniden tanımlanmasını zorlayacak gibi, olan birine aile bilge hata oranı (FWER) ya da yanlış keşif oranının , (FDR) anlamını yapar güven (veya güvenilirlik 1 veya belirsizlik veya tahmin veya çıkarımsal ... aralığınızı seçin) benzer şekilde çoklu karşılaştırmalarla değiştirilsin mi? Buradaki olumsuz bir cevabın kalan sorularımı alacağını fark ediyorumα

2. Çoklu karşılaştırma ayarlama prosedürlerinin hipotez testinden aralık tahminine kadar basit çevirileri var mı? Örneğin, düzenlemeler , güven aralığında terimini değiştirmeye odaklanır : ?CI-levelCIθ=(θ^±t(1CI-level)/2σ^θ)

3. CI'ler için artırma veya azaltma kontrol prosedürlerini nasıl ele alırız? Hipotez testi yaklaşımından çıkarıma doğru bazı aile hata oranı ayarlamaları, her bir ayrı çıkarımda aynı ayar yapılması kesin olarak 'statiktir'. Örneğin, Bonferroni ayarlaması reddetme kriteri değiştirilerek yapılır:

  • için reddet :pα2
  • ise reddet ,pα2m

Ancak Holm-Bonferroni adım ayarlaması 'statik' değil, bunun yerine:

  • ilk önce -değerlerini en küçük en büyüğe sıralap
  • reddetme durumunda , (burada indeksi sıralaması -değerlerinin) kadarp1(1α2)1m+1iip
  • boş bir hipotezi reddetmedik ve sonraki tüm boş hipotezleri otomatik olarak reddetmedik.

CI ile olmuyor reddetme ret / başarısızlık Çünkü kademeli prosedürleri Bu ne anlama geliyor (daha resmi, aşağıda referanslara bakın) yok (yani FDR yöntemlerin hepsi dahil) çevirmek? Ben olduğumu burada ihtar gerektiğini değil (aşağıda bu önemsiz olmayan bir soru almak anılan 'görsel hipotez testi' Literatürde temsilcilerini) hipotez testlerinin içine CI'ler çevirmek için nasıl soran.

4. 1'de parantez içinde bahsettiğim diğer aralıklardan herhangi biri nedir ?


1 Tanrım, umarım bu kelimeyi kullanarak tatlı, tatlı Bayesian stillerini sallayanlarla başım belaya girmez. :)


Kaynaklar
Afshartous, D. ve Preston, R. (2010). Bağımlı veriler için güven aralıkları: Örtüşmeyenleri istatistiksel öneme sahip olarak eşitlemek. Hesaplamalı İstatistik ve Veri Analizi , 54 (10): 2296-2305.

Cumming, G. (2009). Göze göre çıkarım: bağımsız güven aralıklarının örtüşmesini okumak. Tıp İstatistikleri , 28 (2): 205-220.

Payton, ME, Greenstone, MH ve Schenker, N. (2003). Örtüşen güven aralıkları ya da standart hata aralıkları: İstatistiki anlam açısından ne anlama geliyor? Böcek Bilimleri Dergisi , 3 (34): 1–6.

Tryon, WW ve Lewis, C. (2008). Tryon'un (2001) redüksiyon faktörünü düzelten istatistiksel denklik oluşturmada çıkarımsal bir güven aralığı yöntemi. Psikolojik Yöntemler , 13 (3): 272-277.


Şimdi tam bir cevap araştırmak için zamanım yok, bu yüzden bir yorumda cevap vereceğim.
Harvey Motulsky 17:14

[Son yorum kesildi. [Şimdi tam bir cevap araştırmak için zamanım yok, bu yüzden bir yorumda cevap vereceğim. 1) Evet, aynı durumlarda, hipotez testi için yapılan çoklu karşılaştırmaların mantıklı olduğu gibi anlamlıdır. 2. Bonferroni, Tukey ve Dunnet çoklu karşılaştırmaları, güven seviyesinin tüm aile için geçerli olduğu güven aralıklarını oluşturmak için kolayca uyarlanabilir. 3. Söyleyebileceğim kadarıyla, Holm yönteminden güven aralıkları yapma olasılığı yoktur. 4. Hiçbir fikrim yok!
Harvey Motulsky 17:14

2
@HarveyMotulsky Harika! İlk iki cevabınıza gelince: (1) Neden? (2) Sadece bir CI inşa eden bir dağıtımın kritik değerlerini hesaplarken matematiği değer ayarlarından ayarlarına çevirerek ? Yorumlarda büyütmek yerine her zaman resmi bir cevap yazabilir (dürtmek) (dürtmek dürtmek). pα
Alexis

Yanıtlar:


9

Maalesef yeterince dikkat edilmeyen mükemmel bir konu.

Çoklu parametreler ve güven aralıkları tartışılırken, eşzamanlı çıkarım ve seçici çıkarım arasında bir ayrım yapılmalıdır . Referans [2]. konuyla ilgili mükemmel bir gösteri verir.

Eşzamanlı güven aralıkları, tüm parametrelerin güveninde olduğu anlamına gelir. Seçici güven aralıkları, seçilen parametrelerin bir alt kümesinin kapsandığı anlamına gelir.1α

Bu iki kavram birleştirilebilir: Aralıkları yalnızca boş hipotezi reddettiğiniz parametreler üzerine kurduğunuzu söyleyin. Seçici çıkarımla açıkça başa çıkıyorsun. Seçili parametrelerin eşzamanlı kapsamını veya seçilen parametrelerin marjinal kapsamını garanti etmek isteyebilirsiniz. İlki, FWER kontrolünün karşılığı ve FDR kontrolünün ikincisi olacaktı.

Şimdi noktaya gelince: Tüm test prosedürlerinin eşlik eden aralıkları yoktur. FWER prosedürleri ve eşlik eden aralıkları için, bakınız [3]. Ne yazık ki, bu referans biraz modası geçmiş. BH FDR kontrolünün aralıklı karşılığı için, [1] 'e ve [4]' deki bir uygulamaya (konunun kısa bir incelemesini de içerir) bakın. Lütfen bunun yeni ve aktif bir araştırma alanı olduğunu ve yakın gelecekte daha fazla sonuç beklemenizi sağlayabileceğinizi unutmayın.

[1] Benjamini, Y. ve D. Yekutieli. “Seçilen Parametreler için Yanlış Keşif Hızı Ayarlı Çoklu Güven Aralıkları.” Amerikan İstatistik Kurumu Dergisi 100, no. 469 (2005): 71-81.

[2] Cox, DR “Çoklu Karşılaştırma Yöntemleri Üzerine Bir Yorum.” Technometrics 7, no. 2 (1965): 223-24.

[3] Hochberg, Y. ve AC Tamhane. Çoklu Karşılaştırma Prosedürleri. New York, NY, ABD: John Wiley ve Sons, Inc., 1987.

[4] Rosenblatt, JD ve Y. Benjamini. “Seçici Korelasyonlar; Voodoo değil. ”NeuroImage 103 (Aralık 2014): 401–10.


1

Ben aslaçoklu test için güven aralıklarını ayarlayın. P-değerlerinin büyük bir hayranı değilim, çünkü parametreleri tahmin etmenin hiçbir zaman tam olarak doğru olmayan hipotezleri test etmekten daha iyi bir istatistik kullanımı olduğuna inanıyorum. Bununla birlikte, hipotez testinin değerine sahip olduğunu, yani en azından birinin, asemptotik olarak, bir tedavi işe yaramazsa, sıfır hipotezinin doğru olduğunu iddia edebileceği randomize kontrollü bir deneme olduğunu kabul ediyorum. Bununla birlikte, başka bir yerde söylediğim gibi [1], bu genellikle bir birincil sonucun alınmasını içerir. Bununla birlikte, sık aralıktaki tanımda güven aralıkları, hipotez içermez ve bu nedenle, diğer, potansiyel olarak alakasız karşılaştırmalar için ayarlamaya gerek yoktur. Farz edelim ki, belli bir genle ilişkili fenotipleri test ediyordum, yükseklik ve kan basıncı. BEN' Boydaki farkın genli olan ve olmayanlar arasında ne kadar büyük olduğunu ve ne kadar iyi tahmin ettiğimi bilmek istiyorum. Kan basıncını da ölçtüğümün bununla bir ilgisi olduğunu görmüyorum. Önemli olan, eğer bu ikisi, test ettiğimiz yüzlerce kişiden sadece önemli olanlarsa. O zaman, farkların, tesadüfen, sadece boy ve tansiyonu ölçtüğümüz beklenen karşı-deneylerden daha büyük olması, ancak yüzlerce deney yapması muhtemeldir. Bununla birlikte, bu durumlarda, hiçbir basit ayarlama işe yaramaz ve düzeltilmemiş bir tahminde bulunmak için daha iyi olur, ancak bu karşılaştırmaları nasıl elde ettiğiniz konusunda netleşir. Ayrıca üst üste gelen güven aralıklarıyla ilgili bazı sonuçlar yayınladık. [2] Ayrıca tansiyonu ölçtüğümün bununla bir ilgisi olduğunu görmüyorum. Önemli olan, eğer bu ikisi, test ettiğimiz yüzlerce kişiden sadece önemli olanlarsa. O zaman, farkların, tesadüfen, sadece boy ve tansiyonu ölçtüğümüz beklenen karşı-deneylerden daha büyük olması, ancak yüzlerce deney yapması muhtemeldir. Bununla birlikte, bu durumlarda, hiçbir basit ayarlama işe yaramaz ve düzeltilmemiş bir tahminde bulunmak için daha iyi olur, ancak bu karşılaştırmaları nasıl elde ettiğiniz konusunda netleşir. Ayrıca üst üste gelen güven aralıklarıyla ilgili bazı sonuçlar yayınladık. [2] Ayrıca tansiyonu ölçtüğümün bununla bir ilgisi olduğunu görmüyorum. Önemli olan, eğer bu ikisi, test ettiğimiz yüzlerce kişiden sadece önemli olanlarsa. O zaman, farkların, tesadüfen, sadece boy ve tansiyonu ölçtüğümüz beklenen karşı-deneylerden daha büyük olması, ancak yüzlerce deney yapması muhtemeldir. Bununla birlikte, bu durumlarda, hiçbir basit ayarlama işe yaramaz ve düzeltilmemiş bir tahminde bulunmak için daha iyi olur, ancak bu karşılaştırmaları nasıl elde ettiğiniz konusunda netleşir. Ayrıca üst üste gelen güven aralıklarıyla ilgili bazı sonuçlar yayınladık. [2] Sadece boy ve tansiyonu ölçtüğümüz beklenen karşı-deneylerden daha büyük, ama yüzlerce deney yaptım. Bununla birlikte, bu durumlarda, hiçbir basit ayarlama işe yaramaz ve düzeltilmemiş bir tahminde bulunmak için daha iyi olur, ancak bu karşılaştırmaları nasıl elde ettiğiniz konusunda netleşir. Ayrıca üst üste gelen güven aralıklarıyla ilgili bazı sonuçlar yayınladık. [2] Sadece boy ve tansiyonu ölçtüğümüz beklenen karşı-deneylerden daha büyük, ama yüzlerce deney yaptım. Bununla birlikte, bu durumlarda, hiçbir basit ayarlama işe yaramaz ve düzeltilmemiş bir tahminde bulunmak için daha iyi olur, ancak bu karşılaştırmaları nasıl elde ettiğiniz konusunda netleşir. Ayrıca üst üste gelen güven aralıklarıyla ilgili bazı sonuçlar yayınladık. [2]

[1] Campbell MJ ve Swinscow TDV (2009) Square One'daki istatistikler. 11 ed Oxford; BMJ Kitapları Blackwell Yayınları

[2] Julious SA, Campbell MJ, Walters SJ (2007) Gelecekteki araçların mevcut denemenin sonuçlarına dayanarak nereye uzanacağını tahmin etmek. Çağdaş Klinik Çalışmalar, 28, 352-357.


1
Düşünce yanıtını verdiğin için teşekkürler, Mike. Benjamini, Hochberg ve Yekutieli, karşılaştırmaların "alakasız" olmadığını, ancak aslında eşzamanlı olduğunu iddia ediyor gibi görünmektedir: "Tüm parametrelerin değerine dayalı bir eylem yapılması gerektiğinde eşzamanlı kapsamaya da ihtiyaç duyulmaktadır. Klinik bir denemedeki tedavilerin, hepsinin kontrol edilmesini içermesi muhtemeldir, önemli ölçüde farklı olup olmadıklarına bakılmaksızın. Bu, aynı anda kapsanmanın gerekli olduğu açık bir durumdur. " (Sadece bazı CI'lerin seçici sunumunu bir kenara bırakmak.)
Alexis

Bu arada, "P-değerlerinin büyük bir hayranı değilim, çünkü parametrelerin tahmin edilmesinin, hiçbir zaman tam olarak doğru olmayan hipotezleri sınamaktan daha iyi bir istatistik kullanımı olduğuna inanıyorum," diyebilirsiniz . yeterince büyük örneklemlerle sıfır hipotezi? . Şerefe.
Alexis

1
Parametreler için güven aralıklarının çoğu çıkarım formunun p-değerlerinden daha üstün olduğu konusunda hemfikir olmama rağmen, bunun mutlaka güven aralıkları ile çoklu karşılaştırmalar için düzeltme gerekmediği anlamına gelip gelmediğinden emin değilim. Çoğu güven aralığı, kapsamı belirtmek için alfa kullanımıyla tanımlanır. Kesin hipotez test çerçevesinden boşanmış olsam bile, bana (saf olarak, kontrol etmek için simülasyonlar yapmaktan çekinmeden) çoklu karşılaştırmalar yapıldığında dogmatik olarak nominal kapsamaya (örneğin,% 95, yani alfa = 0.05) yapışmanın yanıltıcı olabileceği anlaşılıyor. içeriyordu.
Ryan Simmons

2
Mike Campbell, "sık aralıktaki tanımda güven aralıkları, hipotezler içermediğini ve bu nedenle diğer, potansiyel olarak alakasız karşılaştırmalar için düzeltmeye ihtiyaç duymadığını" söyledi. Bu tuhaf bir ifadedir. Her ne kadar CI'ler "hipotez testlerini" yansıtmasalar da, belirli bir hata oranına sahip (örneğin, 05) istatistiksel testleri yansıtırlar ve test sayısı arttıkça bu hata oranı da aynı temel matematiksel olarak şişirilir. Boş hipotez testlerinde uygulanan ilke. Biri, p-değerleri yerine CI'lere odaklanarak çoklu karşılaştırmalar sorunundan kaçmaz.
Bonferroni
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.