Bence bu çok iyi bir soru; epidemiyolojiden ekonometriye kadar çeşitli alanları saran, tartışmalı çoklu test "sorununun" kalbine ulaştı. Sonuçta , bulduğumuz önemin sahte olup olmadığını nasıl bilebiliriz? Çok değişkenli modelimiz ne kadar doğrudur?
Gürültü değişkenleri yayınlama olasılığını dengelemek için teknik yaklaşımlar açısından, örneğinizin bir kısmını eğitim verisi olarak ve geri kalanını test verisi olarak kullanmanın iyi bir fikir olduğunu yürekten kabul ediyorum. Bu teknik literatürde tartışılan bir yaklaşımdır, bu nedenle zaman ayırırsanız, ne zaman ve nasıl kullanılacağına ilişkin bazı iyi yönergeler öğrenebilirsiniz.
Ancak birden fazla test felsefesinde daha doğrudan vurmak için, aşağıda birden çok test için ayarlamanın genellikle zararlı (maliyet gücü) olduğu, hatta gereksiz olduğu ve hatta mantıksal bir yanlışlık olabileceği pozisyonunu destekleyen aşağıdaki makaleleri okumanızı öneririm. . Ben, biri için potansiyel bir tahminciyi araştırma yeteneğimizin, diğerinin soruşturmasıyla kaçınılmaz şekilde azaldığı iddiasını otomatik olarak kabul etmiyorum. Aile bilge Tip 1 hata oranı kadar uzun bizim örnek büyüklüğü, her biri için Tip 1 hata olasılığı sınırlarını aşan gitmez olarak biz belli bir modelde birden açıklayıcı değişken olarak artırmak, ancak olabilir bireyöngörücü sabittir; ve aile kaynaklı hata kontrolü, hangi özel değişkenin gürültü olduğunu ve hangisinin olmadığını gösterir. Tabii ki, aynı zamanda kesin karşı argümanlar vardır.
Bu nedenle, potansiyel değişkenler listenizi makul olanlarla sınırlandırdığınız sürece (yani, sonuca giden yolu bilecektir) o zaman sahte olma riski zaten oldukça iyi ele alınmaktadır.
Bununla birlikte, bir yordayıcı modelin, yordayıcılarının nedensel bir model olarak “hakikat değeri” ile ilgili olmadığını ; Modelde çok fazla kafa karıştırıcı olabilir, ancak büyük bir varyans derecesini açıkladığımız sürece çok fazla endişelenmiyoruz. Bu, işi en azından bir anlamda kolaylaştırır.
Alkış,
Brenden, Biyoistatistik Danışmanı
Not: İki ayrı regresyon yerine, tarif ettiğiniz veriler için sıfır şişirilmiş Poisson regresyonu yapmak isteyebilirsiniz.
- Perneger, TV Bonferroni ayarlarında yanlış olan ne ? BMJ 1998; 316: 1236
- Cook, RJ & Farewell, VT Klinik çalışmaların tasarımında ve analizinde çokluk düşünceleri . Kraliyet İstatistik Kurumu Dergisi , Seri A 1996; Vol. 159, No. 1: 93-110
- Rothman, KJ Çoklu karşılaştırmalar için ayarlama yapılması gerekmez . Epidemiyoloji 1990; Vol. 1, No. 1: 43-46
- Marshall, JR Veri tarama ve dikkat çekici . Epidemiyoloji 1990; Vol. 1, No. 1: 5-7
- Grönland, S. ve Robins, JM Ampirical-Bayes çoklu karşılaştırmalar için ayarlamalar bazen yararlı olabilir . Epidemiyoloji 1991; Vol. 2, No. 4: 244-251