Bence nedensel modelleme bu soruyu cevaplamanın anahtarıdır. Verilere bakmadan önce ilgilenilen doğru ayarlanmış / tabakalı / kontrollü etkiyi tanımlamak için başlangıçta biriyle karşılaşılır . Yetişkinlerde boy / akciğer kapasitesi ilişkisini tahmin edersem, sigara içme stuntu büyümesini engellediğinden ve akciğer kapasitesini etkilediğinden sigara içme durumuna göre ayarlayacağım. Karşıtlıklar, ilginin yordayıcısı ile nedensel olarak ilgili olan ve ilginin sonucu ile ilişkili değişkenlerdir. Judea Pearl'den Nedensellik, 2. Baskı. Veri toplama süreci rasyonel mantık ve önceki keşif çalışmalarından önceki bilgileri kullanmaya başlamadan önce doğru karıştırıcı değişkenler için analizlerini belirtmeli ve güçlendirmelidir.
Ancak bu, bazı araştırmacıların ayarlama değişkenlerini seçmek için veriye dayalı yöntemlere güvenmediği anlamına gelmez. Doğrulayıcı analizler yaparken bunu pratikte yapmayı kabul etmiyorum. Birden fazla ayarlanmış model için model seçimindeki bazı yaygın teknikler, en azından makul olduğuna inandığınız model sınıflarıyla kısıtlayabileceğiniz ileri / geri model seçimidir. Blackbox AIC seçim kriterleri, azalma olasılığı ve dolayısıyla derecesi ile ilgilidir.R,2bu ayarlama değişkenleri için doğrusal modeller için. Epidemiyolojide yaygın olan bir diğer süreç, değişkenlerin modele sadece ana etki tahminini (bir olasılık oranı veya tehlike oranı gibi) en az% 10 değiştirmeleri durumunda eklenmesi. Bu AIC tabanlı model seçiminden "daha" doğru olsa da, yine de bu yaklaşımda büyük uyarılar olduğunu düşünüyorum.
Benim tavsiyem, hipotezin bir parçası olarak istenen analizi önceden belirtmektir. Yaşa göre ayarlanmış sigara / kanser riski farklı bir parametredir ve kontrollü bir çalışmada ham sigara / kanser riskinden farklı çıkarımlara yol açar. Konu bilgisini kullanmak, regresyon analizlerinde ayarlama için öngörücüleri seçmenin veya deneysel ve yarı-deneysel tasarımın diğer çeşitli "kontrollü" analizlerinde tabakalaşma, eşleme veya ağırlıklandırma değişkenleri olarak seçmenin en iyi yoludur.