İstatistiksel bir model nedensellik hakkında ne söyleyebilir? İstatistiksel bir modelden nedensel bir çıkarım yapılırken nelere dikkat edilmelidir?
Açıklığa kavuşturmak için ilk şey, tamamen istatistiksel bir modelden nedensel çıkarım yapamazsınız. Hiçbir istatistiksel model nedensel varsayımlar olmadan nedensellik hakkında bir şey söyleyemez. Yani nedensel çıkarım yapmak için nedensel bir modele ihtiyacınız vardır .
Randomize Kontrol Denemeleri (RCT'ler) gibi altın standart olarak kabul edilen bir durumda bile, devam etmek için nedensel varsayımlar yapmanız gerekir. Bunu açıklamama izin ver. Örneğin, randomizasyon prosedürü, ilgi muamele ve de sonucun sonuç olduğunu varsayalım . Mükemmel bir RCT varsayarak, varsaydığınız şey şudur:ZXY
Bu durumda yani işler iyi gidiyor. Bununla birlikte, ile arasında karışık bir ilişki ile sonuçlanan kusurlu uyumluluğunuz olduğunu varsayalım . O zaman, şimdi, RCT'niz şöyle görünür:P(Y|do(X))=P(Y|X)XY
Analiz yapmak için hala bir niyet yapabilirsin. Ancak gerçek etkisini tahmin etmek istiyorsanız, artık basit değil. Bu bir enstrümantal değişken ayarıdır ve bazı parametrik varsayımlar yaparsanız, etkiyi tanımlayabilir, hatta sınırlayabilirsiniz .X
Bu daha da karmaşıklaşabilir. Ölçüm hatası problemleriniz olabilir, denekler çalışmayı bırakabilir veya diğer hususların yanı sıra talimatları izlemeyebilir. Bu şeylerin çıkarım ile nasıl ilerleyeceği ile ilgili varsayımlarda bulunmanız gerekir. "Tamamen" gözlemsel verilerle bu daha problemli olabilir, çünkü genellikle araştırmacılar veri üretme süreci hakkında iyi bir fikir sahibi olmayacaktır.
Bu nedenle, modellerden nedensel çıkarımlar yapmak için sadece istatistiksel varsayımlarını değil, en önemlisi nedensel varsayımlarını değerlendirmeniz gerekir. İşte nedensel analiz için bazı yaygın tehditler:
- Eksik / kesin olmayan veriler
- Hedef nedensel ilgi miktarı iyi tanımlanmamış (Tanımlamak istediğiniz nedensel etki nedir? Hedef kitle nedir?)
- Kafa karıştırıcı (gözlemlenmemiş kafa karıştırıcılar)
- Seçim yanlılığı (kendiliğinden seçim, kesilmiş örnekler)
- Ölçüm hatası (karıştırıcı olabilir, sadece gürültüyü değil)
- Yanlış tanımlama (örneğin, yanlış işlevsel biçim)
- Dış geçerlilik sorunları (hedef nüfusa yanlış çıkarım)
Bazen bu problemlerin bulunmadığı iddiası (veya bu problemleri ele alan iddiası) çalışmanın tasarımıyla desteklenebilir. Bu nedenle deneysel veriler genellikle daha güvenilirdir. Bununla birlikte, bazen insanlar bu problemleri ya teorik olarak ya da kolaylık olsun diye kabul eder. Teori yumuşaksa (sosyal bilimlerde olduğu gibi), sonuçları yüz değerinde almak daha zor olacaktır.
Ne zaman yedeklenemeyeceğine dair bir varsayım olduğunu düşünüyorsanız, sonuçların bu varsayımların makul ihlallerine karşı ne kadar hassas olduğunu değerlendirmelisiniz - buna genellikle duyarlılık analizi denir.