"Koşullama" olasılık teorisinden bir kelimedir: https://en.wikipedia.org/wiki/Conditional_probability
C koşullaması yalnızca C'nin doğru olduğu durumlara baktığımız anlamına gelir. "Örtük olarak", bu kısıtlamayı açıkça yapmıyor olabileceğimiz, hatta bazen bunu bile bilmediğimiz anlamına gelir.
Buradaki nokta, A ve B'nin her ikisi de C'ye neden olduğunda, C'nin doğru olduğu durumlarda A ve B arasında bir korelasyon gözlemlemek, A ve B arasında gerçek bir ilişki olduğu anlamına gelmez. yapay bir korelasyon yaratır.
Bir örnek verelim.
Bir ülkede tam olarak bağımsız tam olarak iki tür hastalık vardır. A: "kişinin ilk hastalığı var", B: "kişinin ikinci hastalığı var". , varsayın .P ( B ) = 0,1P( A ) = 0.1P( B ) = 0.1
Şimdi bu hastalıklardan birine sahip olan herhangi biri doktora ve sadece o zaman görmeye gider. C'yi arayın: "kişi doktora gider". Biz .C= A veya B
Şimdi birkaç olasılığı hesaplayalım:
- P( C) = 0,19
- P( A | C) = P( B | C) = 0.10.19≈ 0.53
- P( A ve B | C) = 0.010.19≈ 0.053
- P( A | C) P( B | C) ≈ 0.28
Açıkçası, C, ve üzerinde koşullandırıldığında bağımsız olmaktan çok uzaktır. Aslında, C üzerinde koşullandırılmış, neden olur gibi görünüyor .B n o t A BbirBn o t AB
Analizleri için veri kaynağı olarak doktor (lar) ı tarafından kaydedilen kişilerin listesini kullanırsanız, ve hastalıkları arasında güçlü bir korelasyon olduğu görülmektedir . Veri kaynağınızın aslında bir koşullama olduğunu bilmiyor olabilirsiniz. Buna "seçim yanlılığı" da denir.BbirB