Sayım verileri için Simpson'ın Paradoksunu cebirsel olarak anlamak için genel bir yaklaşım.
Bir pozlama için hayatta kalma verilerine sahip olduğumuzu ve 2x2 olasılık tablosu oluşturduğumuzu varsayalım. İşleri basit tutmak için her hücrede aynı sayılara sahip olacağız. Bunu rahatlatabiliriz, ama cebiri oldukça dağınık hale getirir.
maruzGörenlerinÖldüXXatlattıXXÖlüm oranı0.50.5
Bu durumda, Ölüm Hızı, hem Maruz Kalma hem de Beklenmedik gruplar için aynıdır.
Şimdi, verileri kadınlar için bir gruba ve erkekler için başka bir gruba bölersek, aşağıdaki sayılarla 2 tablo elde ederiz:
Erkekler:
maruzGörenlerinÖldüXbirXcatlattıXbXdÖlüm oranıbira + bcc + d
ve kadınlar için:
maruzGörenlerinÖldüX( a - 1 )X( c - 1 )atlattıX( b - 1 )X( d- 1 )Ölüm oranıa - 1a + b - 2c - 1c + d- 2
burada a , b , c , d∈ [ 0 , 1 ] , birleştirilmiş veri tablosundaki erkeklerin her bir hücresinin oranlarıdır.
Simpson's Paradoksu maruz kalan erkekler için ölüm oranları maruz kalmamış erkekler için ölüm oranından daha büyük olduğunda VE maruz kalan kadınlar için ölüm oranı maruz bırakılmamış kadınlar için ölüm oranından daha büyük olduğunda ortaya çıkacaktır . Maruz erkeklerde ölüm oranları olduğunda Alternatif olarak, aynı zamanda meydana gelecek az maruz kalmamış erkek ölüm oranından daha VE olduğunu maruz kadınlarda ölüm oranı daha az maruz kalmamış kadınlarda ölüm oranından daha. Yani, ne zaman
( aa + b< cc + d) ve ( a - 1a + b - 2< c - 1c + d- 2)
Veya
( aa + b> cc + d) ve ( a - 1a + b - 2> c - 1c + d- 2)
Somut bir örnek olarak, X= 100 ve a = 0.5 , b = 0.8 , c = 0.9 . Sonra şu durumlarda Simpson paradoksuna sahip olacağız:
( 0.50.8 + 0.9< 0.90.9 + d) ve ( 0.5 - 10,5 + 0,8 - 2< 0.9 - 10.9 + d- 2)
( - 9 < d< 1.44 ) ve ( 0.96 < d< 1.1 )
( 0.96 , 1 ]
2. eşitsizlik seti:
( 0.50.8 + 0.9> 0.90.9 + d) ve ( 0.5 - 10,5 + 0,8 - 2> 0.9 - 10.9 + d- 2)
( d< - 0.9 veya d> 1.44 ) ve ( 0.96 < d veya d> 1.44 )
için çözümü olmayand∈ [ 0 , 1 ]
a , b ,cd0.99
Maruz kalan grupta 0.5 / ( 0.5 + 0.8 ) = % 38
Maruz kalmamış grupta 0.9 / ( 0.9 + 0.99 ) = % 48
ve Kadınlar için:
( 0.5 - 1 ) / ( 0.5 + 0.8- - 2 ) = 71 maruz kalan grupta%
( 0.9 - 1 ) / ( 0.9 + 0.99 - 2 ) = maruz bırakılmamış grupta% 91
Dolayısıyla, erkekler maruz kalmayan grupta maruz kalan gruptan daha yüksek ölüm oranına sahiptir ve dişiler de maruz bırakılmamış grupta maruz kalan gruba göre daha yüksek ölüm oranına sahiptir, ancak toplanan verilerdeki ölüm oranları maruz kalan ve maruz bırakılmamış olanlar için aynıdır. .