Son blog yazılarından Andrew Gelman diyor ki:
Simpsonların paradoksu için karşı tarafların ya da potansiyel sonuçların gerekli olduğunu düşünmüyorum. Bunu söylüyorum, çünkü biri manipüle edilemeyen veya manipülasyonların doğrudan ilgilenmediği değişkenlerle Simpson'un paradoksunu kurabilir.
Simpson'un paradoksu, daha fazla yordayıcı eklerseniz, regresyon coef'lerinin değiştiği daha genel bir sorunun bir parçasıdır, işaretin saygısızlığı gerçekten gerekli değildir.
İşte öğretmenliğimde her iki noktayı da gösteren bir örnek:
Cinsiyet ve boydan gelir öngören bir regresyon çalıştırabilirim. Cinsiyetin külfetinin 10,000 dolar olduğunu (yani aynı yükseklikte bir erkek ve kadını karşılaştırırken, ortalama olarak erkeğin 10,000 doları daha fazla kazanacağını ) ve yükseklik katsayısının 500 $ olduğunu (yani iki erkek veya iki kadını karşılaştırarak) buluyorum farklı yüksekliklerde, uzun boylu kişi ortalama olarak inç başına 500 dolar kazanacaktır ).
Bu sığırları nasıl yorumlayabilirim? Boy kedisinin yorumlanmasının kolay olduğunu hissediyorum (aynı cinsiyetten iki kişiyi farklı yüksekliklerle karşılaştırmayı hayal etmek kolaydır), aslında ham maddenin çoğu kadar cinsiyeti kontrol etmeden boyuna gerilemeyi bir şekilde "yanlış" olarak görüyordu. kısa ve uzun boylu insanlar arasındaki fark, kadın ve erkek arasındaki farklarla “açıklanabilir”. Fakat yukarıdaki modeldeki seks yapısının yorumlanması çok zor görünüyor: örneğin, hem 66 inç yüksekliğinde olan bir erkek ve bir kadını neden karşılaştırmalıyız? Uzun boylu bir kadınla kısa bir adamın karşılaştırılması olurdu. Tüm bu akıl yürütme belirsiz bir nedensel görünüyor ama potansiyel sonuçları kullanarak düşünmenin bir anlamı yok.
Bunun üzerinde durdum (ve hatta yayına yorum yaptım) ve burada daha net bir şekilde anlaşılması gereken bir şey olduğunu düşünüyorum.
Cinsiyetin yorumlanması kısmına kadar bu çok iyi. Ancak kısa bir erkek ve uzun boylu bir kadını karşılaştırmanın ardında ne sorun olduğunu görmüyorum. İşte benim açımdan: Aslında daha da mantıklı (erkeklerin ortalama olarak daha uzun olduğu varsayımı göz önüne alındığında). Bir 'kısa erkek' ve 'kısa' bir kadını tam olarak aynı nedenden ötürü karşılaştıramazsınız, gelirdeki farkın bir kısmı yüksekliklerdeki farkla açıklanır. Aynı durum, uzun boylu erkekler ve uzun boylu kadınlar için ve daha da ötesi, kısa kadınlar ve uzun boylu erkekler için (söz konusu olandan daha fazla söz konusu olan). Dolayısıyla, temel olarak yüksekliğin etkisi sadece kısa erkeklerle uzun boylu kadınların karşılaştırılması durumunda elimine edilir (ve bu cinsiyet katsayısının yorumlanmasına yardımcı olur). Popüler eşleştirme modellerinin arkasındaki benzer temel kavramları üzerinde bir zil çalmıyor mu?
Simpson'un paradoksunun ardındaki fikir, nüfus etkisinin, alt grup bilge etkilerinden farklı olabileceği yönündedir. Bu, bir anlamda, 2. noktasıyla ve yüksekliğinin tek başına kontrol edilmemesi gerektiğini (değişken önyargıyı ihmal ettiğimiz dediğimiz) kabul ettiği gerçeğiyle ilgili. Ancak bunu toplumsal cinsiyet katsayısı tartışmasına bağlayamadım.
Belki daha net ifade edebilirsin? Ya da benim anlayış hakkında yorum?