Simpson'ın paradoksunu nasıl çözebilirim?


35

Simpson'ın paradoksu dünya çapında tanıtım istatistik derslerinde tartışılan klasik bir bilmecedir. Ancak kursum, bir sorunun var olduğunu ve bir çözüm sağlamadığını basitçe not etmekten memnuniyet duyuyordu. Paradoksu nasıl çözeceğimi bilmek istiyorum. Bu, Simpsonların paradoksuyla karşı karşıya kaldığında, verinin nasıl bölümlendiğine bağlı olarak en iyi seçim olmak için iki farklı seçeneğin rekabet ettiği görünüyor, hangisi seçilmeli?

Sorunu somutlaştırmak için, ilgili Wikipedia makalesinde verilen ilk örneği ele alalım . Böbrek taşlarının tedavisi hakkında yapılan gerçek bir çalışmaya dayanmaktadır.

görüntü tanımını buraya girin

Diyelim ki ben doktorum ve bir test hastanın böbrek taşı olduğunu gösteriyor. Tabloda verilen bilgileri kullanarak, tedavi A mı yoksa tedavi B'yi mi benimsemem gerektiğini belirlemek istiyorum. Görünüşe göre taş boyutunu bilirsem, o zaman A tedavisini tercih etmeliyiz. B tedavisini tercih etmeliyiz

Ancak bir cevaba ulaşmak için başka bir makul yol düşünün. Taş büyükse, A'yı seçmeliyiz, küçükse, yine A'yı seçmeliyiz. Bu nedenle, taş boyutunu bilmesek bile, dava yöntemleriyle A'yı tercih etmemiz gerektiğini görürüz. Bu bizim önceki akıl yürütmemizle çelişiyor.

Yani: Bir hasta ofisime giriyor. Bir test böbrek taşlarına sahip olduğunu ancak boyutları hakkında hiçbir bilgi vermediğini gösteriyor. Hangi tedaviyi öneririm? Bu sorunun kabul edilmiş bir çözümü var mı?

Vikipedi, "nedensel Bayesian ağları" ve "arka kapı" testini kullanan bir çözüme işaret ediyor, ancak bunların ne olduğu hakkında hiçbir fikrim yok.


2
Temel Simpson Paradox yukarıda belirtilen bağlantı gözlemsel verilerin bir örnektir. Hastaneler arasında kesin bir şekilde karar veremiyoruz, çünkü hastalar muhtemelen hastanelere rastgele atanmamış ve sorulan soru bize, örneğin bir hastanenin daha yüksek riskli hasta alma eğiliminde olup olmadığını bilmek için bir yol vermemektedir. Sonuçları operasyonlara ayırmak AE, bu sorunu çözmez.
Emil Friedman

@EmilFriedman Hastaneler arasında açıkça karar verebileceğimizin doğru olduğu konusunda hemfikirim. Ancak kesinlikle veriler birbiri ardına desteklenir. (Verilerin bize hastanelerin kalitesiyle ilgili hiçbir şey öğretmediği doğru değildir.)
Patates

Yanıtlar:


14

Sorunuzda, "nedensel Bayesian ağlarının" ve "arka kapı testlerinin" ne olduğunu bilmediğinizi belirtiyorsunuz.

Nedensel bir Bayesian ağınız olduğunu varsayalım. Yani, düğümleri önerileri temsil eden ve yönlendirilmiş kenarları potansiyel nedensel ilişkileri temsil eden yönlendirilmiş bir asiklik grafiktir. Her hipoteziniz için bu tür birçok ağınız olabilir. Bir kenar gücü veya varlığı hakkında zorlayıcı bir argüman yapmanın üç yolu vardır .A?B

En kolay yol müdahaledir. Diğer cevapların “uygun randomizasyonun” sorunu çözeceğini söylediklerini söylediği şey budur. Rasgele farklı değerlere sahip olmaya zorlarsınız ve ölçersiniz . Bunu yapabilirsen bitti, ama her zaman bunu yapamazsın. Örneğinizde, insanlara ölümcül hastalıklara etkisiz tedaviler vermek etik dışı olabilir veya tedavilerinde söz sahibi olabilirler, örneğin, böbrek taşları küçük ve daha az ağrılı olduğunda daha az sert (B tedavisi) seçebilirler.bAB

İkinci yol ise ön kapı yöntemidir. üzerinden etki ettiğini , yani göstermek istediğinizi göstermek istersiniz . Eğer olduğunu varsayarsak potansiyel kaynaklanır ancak başka nedenleri vardır ve bunu ölçebilir ile ilişkilidir ve ile ilişkilidir , o zaman delil yoluyla akan olmalıdır sonuca varabiliriz . Orijinal örnek: sigara içiyor, kanser,B C A C B C A C A B C C A B CABCACBCACABCCABCkatran birikimidir. Katran sadece sigaradan gelebilir ve hem sigara hem de kanserle ilişkilidir. Bu nedenle, sigara içmek katran yoluyla kansere neden olur (bu etkiyi hafifleten başka nedensel yollar da olabilir).

Üçüncü yol ise arka kapı yöntemidir. Bunu göstermek istiyorum ve , çünkü bir "arka kapı", örneğin ortak bir amaç, yani, korelasyon göstermemektedir . Nedensel bir model üstlendiğinizden, kanıtların kadar aşağı akabileceği tüm yolları (bunlara değişkenleri gözlemleyerek ve koşullandırarak) engellemeniz yeterlidir . Bu yolları engellemek biraz zor, ancak Pearl bu yolları engellemek için hangi değişkenleri gözlemlemeniz gerektiğini bilmenizi sağlayan net bir algoritma sunuyor.B A D B A BABADBAB

gung, iyi randomizasyonda, kargaşanın önemli olmayacağı konusunda haklıdır. Varsayım nedenine (tedavi) müdahale etmenin yasak olduğu varsayıldığından, yaş veya böbrek taşı büyüklüğü gibi varsayımsal nedenler (tedavi) ve etki (sağkalım) arasındaki ortak bir nedenden dolayı karmakarışık olacaktır. Çözüm, arka kapıların tümünü engellemek için doğru ölçümleri yapmak. Daha fazla okumak için bakınız:

Pearl, Judea. "Ampirik araştırma için nedensel diyagramlar." Biometrika 82.4 (1995): 669-688.


Bunu probleminize uygulamak için, önce nedensel grafiği çizelim. Böbrek taşı boyutu (Tedavi önce gelen) ve tedavi türü başarısı, her iki nedenleridir . Eğer diğer doktorlar böbrek taşı büyüklüğüne göre tedavi atarlarsa, nedeni olabilir . Açıkçası , , ve arasında başka bir nedensel ilişki yoktur . , sonra gelir, bu yüzden sebebi olamaz. Benzer şekilde , ve sonra gelir .Y Z X Y X Y Z Y X Z X YXYZXYXYZYXZXY

Yana bir yaygın nedeni, bu ölçülmelidir. Değişkenlerin ve potansiyel nedensel ilişkilerin evrenini belirlemek deneyciye kalmıştır . Her deney için, deneyci gerekli "arka kapı değişkenlerini" ölçer ve daha sonra değişkenlerin her yapılandırması için tedavi başarısının marjinal olasılık dağılımını hesaplar. Yeni bir hasta için değişkenleri ölçtünüz ve marjinal dağılımla belirtilen tedaviyi takip ettiniz. Her şeyi ölçemiyorsanız veya çok fazla veriniz yoksa ancak ilişkilerin mimarisi hakkında bir şeyler biliyorsanız, ağda "inanç yayılımı" (Bayesian çıkarımı) yapabilirsiniz.X


2
Çok güzel cevap. Bu çerçeveyi, soruda verdiğim örneğe nasıl uygulayacağınızı kısaca söyleyebilir misiniz? Beklenen cevabı veriyor mu (A)?
Patates

Teşekkürler! "İnanç yayılımı" nın iyi ve kısa bir girişini biliyor musunuz? Daha fazla bilgi edinmek istiyorum.
Patates

@Potato: “Akıllı Sistemlerde Olasılıklı Muhakeme” adlı kitabından öğrendim. Çevrimiçi olarak birçok ders var, ancak algoritmayı sunmak yerine sezgiyi geliştiren birisini bulmak zor.
Neil G,

22

Simpson'un paradoksunu burada tartışan önceki bir cevabım var: Temel Simpson'ın paradoksu . Fenomeni daha iyi anlamak için bunu okumanıza yardımcı olabilir.

Kısacası, Simpson'un paradoksu kafa karıştırıcıdır. Örneğinizde tedavi karışık* Her hastanın sahip olduğu böbrek taşı türleriyle. Sonuç tablosundan, A tedavisinin her zaman daha iyi olduğunu gösterdiğini biliyoruz. Bu nedenle, bir doktor A tedavisini seçmelidir. B tedavisinin toplamda daha iyi görünmesinin tek nedeni, daha az ağır durumu olan hastalara daha sık verildiği halde, A tedavisinin daha ağır durumu olan hastalara verildiğidir. Bununla birlikte, A tedavisi her iki durumda da daha iyi sonuç verdi. Bir doktor olarak, geçmişte daha az hastalığa sahip olan hastalara daha kötü bir tedavi verildiği gerçeğini umursamıyorsunuz, sadece sizden önce hastayı önemsiyorsunuz ve o hastanın iyileşmesini istiyorsanız, mevcut en iyi tedavi ile onları.

* Deneyleri yürütmenin ve tedavileri randomize etmenin, tedavilerin karıştırılmadığı bir durum yaratmak olduğuna dikkat edin . Söz konusu çalışma bir deney olsaydı, gözlemsel bir çalışma olmasına rağmen, randomizasyon sürecinin eşit gruplar oluşturamadığını söyleyebilirim.


Diğer cevapta da önerilen normalizasyon yaklaşımını tercih edersiniz. Bunu problemli buluyorum. Normalize edildiğinde farklı sonuçlar veren aynı veri setinin iki bölümünü göstermek mümkündür. Diğer cevaba cevap olarak benim bağlantı ve teklif bakın.
Patates

2
Stanford makalesini okumadım. Bununla birlikte, alıntıdaki gerekçeyi zorlayıcı bulmuyorum. Bazı popülasyonlarda, B tedavisinin A tedavisinden daha iyi olması iyi olabilir. Bu, bazı popülasyonlar için geçerliyse, bunun nedeni sadece popülasyonun özelliklerinin karışık olmasıdır. Hasta ile karşı karşıya kalıyorsunuz (bir popülasyon değil), ve bu hastanın tedavi altında gelişmesi daha muhtemel A tedavisini seçmelisiniz
gung - Monica’yı eski durumuna getirin

2
Genç / yaşlı bölüm karışık mı? Olmazsa, bu bir problem olmayacak. Öyleyse, en iyi kararı vermek için tüm bilgileri kullanırız. Şu anda bildiklerimize dayanarak, 'B tedavisi, agrega içerisinde en iyi görünen' kırmızı bir ringa balığıdır. Sadece kafa karıştırıcı olduğu için durum böyle görünüyor, fakat (istatistiksel) bir yanılsama.
gung - Monica 'ya geri dön

2
Hem böbrek taşı büyüklüğünü hem de yaşını dikkate alan daha karmaşık bir tablonuz olurdu. Berkeley cinsiyet yanlılığı örneğine Vikipedi sayfasından bakabilirsiniz .
gung - Monica'yı yeniden yerleştirme

1
Bu kadar uzun süre açıklama yapmaktan nefret ediyorum ama ... Ben paradoksun her zaman kafa karıştırıcı olmasından kaynaklandığını söyleyemem. Bu, kafa karıştırıcı bir değişkenin sahip olacağı değişkenler arasındaki ilişkiden kaynaklanıyor, ancak Simpson paradoksunu karıştırmaya neden olan tüm değişkenleri çağırmam (ör. 30 yaş ve 90 yaş yaş x cinsinden ağırlıkla anum başına tüketilen patates cipsi miktarı) ... Ben yaş olsa karıştırmak demem çünkü 90 yıl yaşındakiler dahil etkileşimi olmadan negatif olabilir cips ana etkisi ile başlamak daha hafif olan (ilk şek bkz Vikipedi sayfasından..)
John


4

Bir örneğe çözüm veya genel olarak paradoks ister misiniz? İkincisi için hiçbir şey yoktur, çünkü paradoks birden fazla nedenden ötürü ortaya çıkabilir ve durum bazında bir durum için değerlendirilmesi gerekir.

Paradoks, özet verileri bildirirken öncelikli olarak sorunludur ve bireylerin verinin nasıl analiz edileceğini ve rapor edileceğini eğitmede kritik öneme sahiptir. Araştırmacıların, verideki kalıpları gizleyen veya gizleyen özet istatistikleri rapor etmelerini istemiyoruz; verilerdeki gerçek kalıpların ne olduğunu anlamayan veri analistleri. Hiçbir çözüm verilmedi, çünkü tek bir çözüm yok.

Bu özel durumda, masayı alan doktor açıkça A'yı seçer ve özet çizgisini görmezden gelir. Taşın boyutunu bilseler de bilmeseler de fark etmez. Verileri analiz eden biri yalnızca A ve B için sunulan özet satırları bildirmiş olsaydı, o zaman bir sorun olurdu çünkü doktorun aldığı veriler gerçeği yansıtmazdı. Bu durumda, büyük olasılıkla, tablodaki son satırı da bırakmış olmalılardı, çünkü özet istatistiğinin ne olması gerektiğinin bir yorumunda doğruydu (iki olası). Okuyucuyu, tek tek hücreleri yorumlamaya bırakmak genellikle doğru sonucu verirdi.

(Çok fazla yorumunuz, eşit olmayan N meseleleri hakkında en çok endişelendiğinizi gösteriyor gibi görünüyor ve Simpson bundan daha geniş, bu yüzden eşitsiz N meselesinde daha fazla durmak istemiyorum. Belki de daha hedeflenmiş bir soru sorun. Bir normalizasyon sonucunu savunuyorum, bilmiyorum, özet istatistiklerin göreceli olarak keyfi seçildiğini ve bazı analistler tarafından yapılan seçimlerin paradokslara yol açtığını düşünmeniz gerektiğini düşünüyorum. Hücrelere baktığınızı da ileri sürüyorum. var.)


Özet satırını görmezden gelmemiz gerektiğini iddia ediyorsun. Neden bu "açık"?
Patates

Açıktır, çünkü A tedavisi büyük veya küçük taşlarla daha iyidir ve B yalnızca eşit olmayan N'ler nedeniyle ortaya çıkar. Ayrıca, son satırda müjde değil bir yorumdur. Bu satırı hesaplamak için en az iki yol var. Belirli bir örnek hakkında bir şey söylemek istiyorsanız, sadece bu şekilde hesaplarsınız.
John

Üzgünüm, özet satırının neden yanlış bir rapor olduğunu anlamıyorum. Sanırım merkezi noktanı özlüyorum. Lütfen açıklar mısın?
Patates

1
Normalleştirebilir ve daha sonra ortalama olarak "doğru" sonuç verir (A). Ancak bu yasadışı. Aşağıdaki alıntı, burada bulunan Stanford Felsefe Ansiklopedisi'ndeki ilgili makaleden alınmıştır: plato.stanford.edu/entries/paradox-simpson
Patates

2
“Simpson'ın Tersine Dönmeleri, toplam popülasyondaki dernekler ile tutarlı bir popülasyonun bölünmesinin sayısız yolunun olduğunu gösteriyor. Cinsiyete göre bir bölüm, hem erkeklerin hem de kadınların, aynı popülasyonun bir bölümü, yeni bir tedavi ile sağlandığında daha da kötüleştiğini gösterebilir. yaşlarına göre, elli yaşın altındaki hastaların ve elli ve yaşlı hastaların her ikisi de yeni tedaviye rağmen daha iyi sonuç verdiğini belirtti. Aynı popülasyonun farklı bölümleme yöntemlerinden verileri normalleştirmek, toplam popülasyonda yer alan dernekler hakkında uyumsuz sonuçlar sağlayacaktır. ”
Patates

4

Önemli bir "uzaklaştırma", eğer tedavi atamaları alt gruplar arasında orantısız ise, verileri analiz ederken alt grupları dikkate almak gerekir.

İkinci önemli "götürme", gözlemsel çalışmaların özellikle Simpson'un paradoksunun bilinmeyen varlığından dolayı yanlış cevaplar vermeye eğilimli olduğudur. Çünkü A Tedavisinin daha zor vakalara verilme eğiliminde olduğu yönündeki gerçeği düzeltemiyoruz.

Düzgün bir şekilde randomize bir çalışmada (1), rastgele tedaviyi tahsis edebiliriz, böylece bir tedaviye “haksız avantaj” verilmesi çok düşük bir ihtimaldir ve veri analizinde otomatik olarak halledilir ya da (2) önemli bir neden varsa Bunu yapmak için, tedavileri rastgele fakat orantısız olarak bilinen bir konuya dayanarak tahsis edin ve daha sonra analiz sırasında bu konuyu dikkate alın.


+ 1, ancak "otomatik olarak ilgilenilir" tam olarak doğru değil (en azından şu anki durumda, en çok önem verdiğin şey bu). Uzun vadede doğrudur, ancak hala örnekleme hatası nedeniyle tip I ve tip II hatalarınız olabilir (yani, 1 tedavi koşulundaki hastaların yalnızca şans eseri daha ağır hastalıklara sahip olma eğiliminde oldukları).
gung - Monica'yı yeniden yerleştir

Ancak beklenmedik durum tablosunu analiz ettiğimizde ve p değerini hesaplayıp doğru yorumladığımızda örnekleme hatasının etkisi dikkate alınacaktır.
Emil Friedman
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.