Değişkenleri eşleştirme ve istatistiksel olarak kontrol etme gibi yöntemler arasındaki bağlantı nedir?


10

Sık sık okuduğunuz araştırma makalelerinde araştırmacılar belirli değişkenleri kontrol etmişlerdir. Bu, eşleme, engelleme vb. Yöntemlerle yapılabilir.

Ama her zaman değişkenleri kontrol etmenin, etki edebilecek çeşitli değişkenleri ölçerek ve bunlar üzerinde hem gerçek hem de yarı deneylerde yapılabilecek bazı istatistiksel analizler yaparak istatistiksel olarak yapılan bir şey olduğunu düşündüm. Örneğin, bağımsız değişkeni ve muhtemelen karıştırıcı değişkenleri ölçüp bir analiz yaptığınız bir anket veya başka bir testiniz olur.

  • Yarı deneylerde değişkenleri kontrol etmek mümkün müdür?
  • Değişkenleri eşleştirme ve istatistiksel olarak kontrol etme gibi yöntemler arasındaki bağlantı nedir?

Yanıtlar:


6

AdamO'da olduğu gibi, bu soruya cevap vermenin anahtarı nedensel çıkarım kavramı ve gözlemsel kurulumları kullanarak nedensel bir modele nasıl "ulaşılacağı" dır.

Kusursuz bir dünyada, karşı-olgusal nüfus olarak adlandırdığımız bir şey olurdu - ilgilendiğimiz tek şey hariç her bakımdan özdeş olan çalışma popülasyonu. Bu iki popülasyon arasındaki fark, bu farka dayalı olarak, gerçek bir nedensel sonuçtur.

Açıkçası, buna sahip olamayız.

Bununla birlikte, ona yaklaşmaya çalışmanın yolları vardır:

  • Rasgeleleştirme: Bu teorik olarak (rasgeleleştirme doğru şekilde yapılırsa), randomizasyon sonrası tedavi hariç, aynı iki popülasyonu vermelidir.

  • Tabakalaşma: Bir popülasyon bakabilirsiniz içinde karşılaştırmalar "gibi olduğu gibi" sen yapıyoruz kovaryantlar, seviyelerine. Bu, az sayıda seviye için muhteşem bir şekilde çalışır, ancak hızlı bir şekilde hantal hale gelir.

  • Eşleştirme: Eşleştirme, A Grubu'nun B Grubuna benzeyeceği ve dolayısıyla karşılaştırmaya uygun olacak şekilde bir çalışma popülasyonu oluşturma girişimidir.

  • İstatistiksel ayarlama: Bir regresyon modeline ortak değişkenlerin dahil edilmesi, ortak değişkenlerin seviyelerinde bir etkinin tahmin edilmesine izin verir - yine, benzer ile karşılaştırmak veya en azından denemek.

Hepsi bu karşı-olgusal nüfusa yaklaşma çabasıdır. En iyi nasıl elde edeceğiniz, dışarı çıkmak istediğinize ve çalışmanızın neye benzediğine bağlıdır.


Harika bir açıklama. Orijinal soruyu çok daha özlü ve daha iyi ele alıyor. Bu yöntemlerden bahsetmeme izin verin, boş katmanlara sahip olma problemine sadece istatistiksel uyum geçirmez. Bir vaka kontrol çalışmasında, popülasyonu yaşa, tabakalaşmaya, tabakalaşmaya ve (blok) yaşa göre sınıflandırmak istersek, 50 yaşındaki bir vakayı 51 yaşındaki bir kontrolden karşılaştırmak için kabalaştırmak veya binmek gerekir.
AdamO

Bununla birlikte, lojistik regresyonda, bu karşılaştırmayı yapmak için doğrusal veya temel eğri ayarlı yaş gibi, gruplar arasında bilgi örtük olarak ödünç almak için sürekli bilgileri kullanabilirsiniz. Bu, regresyon modellemeyi mevcut en güçlü ve yararlı istatistiksel yöntemlerden biri haline getirir.
AdamO

@AdamO Anlaştı - yukarıda bağlantılı sorudaki cevabımda, bilgi eksikliğinin şans ve binicilik nedeniyle olduğu sürece, bilgi olmayan alanları düzeltmek için kullanılabileceğinden bahsediyorum. Ama evet - regresyonun harika bir nedeni var.
Fomite

2

Bence nedensel modelleme bu soruyu cevaplamanın anahtarıdır. Verilere bakmadan önce ilgilenilen doğru ayarlanmış / tabakalı / kontrollü etkiyi tanımlamak için başlangıçta biriyle karşılaşılır . Yetişkinlerde boy / akciğer kapasitesi ilişkisini tahmin edersem, sigara içme stuntu büyümesini engellediğinden ve akciğer kapasitesini etkilediğinden sigara içme durumuna göre ayarlayacağım. Karşıtlıklar, ilginin yordayıcısı ile nedensel olarak ilgili olan ve ilginin sonucu ile ilişkili değişkenlerdir. Judea Pearl'den Nedensellik, 2. Baskı. Veri toplama süreci rasyonel mantık ve önceki keşif çalışmalarından önceki bilgileri kullanmaya başlamadan önce doğru karıştırıcı değişkenler için analizlerini belirtmeli ve güçlendirmelidir.

Ancak bu, bazı araştırmacıların ayarlama değişkenlerini seçmek için veriye dayalı yöntemlere güvenmediği anlamına gelmez. Doğrulayıcı analizler yaparken bunu pratikte yapmayı kabul etmiyorum. Birden fazla ayarlanmış model için model seçimindeki bazı yaygın teknikler, en azından makul olduğuna inandığınız model sınıflarıyla kısıtlayabileceğiniz ileri / geri model seçimidir. Blackbox AIC seçim kriterleri, azalma olasılığı ve dolayısıyla derecesi ile ilgilidir.R,2bu ayarlama değişkenleri için doğrusal modeller için. Epidemiyolojide yaygın olan bir diğer süreç, değişkenlerin modele sadece ana etki tahminini (bir olasılık oranı veya tehlike oranı gibi) en az% 10 değiştirmeleri durumunda eklenmesi. Bu AIC tabanlı model seçiminden "daha" doğru olsa da, yine de bu yaklaşımda büyük uyarılar olduğunu düşünüyorum.

Benim tavsiyem, hipotezin bir parçası olarak istenen analizi önceden belirtmektir. Yaşa göre ayarlanmış sigara / kanser riski farklı bir parametredir ve kontrollü bir çalışmada ham sigara / kanser riskinden farklı çıkarımlara yol açar. Konu bilgisini kullanmak, regresyon analizlerinde ayarlama için öngörücüleri seçmenin veya deneysel ve yarı-deneysel tasarımın diğer çeşitli "kontrollü" analizlerinde tabakalaşma, eşleme veya ağırlıklandırma değişkenleri olarak seçmenin en iyi yoludur.


2

Eşleştirme ve regresyon arasındaki ilişki hakkındaki hikaye, buradaki bir blog yazısında kısaca özetlenmiştir . Kısacası

"D [bir tedavi göstergesi] üzerindeki gerileme X [ortak değişkenler] için tam bir dizi aptal (yani doymuş) model. D'nin etkisinin sonuç tahmini, X ile eşleşmeye ve varyans tarafından ortak değişken hücreler arasında ağırlıklandırmaya eşittir tedavi şartlı X "

Ayrıca , Regresyonun dolaylı olarak sağladığı D verilen X ağırlığının artıları ve eksileri de dahil olmak üzere kapsamlı bir tartışma için Çoğunlukla Zararsız Ekonometri'nin 3.3 numaralı bölümüne ya da Karşı Olgular ve Nedensel Çıkarımın 5.3 bölümüne bakınız .

@EpiGrad ilk sorunuzda iyi bir başlangıç ​​yapar. Yukarıda bağlantılı kitaplar neredeyse münhasıran ele alır. Eğer bir bilgisayar bilimi / matematik geçmişiniz yoksa, Pearl'ü çok zor bulabilirsiniz (sonunda buna rağmen!)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.