Rastgele ödev: neden rahatsız oluyorsunuz?


9

Rastgele atama değerlidir, çünkü tedavinin potansiyel sonuçlardan bağımsız olmasını sağlar. Ortalama tedavi etkisinin tarafsız tahminlerine bu şekilde yol açar. Ancak diğer atama şemaları da tedavinin potansiyel sonuçlardan bağımsız olmasını sistematik olarak sağlayabilir. Öyleyse neden rastgele görevlendirmeye ihtiyacımız var? Başka bir deyişle, rastgele atamanın, tarafsız çıkarımlara yol açan rastgele olmayan atama şemalarına göre avantajı nedir?

Let her bir eleman 0 (tedavi atanmamış birimi) veya 1 (tedavi için tayin edilen birim) olduğu tedavi durumları hakkında bir vektör olabilir. Bir JASA makalede, Angrist, Imbens, ve Rubin (1996, 446-47), bu tedavi şekline demek rastgele ise tüm \ mathbf {c} ve \ mathbf {c'} için \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} ; burada \ iota bir tüm elemanları 1'e eşit olan sütun vektörü.ZZiPr(Z=c)=Pr(Z=c)ccιTc=ιTcι

Kelime olarak iddia, tedaviye m atamaları içeren herhangi bir atama vektörü, tedaviye m atamaları içeren diğer herhangi bir vektör kadar muhtemel ise Z_i atamasının Zirastgele olmasıdır .mm

Ancak, potansiyel sonuçların tedavi atamasından bağımsız olmasını sağlamak için, çalışmadaki her bir ünitenin tedaviye eşit atama olasılığına sahip olmasını sağlamak yeterlidir. Ve çoğu tedavi ataması vektörünün sıfır seçilme olasılığı olmasa bile bu kolayca meydana gelebilir . Yani, rasgele olmayan görev altında bile ortaya çıkabilir.

İşte bir örnek. Tam olarak ikisinin tedavi edildiği dört üniteyle bir deney yapmak istiyoruz. Altı olası atama vektörü vardır:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

burada her sayıdaki ilk hane birinci birimin tedavi edilip edilmediğini, ikinci hane ikinci birimin tedavi edilip edilmediğini gösterir.

Varsayalım ki, 3 ve 4 nolu vektörlerin atama olasılığını hariç tuttuğumuz, fakat diğer vektörlerin her birinin eşit (% 25) seçilme şansına sahip olduğu bir deney gerçekleştiriyoruz. Bu şema AIR anlamında rastgele atama değildir. Ancak beklentide, ortalama tedavi etkisinin tarafsız bir tahminine yol açar. Ve bu bir kaza değil. Deneklere tedaviye eşit şekilde atama olasılığı veren herhangi bir atama şeması, ATE'nin tarafsız tahminine izin verecektir.

Öyleyse: AIR anlamında neden rastgele atamaya ihtiyacımız var? Argümanım, randomizasyon çıkarımından kaynaklanıyor; bunun yerine model tabanlı çıkarım açısından düşünülürse, AIR tanımı daha savunulabilir görünüyor mu?


3
Angrist ve ark.nı okumadım, bu yüzden belki bir şeyleri kaçırıyorum, ama cümlelerinizle bir tartışmam var. Tedavinin potansiyel sonuçlardan bağımsız olmasını sağlamak için rastgele atama kullanmayız. Tedavinin gerçek bir deneyde sonuçlardan bağımsız olup olmadığı, tedavi ve sonuç ile doğrudan bir nedensel bağlantı olup olmadığına bağlıdır. Daha ziyade, rastgele atama, tedavinin gizlenen değişkenlerden (veya potansiyel çelişkilerden) bağımsız olmasını sağlar . Sonucun dışlamayı umduğumuz tedaviden başka bir şeyden kaynaklanması olasılığıdır.
gung - Monica'yı eski durumuna döndürün

1
@gung, bence "potansiyel sonuçlar" ve "sonuçlar" ı karıştırıyorsunuz. Rastgele atamanın tedavinin sonuçlardan (yani gözlemlenen sonuçlardan) bağımsızlığını sağlamadığı doğrudur. Ancak potansiyel sonuçlar gözlemlenen sonuçlarla aynı değildir ve rastgele atama tedavinin potansiyel sonuçlardan bağımsız olmasını sağlar. Bu noktayı genişletmek için orijinal yayını düzenlemeyeceğim; bu beni ana konudan çok uzağa götürürdü. Ancak en.wikipedia.org/wiki/Rubin_causal_model bu noktada yardımcı olabilir.
user697473 22:12

3
"[T] o potansiyel sonuçların tedavi atamasından bağımsız olmasını sağlamak, çalışmadaki her birimin tedaviye eşit şekilde atanma olasılığına sahip olmasını sağlamak yeterlidir." Bu yanlış. Bir çalışmaya erkek ve kadın kaydolduğunuzu varsayalım . Adil bir madeni para çevirin: kafalar varsa, tüm dişileri tedavi grubuna (ve tüm erkekleri kontrol grubuna) atayın; kuyruk varsa, tüm erkekler tedavi grubunda ve tüm kadınlar kontrol grubunda olacaktır. Her denek (tabii ki) tedavi grubuna% 50 atama şansına sahiptir - ancak tedavi cinsiyetle tamamen karıştırılmıştır. xx
whuber

1
@whuber, yorumunuz doğru görünmüyor. Nedenini görmek için, = 1 olduğunu varsayalım . Adamın potansiyel sonuçları Y (1) = 1 ve Y (0) = 0'dır. (Yani, adam tedavi edilirse = 1, değilse 0) potansiyel sonuçlar Y (1) = -1 ve Y (0) = 2'dir. (Belirli potansiyel sonuçlar çok önemli değildir, ancak küçük tamsayılar işleri basitleştirir.) Sonra E [Y (1) | Z] = E [Y (1)] = 0. E [Y (0)] için benzer eşitlikler geçerlidir. Daha genel olarak, atama mekanizmanız cinsiyetle karıştırılmaz ve tarafsız bir ATE tahmini üretecektir. Eğer bir şeyi yanlış anlıyorsam, lütfen bana bildirin. xYm
user697473

3
Elbette, tahmin, durgun bir saatin zamanın tarafsız bir tahminini verdiği anlamda "tarafsız" dır! Aslında, bundan daha kötü: bu rastgele seçim yöntemi, tedaviye atfedilemeyen sonuçlar verir, çünkü onlar da cinsiyete atfedilebilirler. Şaşkınlık budur.
Deneydeki

Yanıtlar:


8

Bu, gung'un yorumunu takip eder. Genel ortalama tedavi etkisi önemli değildir.

Eğer olduğunu varsayalım denek yaşları arasında olduğu yeni diyabet vakaları ve ve üzerinde yeni diyabet hastalarının . Tedaviye yarısı atamak istiyorsunuz. Neden bir bozuk para çevirmeyin ve kafalara, tüm genç hastalara tedavi edin ve kuyruklara, tüm yaşlı hastalara tedavi edin? Her biri100051510003050%tedavi için seçilme şansı, bu nedenle tedavinin ortalama sonucuna önyargısız olmaz, ancak çok fazla bilgi atar. Juvenil diyabet veya daha genç hastaların, tip II veya gestasyonel diyabetli yaşlı hastalardan çok daha iyi veya daha kötü yanıt vermeleri şaşırtıcı değildir. Gözlenen tedavi etkisi tarafsız olabilir, ancak, örneğin, rastgele atama ile gerçekleşecek olandan çok daha büyük bir standart sapmaya sahip olacaktır ve büyük örneğe rağmen çok fazla şey söyleyemeyeceksiniz. Rastgele ödev kullanırsanız, yüksek olasılıkla her yaş grubunda yaklaşık vaka tedavi görür, böylece her yaş grubunda tedavi olmadan tedaviyi karşılaştırabilirsiniz. 500

Rastgele atama kullanmaktan daha iyisini yapabilirsiniz. Tedaviye yanıtı etkileyebileceğini düşündüğünüz bir faktör fark ederseniz, bu özniteliğe sahip konuların rastgele atama ile gerçekleşeceğinden daha eşit şekilde bölünmesini sağlamak isteyebilirsiniz. Rastgele atama, tüm faktörlerle eşzamanlı olarak iyi bir şekilde yapmanıza izin verir, böylece daha sonra birçok olası paterni analiz edebilirsiniz.


Teşekkürler, Douglas. Bu cevap bana mantıklı geliyor. Kayıt için, örneğin veya @ whuber'ın örneğiniz kadar aşırı bir şey aklıma gelmedi. Sadece birkaç tedavi vektörünü göz ardı ettiğimiz durumlar yerine düşünüyordum. (Bir müşterinin "bu kişiye veya ona davranabilirsiniz, ama her ikisine birden değil." Dediği bir vakayı düşünün.) Ama genel noktalarınızın aklımdaki daha hafif vakalar için bile geçerli olduğunu düşünüyorum.
user697473

Sadece birkaç vektörü elimine ederseniz, elde edebileceğiniz bilgi miktarını çok fazla değiştirmezsiniz. Bunu doğru bir şekilde ölçmek dağınık olabilir - muhtemelen çok karamsar olan naif sınırlar vardır.
Douglas Zare

@DouglasZare Aşırı örneğiniz hakkında bir sorum var. Amaç, tedavinin hem genç hem de yaşlı hastalara sahip popülasyon için etkili olup olmadığını bulmak olduğuna inanıyorum. Ardından, yöntem potansiyel sonuç dağılımı elde temsili numune olarak kabul edilemez iki örnek oluşturur tüm insanların tedavi ve potansiyel gider dağılımı almak tüm insanlar kontrol altına almak nerede. Böylece gözlemlenen tedavi FtFc
etkiniz

1

Örneğinizde, 2 ve 5'i de bırakıp kendinizle çelişmeyebilirsiniz. Bir madde düzeyinde, 1 veya 6'yı seçme şansı olduğunda 1 veya 0 olma şansı hala eşittir. Ancak, şimdi 3 ve 4'ü kaldırarak yaptığınız şey daha açık hale geliyor.


Teşekkürler John. Evet haklısın. Kalan vektörleri, her birime tedaviye eşit atama olasılığı verecek şekilde kullandığımız sürece, herhangi bir kombinasyonda istediğimiz kadar tedavi atama vektörünü elimine edebiliriz.
user697473

Söylediklerimi aldığını sanmıyorum. Söylediklerim, tartıştığınız argümanın reklam absürdum davası.
John

Örneğiniz aşırı, ama bununla ilgili saçma bir şey görmüyorum. Konunun geçerli bir gösterimi: rastgele olmayan atama şemaları (sadece 1 ve 6 vektörlerini kullanmak gibi) doğrudan ortalama tedavi etkisinin tarafsız tahminine yol açabilir. Sonuç olarak, tarafsız ATE tahminleri almak için rastgele atamaya ihtiyacımız yoktur. Tabii ki, 2'den 5'e kadar vektörleri ortadan kaldırmanın kötü nedenleri olabilir. (Bkz. Douglas Zare'nin yukarıdaki yorumu .) Bu nedenleri henüz düşünmedim.
user697473

Malısın. Bu yüzden onları yok edemezsin.
John

1

İşte gizlenen veya karıştırıcı değişkenlerden bir diğeri: zaman (veya enstrümantal sürüklenme, örnek depolamanın etkileri, vb.).
Yani randomizasyona karşı argümanlar var (Douglas'ın dediği gibi: randomizasyondan daha iyisini yapabilirsiniz). Örneğin, davalarınızın zaman içinde dengelenmesini istediğinizi önceden biliyorsunuzdur. Tıpkı önceden bildiğiniz gibi, cinsiyet ve yaşın dengeli olmasını istiyorsunuz.

Başka bir deyişle, 6 şemanızdan birini manuel olarak seçmek istiyorsanız, 1100'ün (veya 0011) kesinlikle kötü bir seçim olduğunu söyleyebilirim . İlk attığınız olasılıkların zaman içinde en dengeli olanlar olduğunu unutmayın ... Ve en kötü ikisi, John'un da 2 ve 5'i (protesto etmediğiniz) çözmeyi önerdikten sonra bırakılır.
Başka bir deyişle, şemaları "güzel" olan sezginiz maalesef kötü deneysel tasarıma götürür (IMHO bu oldukça yaygındır; belki sipariş edilen şeyler daha hoş görünür - ve elbette deney sırasında mantıksal dizileri takip etmek daha kolaydır).

Rastgele olmayan şemalarla daha iyisini yapabilirsiniz, ancak çok daha kötüsünü de yapabilirsiniz. IMHO, rastgele olmayan bir şemaya giderseniz, kullandığınız rastgele olmayan şema için fiziksel / kimyasal / biyolojik / tıbbi / ... argümanları verebilmelisiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.