İkili veriler için gösterge değişkeni: {-1,1} vs {0,1}


10

Bir ikili tedavi atama göstergesi ile deneyler / randomize kontrollü çalışmalar bağlamında tedavi-değişken etkileşimleriyle ilgileniyorum .T

Spesifik yönteme / kaynağa bağlı olarak, tedavi edilen ve tedavi edilmeyen denekler için sırasıyla ve gördüm .T = { 1 , - 1 }T={1,0}T={1,-1}

Kullanmak için başparmak herhangi bir kural var mı ya ?{ 1 , - 1 }{1,0}{1,-1}

Yorum ne şekilde farklıdır?


FWIW ... Bu ilk bağlantı, farklı kodlama şemaları hakkında oldukça kapsamlı bir genel bakış sağlar ... ats.ucla.edu/stat/r/library/contrast_coding.htm Bu ikinci bağlantı, gösterge (kukla), efekt ve dikey (kontrast) kodlamayı tartışır ... faculty.cas.usf.edu/mbrannick/regression/anova1.html
Mike Hunter

Yanıtlar:


10

Hem gösterge değişkeninin tahmin edicisinin hem de kesişim noktasının yorumlanması farklıdır. ile başlayalım :{1,0}

Aşağıdaki modele sahip olduğunuzu varsayalım

yben=β0+trebirtmentβ1

nerede

trebirtment={0plasebo ise1eğer ilaç

Bu durumda, için aşağıdaki formüller elde :yben

yben={β0+0β1=β0plasebo iseβ0+1β1=β0+β1eğer ilaç

Dolayısıyla, yorumlanması plasebo etkisi ve yorumu , plasebo etkisi ile ilacın etkisi arasındaki farktır. Aslında, ilacın sunduğu iyileştirme olarak yorumlayabilirsiniz .β 1 β 1β0β1β1


Şimdi 'a bakalım :{-1,1}

Daha sonra aşağıdaki modele sahipsiniz (tekrar):

yben=β0+trebirtmentβ1

ama nerede

trebirtment={-1plasebo ise1eğer ilaç

Bu durumda, için aşağıdaki formüller elde :yben

yben={β0+-1β1=β0-β1plasebo iseβ0+1β1=β0+β1eğer ilaç

Buradaki yorum, plasebo etkisi ve ilacın etkisi ortalamasıdır ve , iki tedavinin bu ortalamaya farkıdır.β 1β0β1


Peki hangisini kullanıyorsun?

Yorumlanması içinde temelde bir temel olduğunu. Bazı standart tedaviler belirlersiniz ve diğer tüm tedaviler (çoklu olabilir) bu standart / taban çizgisi ile karşılaştırılır. Özellikle başka değişkenler eklemeye başladığınızda, bu standart tıbbi soru ile ilgili yorumlanması kolay olmaya devam eder: bu ilaçlar plasebo veya yerleşik ilaçla nasıl karşılaştırılır? { 0 , 1 }β0{0,1}

Ama sonuçta her şey yukarıda açıkladığım bir yorum meselesidir. Bu nedenle, hipotezlerinizi değerlendirmeli ve sonuçların çizilmesini en kolay hale getiren hangi yorumun olduğunu kontrol etmelisiniz.


6
-1, 1 kodlaması kullanıldığında sabit, tedavi edilen gruptaki katılımcıların sayısının kontrol grubundaki katılımcıların sayısı ile aynı olduğu anlamına gelir.
Maarten Buis

Bu ortalamasıdır @MaartenBuis tasarım dengeli olduğu IFF, ama aksi takdirde hala ne anlama geldiğini ise iki grup araçlarının, ortalamasıdır. Bunu yansıtmak için ifadeyi değiştirdim. y
JAD

9
Faydalı. Her zaman en az iki nedenden ötürü kukla yerine (orijinal sorudaki gibi!) Sözcük göstergesinin kullanımını teşvik etmeye çalışıyorum . İlk olarak, "cinsiyet kukla" gibi terimler, daha az teknik insanlar tarafından aşağılayıcı veya saldırgan olarak çılgınca yorumlandığından, sunumların çok kötü gittiği çok fazla hikaye duydum. İkincisi, kukla terimi , tüm cihazı biraz geçiştirmek veya dodge gibi gösterirken, mükemmel temiz ve zarif bir yöntemdir. Bazı alanlarda yerleşik uygulamaları değiştirme şansım yok, ama burada deniyorum.
Nick Cox

Kabul etti, daha profesyonel geliyor. Ayrıca, aslında ne yaptığının daha iyi bir açıklamasıdır.
JAD

2
Kabul ettiğine sevindim. İşte açıklamanın basit bir yolu: buna gösterge denir çünkü gösterir!
Nick Cox

6

Doğrusal regresyon bağlamında, ikili değişkenleri kodlamak için daha doğal (ve standart) bir yöntemdir (regresyonun sağ tarafının sol tarafına yerleştirilip yerleştirilmeyeceği). @Jarko Dubbeldam'ın açıkladığı gibi, elbette diğer yorumu da kullanabilirsiniz ve katsayıların anlamı farklı olacaktır.xben{0,1}

Başka bir örnek vermek gerekirse, çıktı değişkenlerini kodlamak , temel destek vektör makinelerini programlarken veya türetirken standarttır . (Kütüphaneleri çağırırken, verileri kütüphanenin beklediği formatta, yani 0, 1 formülasyonu olarak aktarmak istersiniz.)yben{-1,1}

Yaptığınız / kullandığınız her şey için standart olan gösterimi kullanmaya çalışın.


Kesişim terimi olan her türlü doğrusal model için iki yöntem, basit bir doğrusal dönüşümle ilişkili olmaları anlamında eşdeğer olacaktır. Matematiksel olarak, veri matrisi veya veri matrisi ˜ X = X A kullanmanız önemli değildir, burada A tam düzeydedir. Genelleştirilmiş lineer model olarak, tahmin edilen katsayıları her iki durumda da doğrusal dönüşüm ile ilgili olacaktır A ve edilen değeri Y aynı olacaktır.XX~=Xbirbirbiry^


+1, in kullanıldığı bir ayar düşünemedim . {-1,1}
JAD

AdaBoost, kullanan bir başka örnektiryben{-1,1}
Francis

5
Genel olarak, in ağırlıklı olarak sınıflandırmada kullanıldığını söyleyebilirsiniz , çünkü işaret fonksiyonunun uygulanmasını sınıflandırmak için uygulanabilir bir yol haline getirir. {-1,1}
JAD

@matthewgunn Yazar ortak değişkenlerden bahsediyor, yani girdiler çıktılardan değil. {-1, 1}, çıkış için destek vektörleri için anlamlıdır, ancak giriş için önemli değildir. Buraya bakın: en.wikipedia.org/wiki/Support_vector_machine#Linear_SVM
Francisco Arceo

@FranciscoArceo Alınan nokta; Daha kesin olmak için düzenledim.
Matthew Gunn

2

Bu daha soyut (ve belki de işe yaramaz), ancak bu iki temsilin matematiksel anlamda aslında grup temsilleri olduğunu ve aralarında bir izomorfizm olduğunu not edeceğim.

TT1T2T1T2Z21,01,-1birb=1-(bir+b)birb=birbφ(bir)=2*bir-1

pTTT'p'p=pp'+(1-p)(1-p')t(p)=2p-1tt'=tt't


Bu etkileyici, ancak {-1, 1} ve {0, 1} arasındaki herhangi bir geçerli yazışmanın bire bir olması gerektiğini belirtmek için yeterli buluyorum: lise matematiğinin ötesinde bir şey çağırmaya gerek yok. Mutlaka aynı bilgilerden bahsediyoruz, sadece farklı kodlanmış.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.