Rastgele kayıp (MAR) 'ı rastgele eksik (MCAR)' dan ayırt etme


13

Bu ikisini birden çok kez açıkladım. Beynimi pişirmeye devam ediyorlar. Rastgele Değil Eksik olmak mantıklıdır ve Rastgele Tamamen Eksik Olmak mantıklıdır ... Rastgele Eksik o kadar da değil.

MAR olan ancak MCAR olmayan verilere neden olan şey nedir?


Sorunuz şu diğer soru tarafından mı yanıtlanıyor ? “Rastgele Kayıp” adının iyi bir nedeni var mı? ve listeledikleri kaynaklar?
Andy W

3
@AndyW Kör olmak, hayır. İsmin neden kusurlu olduğuna dair ilginç bir tartışma ve bir abonelik duvarının arkasında gizlenen bir makale.
Fomite

Yanıtlar:


18

Rastgele (MAR) eksik, eksikliğin tam bilgiye sahip olduğunuz değişkenlerle açıklanabileceği anlamına gelir. Test edilebilir bir varsayım değildir, ancak makul ve değil makul durumlar vardır.

Örneğin, siyasi fikir anketleri alın. Birçok kişi cevap vermeyi reddediyor. İnsanların cevap vermeyi reddetme nedenlerinin tamamen demografik özelliklere dayalı olduğunu varsayarsanız ve her bir kişide bu demografiye sahipseniz, veriler MAR olur. İnsanların cevap vermeyi reddetmesinin bazı nedenlerinin demografik bilgilere dayanabileceği bilinmektedir (örneğin, hem düşük hem de yüksek gelirli insanların ortadaki sorulara cevap vermenin daha az olası olduğu), ancak bunun gerçekten tam açıklamadır.

Böylece, soru "yeterince dolu mu?" Çoğunlukla çoklu impütasyon gibi yöntemler, veriler rastgele değil çok eksik olmadığı sürece diğer yöntemlerden daha iyi çalışır .


5
İstatistiksel Yazılım (çevrimiçi) Dergisi birden ithamlarla ilgili Son karşılaşılan bir sorunu vardı ve ben R için Big Three birden ithamlarla paketleri bakarak oldum: Amelia, mi, ve mice. Benzerlikler ve farklılıklar büyüleyici. ( Amelia's over imputeoldukça ilginç.)
Wayne

1
JSS sorununun bağlantısı: jstatsoft.org/v45
gung -

12

Bunun doğru olup olmadığından emin değilim, ama anlamaya çalıştığım yol, sanki oldukça simetrik olmayan 2x2 olasılık matrisi varmış gibi. Gibi bir şey:

Pattern  /   Data Explains Pattern

            Yes         No

Yes         MAR        MNAR

No          --         MCAR

Yani, bir değişkenin eksikliğine bir örüntü varsa ve açıkladığımız veriler açıklayamazsa MNAR'a sahibiz, ancak elimizdeki veriler (yani veri setimizdeki diğer değişkenler) MAR'yı açıklayabilirse. Eksiklik için bir model yoksa, bu MCAR'dır.

Burada olabilirim. Ayrıca, bu "Desen" ve "Veriler açıklıyor" tanımını da açık bırakır. Ben "Veri açıklar" veri kümenizdeki diğer değişkenler açıklamak anlamı olarak düşünüyorum, ama ben senin prosedürü de açıklayabilir inanıyorum (örneğin başka bir iş parçacığında iyi bir örnek aynı şeyi ölçmek üç ölçüm değişkenleri varsa ve senin prosedür, ilk iki ölçümün çok fazla katılmaması durumunda üçüncü bir ölçüm alırsanız).

Bu sezgi, CV için yeterince doğru mu?


Çok yararlı görselleştirme. Teşekkür ederim!
skeller88

-1

Ben de farkı anlamak için uğraşıyordum, belki bazı örnekler yardımcı olabilir.

MCAR : Tamamen rastgele eksik , bu harika. Bu, yanıt vermemenin tamamen rastgele olduğu anlamına gelir. Yani anketiniz önyargılı değil.

MAR : Rastgele , daha kötü bir durumda eksik . IQ istediğinizi ve erkeklerden çok daha fazla kadın katılımcınız olduğunu düşünün. Sizin için şanslıyız, IQ cinsiyetle ilgili değil, bu yüzden önyargıyı azaltmak için cinsiyeti kontrol edebilirsiniz (ağırlıklandırma uygulayın).

MNAR : Rastgele eksik değil , kötü. Gelir düzeyi için anket yapmayı düşünün. Ve yine, erkek katılımcılardan daha fazla dişiniz var. Bu durumda, bu bir sorundur, çünkü gelir düzeyi cinsiyetle ilgilidir. Bu nedenle sonuçlarınız taraflı olacaktır. Kurtulmak kolay değil.

Gördüğünüz gibi, bu hedef değişken (Y gibi gelir), yardımcı değişken (yaş gibi X) ve tepki davranışı (R, yanıt grubu) arasındaki "üçgen" bir ilişkidir. X sadece R ile ilişkili ise, good-ish (MAR). X ve R ve X ve Y arasında bir ilişki varsa, kötü (MNAR).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.