Fisher'ın Ağırlıklar ile Kesin Testi?


12

Ağırlıkları dikkate alan Fisher's Exact Test'in varyasyonunu bilen var mı? Örneğin, örnekleme ağırlıkları .
Dolayısıyla, her zamanki 2x2 çapraz tablo yerine, her veri noktası noktayı tartan bir "kütle" veya "boyut" değerine sahiptir.

Örnek veriler:

A B weight
N N 1
N N 3
Y N 1
Y N 2
N Y 6
N Y 7
Y Y 1
Y Y 2
Y Y 3
Y Y 4

Fisher's Exact Test daha sonra bu 2x2 çapraz tabloyu kullanır:

A\B  N  Y All
 N   2  2   4
 Y   2  4   6
All  4  6  10

Ağırlığı 'gerçek' veri noktası sayısı olarak alırsak, bunun sonucunda şunlar olur:

A\B  N  Y All
 N   4 13  17
 Y   3 10  13
All  7 23  30

Ancak bu çok yüksek bir güven ile sonuçlanır. N / Y'den N / N'ye değişen bir veri noktası istatistikte çok büyük bir fark yaratacaktır.
Ayrıca, herhangi bir ağırlık kesir içeriyorsa işe yaramaz.

Yanıtlar:


10

'Kesin' testlerin ve örnekleme ağırlıklarının aslında uyumsuz kavramlar olduğundan şüphe duyuyorum. Örnek anketler için iyi tesislere ve kesin testler için makul olanlara sahip olan Stata'da kontrol ettim ve örnek ağırlıkları olan bir çapraz tablo için 8 olası test istatistiği, Fisher gibi 'kesin' testleri içermiyor.

İlgili Stata manuel girişi ( svy: tabulate twoway için ), her durumda varsayılan testinin kullanılmasını önerir. Bu varsayılan yöntem, her zamanki Pearson'un ki kare istatistiğine dayanır. Alıntılamak:

"Anket tasarımını hesaba katmak için istatistik, ikinci dereceden Rao ve Scott (1981, 1984) düzeltmesi kullanılarak tamsayı serbestlik derecelerine sahip olmayan bir F istatistiğine dönüştürülür".

refs:

  • Rao, JNK ve AJ Scott. 1981. Karmaşık örnek araştırmalarından kategorik verilerin analizi: İki yönlü tablolarda uyum iyiliği ve bağımsızlık için ki-kare testleri. Amerikan İstatistik Kurumu 76: 221-230.
  • Rao, JNK ve AJ Scott. 1984. Anket verilerinden hesaplanan hücre oranlarına sahip çok yollu beklenmedik tablolar için ki kare testlerinde. Yıllık İstatistikler 12: 46-60.

3

İlginç soru. Ağırlıkça ne demek istiyorsun?

Bir bootstrap yapmaya eğilimliydim ... en sevdiğiniz istatistiği seçin (yani Fisher's Exact) ve verilerinizde hesaplayın. Sonra boş hipotezinize göre her örneğe yeni hücreler atayın ve işlemi 999 kez tekrarlayın. Bu, sıfır hipotezi altında test istatistiğiniz için oldukça iyi bir ampirik dağılım sağlamalı ve p değerinizin kolayca hesaplanmasına izin vermelidir!


Teşekkürler! Ama hesaplamak için daha hızlı ve daha kararlı bir istatistik umuyordum ...
Michel de Ruiter

2

Örnek ağırlıkları hakkında hızlı bir şey - bunlar genellikle örnekleme yapılan popülasyon hakkında bazı bilgileri birleştirmenin bir yoludur - ancak genellikle "büyük örnek" tipi senaryolara (genellikle kısıtlı BLUP veya kılık değiştirmiş MAVİ tahmin) dayanırlar. Bu yüzden örnek ağırlıkların muhtemelen hiç ağırlıktan daha iyi olmayacağını hayal ediyorum. Daha iyi olacağını düşündüğüm örnek tasarımın doğrudan dayandığı popülasyon hakkındaki bilgileri kullanmaktır.

R1,,RkkR1;11,R1;12,R1;21,R1;22,l=1kRl;ijRl;ijrl;iji,jRl;ij=Rl(l=1,,k)

P(Dm)=1P(Dm)=0eğer örnekte değillerse. Bununla birlikte, genellikle tasarım, gözlemlenmesi muhtemel verilerden daha fazla bilgiye dayanır. ancak önemli olan, anket tasarımı yerine bilgi olduğunu unutmayın. Tasarım temelli çıkarım, tüm bu bilgileri analizinize dahil etmenin oldukça etkili bir yoludur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.