Aşırı dağıtılmış sayım verileri için Poisson regresyonuna alternatifler seçme


12

Şu anda aşağıdaki ölçütleri kullanan bir dizi davranışsal deneyden veri analiz ediyorum. Bu deneydeki katılımcılardan, diğer insanların bir dizi 10 anagramı çözmek için kullanabileceği ipuçlarını seçmeleri istenir. Katılımcılar, bu diğer insanların anagramları çözmedeki performanslarına bağlı olarak ya kazanacak ya da kaybedeceklerine inanmaya yönlendirilir. İpuçları ne kadar yardımcı olduklarına göre değişir. Örneğin, NUNGRIN anagramı için, ÇALIŞAN bir anagram için üç ipucu olabilir:

  1. Hızlı hareket etme (yararsız)
  2. Bir maraton yarışında ne yaparsınız (yardımcı)
  3. Her zaman sağlıklı bir hobi değil (yararsızdır)

Önlemi oluşturmak için, bir katılımcının diğer kişi için yararsız bir ipucu seçme sayısını (10 üzerinden) sayıyorum. Deneylerde, insanların seçtiği ipuçlarının yardımseverliğini etkilemek için çeşitli farklı manipülasyonlar kullanıyorum.

Yardımseverlik / yararsızlık ölçüsü oldukça güçlü bir şekilde çarpık olduğundan (insanların büyük bir kısmı her zaman en yararlı 10 ipucunu seçer) ve önlem bir sayı değişkeni olduğundan, bu verileri analiz etmek için Poisson Genelleştirilmiş Doğrusal Model kullanıyorum. Bununla birlikte, Poisson regresyonu hakkında daha fazla okuma yaptığımda, Poisson regresyonunun bir dağılımın ortalamasını ve varyansını bağımsız olarak tahmin etmediği için, genellikle bir veri setindeki varyansı küçümsediğini keşfettim. Quasipoisson regresyonu veya negatif binomiyal regresyon gibi Poisson regresyonuna alternatifleri araştırmaya başladım. Ancak, bu tür modellerde oldukça yeni olduğumu itiraf ediyorum, bu yüzden buraya tavsiye için geliyorum.

Bu tür veriler için hangi modelin kullanılacağına dair önerisi olan var mı? Dikkat etmem gereken başka noktalar var mı (örneğin, belirli bir model diğerinden daha güçlü mü?)? Seçtiğim modelin verilerimi uygun şekilde işleyip işlemediğini belirlemek için ne tür tanılamalara bakmalıyım?


Varyansın ortalamaya eşit olduğu varsayımını gevşetmek için sağlam bir varyans / kovaryans tahmincisi ne olacak?
boscovich

2
Sayım verileri ve negatif olmadıkları için, dağılmayı sağlayan quassi-poisson veya negatif binomiyal regresyon modeli ne olacak?
Arun

1
Bir yarı-poisson veya negatif binom modeli kullanmayı düşündüm, ancak anlamadığım şey, verilerimi uygun bir şekilde modellediğimi garanti etmek için ne tür bir köşegenliğe bakacağım. Birkaç alternatif olduğu için (yarı-poisson, negatif binom ve "sıfır artırılmış" modeller), bu alternatifler arasında seçim yapmanın iyi bir yolu olup olmadığını merak ediyorum. Örneğin, bir yöntem genellikle diğerlerinden daha güçlü mü?
Patrick S. Forscher

1
Bu verilere bağlıdır. Neden hepsini verilerinize uymuyor (Poisson, Negatif binom, sıfır şişirilmiş Poisson ve negatif binom, söz konusu olanlar için engel modelleri) ve bunları AIC veya BIC ile karşılaştırmayın? Bkz. Cran.r-project.org/web/packages/pscl/vignettes/countreg.pdf Ardından verileriniz için en uygun olanı seçin. Yarı olabilirlik modelleri de kullanabilirsiniz, ancak bu bir zevk meselesi, onları çok sevmiyorum.
Momo

1
Yanıtınız için hangi dağıtımın iyi bir model olabileceğini kontrol etmek için vcd :: distplot işlevini kullanabilirsiniz.
Momo

Yanıtlar:


12

Sonucunuz, binom rastgele bir değişken olan 10 üzerinden yararlı ipucu sayısıdır. Bu yüzden, bir tür binom regresyonu ile analiz etmelisiniz, muhtemelen aşırı dağılmaya izin vermek için yarı binomiyal. Poisson ve yanıltıcı olarak adlandırılan negatif binom dağılımlarının sınırsız sayım verileri için uygun olduğunu unutmayın.


2
Negatif binomdan bahsettim, çünkü postanın başlangıçta önerdiği Poisson'a aşırı dağılmış bir alternatif. Her katılımcının x / 10 ipucu içerdiğinden, binom olabilir, ancak 10 ipucunun her biri için i yanıtlayan için sabit bir olasılık pi vardır ve oluşumlar bağımsızdır. Durum böyle olabilir.
Michael R.Chernick

2
beta-binomial başka bir olasılıktır (beta-binomial negatiftir, binomial ise Poisson'a aittir). betabiniçinde aodpaketin yapacak.
Ben Bolker

5

Ben de olası sonuçlar Poisson gibi sonsuz olsaydı negatif binomiye bakmanızı tavsiye ederim. Joe Hilbe'nin kitaplarından birine danışmak isteyebilirsiniz. Biri GEE'de ve diğeri Poisson regresyonu ile tezat oluşturduğu negatif binomiyal regresyon üzerinde. Ancak Aniko'nun işaret ettiği gibi, sadece 10 ipucu vardır, bu nedenle her katılımcı sadece 0, 1, 2, 3, ..., 10'a sahip olabilir ve bu nedenle ne Poisson ne de negatif üstel uygundur.


4

@Aniko tarafından iyi bir nokta. Başka bir seçenek Beta regresyonudur. Bu yöntem hakkında çok fazla bilgi veren "A Better Lemon Squeezer" başlıklı bir makale vardı .


2
Ancak beta, sonlu bir tamsayılar kümesinde sayı değişkenini değil, bir oranı modellemek için kullanılır.
Michael R.Chernick

Daha geniş kullanım alanları vardır, @MichaelChernick, oldukça iyi olan makaleye bakın.
Peter Flom - Monica'yı eski durumuna döndürün

@PeterFlom Ayrıca yalnızca [0,1] aralığında (0,1) veri işleyemez.
colin
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.