Yaygın sayım verileri için uygun model nedir?


24

Görünüşe göre dağılmış olan R sayım verilerini modellemeye çalışıyorum (Dağılım Parametresi ~ .40). Bu muhtemelen glm, bir family = poissonveya negatif binomial ( glm.nb) modelinin anlamlı olmamasıdır. Verilerimin tanımlayıcılarına baktığımda, sayım verilerinde tipik bir çarpıklık yok ve iki deney koşulumdaki artıklar da homojen.

Yani benim sorularım:

  1. Sayım verilerim sayım verileri gibi davranmıyorsa sayım verilerim için özel regresyon analizleri kullanmak zorunda mıyım? Bazen normal değillikle karşı karşıya kalıyorum (genellikle kurtoz nedeniyle), ancak normalliksizliği hesaplamak için kesilmiş araçları (Wilcox, 2012) karşılaştırmak için yüzdelik önyükleme yöntemini kullandım. Sayım verileri için yöntemler, Wilcox tarafından önerilen ve WRS paketinde gerçekleştirilen herhangi bir güçlü yöntemle değiştirilebilir mi?

  2. Sayım verileri için regresyon analizleri kullanmak zorunda kalırsam, dağılımın dağılımını nasıl hesaplayabilirim? Poisson ve negatif binom dağılımı, daha yüksek bir dağılım varsaymaktadır, bu yüzden uygun olmamalı, değil mi? Yarı-Poisson dağılımını uygulamayı düşünüyordum , ama bu aşırı dağılma için genellikle tavsiye edilir. Düşük dağıtmanın yanı sıra hesaba katma ihtimalinin de var olduğu gibi görünen beta-binom modelleri hakkında VGAMR paketinde yer alıyorum. .

Herhangi biri, dağıtılmayan veriler için bir prosedür önerebilir ve belki bunun için bazı örnek R kodu sağlayabilir mi?


1
Verilerinizin yaygın olmadığını nasıl biliyorsunuz? Dağılım parametresini nasıl hesaplıyorsunuz?
Hong Ooi

1
İlgilendiğiniz şey hakkında bize daha fazla bilgi vermemize yardımcı olacaktır. Doğrusal tahmin edici nokta tahminleri ve değerlerin tahmini için, dağılma nadiren bir sorundur, ancak testler ve aralıklar gereksiz yere muhafazakar olabilir (yarı aileler bu konuda yardımcı olabilir). Bununla birlikte, "normal" olabilirlik yaklaşımı için COM Poisson ve diğer genelleştirilmiş Poisson modellerine göz atın.
Momo

@ Hung Ooi: Dispersiyonu dispersiyon ile test ettim (Poissonmodel, alternatif = c ("daha az")) ve test anlamlı çıktı.
Sil,

1
@ Momo: İki deneysel koşulda ikili müzakere yaptıkları doğru tekliflerde farklı olup olmadığını test etmek istiyorum. Doğru teklifler, gündemlerin diğer taraf için daha değerli meseleler talep etmek yerine, ekiplerinin çıkarlarına karşılık gelen daha fazla sorun talep ettiği anlamına gelir. İlk olarak, bunun sayım verileri olduğunun farkında bile değildim. Conway-Maxwell-Poisson Dağılımını COM Poisson ile mı demek istiyorsun? Şimdiden çok teşekkürler!
Sil,

3
Ek bilgi için teşekkürler. Evet, Conway-Maxwell Poisson’ı kastettim. Shmueli & co bunun için genelleştirilmiş bir doğrusal model geliştirdi, denemek isterseniz bir de R paketi var.
Momo

Yanıtlar:


9

Dağınık Poisson verilerini kullanmanın en iyi --- ve standart yolları, genelleştirilmiş bir Poisson veya belki bir engel modeli kullanmaktır. Dağınık veri için üç parametre sayımı modeli de kullanılabilir; örneğin Faddy-Smith, Waring, Famoye, Conway-Maxwell ve diğer genelleştirilmiş sayım modelleri. Bunlarla ilgili tek dezavantajı yorumlanabilirliktir. Ancak genel olarak dağıtılmayan veriler için, genelleştirilmiş Poisson kullanılmalıdır. Dağınık veriler için negatif binom gibidir. Bunu, Cambridge University Press'in iki kitabında, Modeling Count Data (2014) ve Negative Binomial Regression, 2. basım, (2011) hakkında detaylı olarak tartışıyorum. R'de VGAM paketi genelleştirilmiş Poisson (GP) regresyonuna izin verir. Dağılım parametresinin negatif değerleri dağılma için ayar yapıldığını gösterir. GP modelini dağıtılmış veriler için de kullanabilirsiniz, fakat genellikle NB modeli daha iyidir. Konuya gelince, yetersiz dağılımın nedenini belirlemek ve bununla başa çıkmak için en uygun modeli seçmek en iyisidir.


Tekrar hoşgeldiniz! Lütfen hesaplarınızı kaydedin ve / veya birleştirin (bunun nasıl yapılacağı ile ilgili bilgileri yardım merkezimizin Hesabım bölümünde bulabilirsiniz ), ardından kendi sorunuzla ilgili düzenleme yapabilir ve yorum yapabilirsiniz. (Orijinal hesabınız burada .)
gung - Reinstate Monica

SPSS'de genelleştirilmiş bir Poisson analizi yapabilir misiniz?
Grace Carroll

3

İnsanların sosyal bir oyun oynayacağı sıklıkla ilgili olan bir zamanlar dağınık bir Poisson ile karşılaştım. Bu, insanların Cuma günleri oynayacağı aşırı düzenlilik nedeniyle ortaya çıktı. Cuma günkü verilerinin kaldırılması, beklenen fazla dağılmış Poisson'ları bana verdi. Belki de verilerinizi benzer şekilde düzenleme seçeneğiniz vardır.


1

Dispersiyonun, her iki cinsiyetten bireylerin saydığı tercih edilen çocuklar için tipik olan sıfır enflasyon ile birleştiği durumlar vardır. Bunu bugüne kadar yakalamanın bir yolunu bulamadım

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.