Negatif olmayan sıfır şişirilmiş sürekli veriler nasıl modellenir?


16

Şu anda family = gaussiansıfırdan daha düşük değerler alamaz, sıfır şişirilmiş ve sürekli bir biyolojik çeşitlilik göstergesine doğrusal bir model ( ) uygulamak çalışıyorum . Değerler 0 ile 0,25 arasında değişir. Sonuç olarak, modelin kalıntılarında kurtulmayı başaramadığım oldukça açık bir desen var: resim açıklamasını buraya girin

Bunu çözmek için herhangi bir fikri olan var mı?


1
CV'ye hoş geldiniz! Kullanıcı adınızın, kimliğinizin ve kullanıcı sayfanızın bağlantısının yaptığınız her gönderiye otomatik olarak eklendiğini unutmayın, bu nedenle yayınlarınızı imzalamanıza gerek yoktur. Aslında, yapmamayı tercih ediyoruz.
Silverfish

3
Sıfır şişirilmişse sürekli olamaz, çünkü sürekli değişkenlerin cdf'de herhangi bir sıçrama olamaz (ve açıkça 0'da bir tane vardır). 0'ların dışında sürekli olabilir.
Glen_b-Monica

Yanıtlar:


32

Sıfır şişirilmiş (yarı) sürekli dağılımlar için çeşitli çözümler vardır:

  • Tobit regresyonu : verinin temeldeki tek bir Normal dağılımdan geldiğini, ancak negatif değerlerin sansürlendiğini ve sıfır olarak istiflendiğini varsayar (örn. CensReg paketi )
  • engel veya "iki aşamalı" model: değerlerin 0 veya> 0 olup olmadığını tahmin etmek için bir binom modeli kullanın, ardından gözlenen sıfır olmayan değerleri modellemek için doğrusal bir model (veya Gama veya kesik Normal veya log-Normal) kullanın
  • 1<p<2x>0

Veya veri yapınız yeterince basitse, çıkarımınızın verilerin ilginç dağılımı ile karıştırılmamasını sağlamak için sadece doğrusal modeller kullanabilir ve permütasyon testleri veya başka bir sağlam yaklaşım kullanabilirsiniz.

Bu vakaların çoğu için R paketleri / çözümleri mevcuttur.

SE'de sıfır şişirilmiş (yarı) sürekli veriler (örneğin burada , burada ve burada ) hakkında başka sorular da var , ancak net bir genel cevap sunmuyorlar ...

Ayrıca bkz. Min & Agresti, 2002, Sıfırdan Topaklanma ile Negatif Olmayan Verileri Modelleme: Genel bakış için.


@Ben Bolker "Tahmini veya gerçek sıfır olmayan değerleri modellemek için" doğrusal bir model (veya Gama veya kesik Normal veya log-Normal) kullanır mısınız?
rolando2
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.