Arka plan: Ben şu anda hücresel ekspresyon oranları veri kümesi ile güreşen bir biyoistatistim. Çalışma , çeşitli donörlerden gruplar halinde toplanan bir dizi hücreyi belirli peptitlere maruz bıraktı . Hücreler ya yanıt olarak belirli biyobelirteçleri ifade eder ya da söylemezler. Yanıt oranları daha sonra her donör grubu için kaydedilir. Yanıt oranları (yüzde olarak ifade edilir) ilgilenilenin sonucudur ve peptit maruziyeti belirleyicidir.
Gözlemlerin bağışçılar içinde kümelendiğini unutmayın.
Yalnızca özet verilerim olduğu için, donör olarak yanıt oranlarını sürekli veri (en azından şimdilik) olarak görüyorum.
Komplikasyon, verilerimde çok fazla sıfır olması gerçeğinden kaynaklanıyor. Göz ardı edilemeyecek kadar çok. Ben sürekli sıfır veri ile birlikte sıfırın aşırı bolluğu çarpık gerçeği ile başa çıkmak için sıfır şişirilmiş bir gama modeli düşünüyorum. Ayrıca Tobit modelini de düşündüm, ancak gerçek sıfırların aksine (ekonometrisyenler ayrımın tartışmalı olduğunu söyleyebilir) daha düşük bir sınırda sansürleme varsaydığı için bu daha düşük görünüyor.
Soru: Genel olarak, sıfır şişirilmiş gama modeli kullanmak ne zaman uygundur? Yani varsayımlar nelerdir? Ve insan çıkarımlarını nasıl yorumlar? Varsa, bu konuyu tartışan makalelere bağlantılar için minnettar olurum.
Dale McLerran'ın sıfır şişirilmiş bir gama modeli için NLMIXED kodu sağladığı SAS- L'de bir bağlantı buldum , bu yüzden mümkün görünüyor. Yine de körü körüne suçlamaktan nefret ederim.