Sıfır şişirilmiş gama modellerinin doğru kullanımı ve yorumlanması


11

Arka plan: Ben şu anda hücresel ekspresyon oranları veri kümesi ile güreşen bir biyoistatistim. Çalışma , çeşitli donörlerden gruplar halinde toplanan bir dizi hücreyi belirli peptitlere maruz bıraktı . Hücreler ya yanıt olarak belirli biyobelirteçleri ifade eder ya da söylemezler. Yanıt oranları daha sonra her donör grubu için kaydedilir. Yanıt oranları (yüzde olarak ifade edilir) ilgilenilenin sonucudur ve peptit maruziyeti belirleyicidir.

Gözlemlerin bağışçılar içinde kümelendiğini unutmayın.

Yalnızca özet verilerim olduğu için, donör olarak yanıt oranlarını sürekli veri (en azından şimdilik) olarak görüyorum.

Komplikasyon, verilerimde çok fazla sıfır olması gerçeğinden kaynaklanıyor. Göz ardı edilemeyecek kadar çok. Ben sürekli sıfır veri ile birlikte sıfırın aşırı bolluğu çarpık gerçeği ile başa çıkmak için sıfır şişirilmiş bir gama modeli düşünüyorum. Ayrıca Tobit modelini de düşündüm, ancak gerçek sıfırların aksine (ekonometrisyenler ayrımın tartışmalı olduğunu söyleyebilir) daha düşük bir sınırda sansürleme varsaydığı için bu daha düşük görünüyor.

Soru: Genel olarak, sıfır şişirilmiş gama modeli kullanmak ne zaman uygundur? Yani varsayımlar nelerdir? Ve insan çıkarımlarını nasıl yorumlar? Varsa, bu konuyu tartışan makalelere bağlantılar için minnettar olurum.

Dale McLerran'ın sıfır şişirilmiş bir gama modeli için NLMIXED kodu sağladığı SAS- L'de bir bağlantı buldum , bu yüzden mümkün görünüyor. Yine de körü körüne suçlamaktan nefret ederim.

Yanıtlar:


5

İlk olarak, ifade verilerinde orijinal sıfırlar görmüyorsunuz. Biyologunuz, tüm biyologların yaptığı gibi diyor, ancak bir biyolog "sıfır" dediğinde aslında "tespit eşiğimin altında, yani mevcut değil" anlamına geliyor. Bu, alanda matematiksel karmaşıklığın olmaması nedeniyle bir dil sorunudur. Burada kişisel deneyimlerimden söz ediyorum.

Sağladığınız bağlantıdaki sıfır şişirilmiş Gama'nın açıklaması mükemmel. Verilerinize götüren fiziksel süreç, anlarsam, bir donör seçilir, daha sonra belirli bir peptit ile tedavi edilir ve yanıt, donörün hücrelerinden ölçülür. Burada birkaç katman var. Birincisi, ölçülen her bir hücrenin ekspresyon seviyesine beslenen donörün tepkisinin toplam gücüdür. Bernoulli değişkeninizi sıfır şişirilmiş Gamma'da "donörün tepkisi ölçülebilecek kadar güçlü" olarak yorumlarsanız, o zaman iyi olabilir. Bu durumda, tek tek hücrenin ifadesinin gürültüsünü güçlü yanıt veren donörler arasındaki varyasyonla topladığınızı unutmayın. Tek bir hücredeki ekspresyondaki gürültü kabaca gama yayıldığı için,

Bağışçılara karşı hücrelerden gelen ek varyasyon Gamma uyumunuzu bozmuyorsa ve sadece uygulanan peptide karşı ifade almaya çalışıyorsanız, bunun neden iyi olmaması gerektiğine dair bir neden yoktur.

Daha ayrıntılı analizler isteniyorsa, ölçümlerinize yol açan süreçle eşleştirmek için özel bir hiyerarşik model oluşturmanızı öneririm.


3

Oldukça zarif bulduğum bir çözüm buldum. Literatürde , ilişkili veriler için sıfır şişirilmiş lognormal model gösteren "Tekrarlanan ölçüm verilerinin sıfırda topaklanma ile analizi" başlıklı mükemmel bir makale bulunmaktadır . Yazarlar PROC NLMIXED tabanlı ve uygulaması oldukça kolay bir SAS makrosu sağlar. İyi haber şu ki, bu durum makrodaki repeatedifadenin ihmal edilmesiyle kümelenmiş gözlemler olmadan vakaları basitleştirebiliyor . Kötü haber şu ki NLMIXED, otoregresif gibi sıklıkla ihtiyaç duyduğumuz pek çok korelasyon yapısına sahip değil.

Makro MIXCORR olarak adlandırılır ve burada bulabileceğiniz çok kullanışlı bir Wiki sayfası vardır . Makro kendisi indirilebilir burada .

Tüm bu bağlantıları tavsiye ederim. Umarım faydalı bulursunuz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.