Basit olması gerektiğini düşündüğüm bir sorunum var ama bunu tam olarak anlayamıyorum. Tohum tozlaşmasına bakıyorum, kümelerde çiçek açan bitkilerim (n = 36) var, her bitkiden 3 çiçek kümesi ve her kümeden 6 tohum kapsülü (her bitkiden toplam 18 tohum kapsülü) var. Bir bakla, 0 ila en fazla 4 tohum tozlaşabilir. Böylece, veriler üst sınır ile sayılır. Tohumların ortalama ~% 10'unun tozlaştığını görüyorum, ancak belirli bir tesiste% 1-30 arasında herhangi bir yerde, bu yüzden dağınık veriler üzerinde ve tabii ki, 3 tesiste 4 eksik küme kopyası var, bu yüzden mükemmel simetrik değil .
Sorduğum soru, bu verilerin bu bitkinin tohum seti için tozlaştırıcılar gerektirdiği fikrini destekleyip desteklemediğidir.
Bir bakladaki tohum sayısının dağılımının, 0'dan daha fazla tozlaşmış tohum kapsülü (16'dan 6-9 bakla) ve daha fazla 3 ve 4 tozlaştırılmış tohum baklası (her biri için 2-4) gibi göründüğünü görüyorum. popülasyondaki tohumlar rasgele tozlaşırsa beklenmelidir. Temel olarak, bu sıfır şişirilmiş veri için klasik bir örnek olduğunu düşünüyorum, ilk önce bir böcek ya çiçek hiç ziyaret etmez ya da ziyaret etmez (bir sıfır jeneratör) ve eğer öyleyse, başka bir dağıtımda tohumların 0-4'ünü tozlaştırır. Alternatif hipotez, bitkinin kısmen selfing olmasıdır ve daha sonra her tohumun aynı tozlaşma olasılığına sahip olması beklenir (bu veriler kabaca 0.1 şansı gösterir, bu da aynı bölmedeki iki tohum için 0.01 şans anlamına gelir) .
Ama sadece veriyi bir ZIP veya ZINB yapmak değil, bir veya diğer dağıtım için en uygun veri göstermek istiyorum. Hangi yöntemi kullanırsam kullanın, tozlaşmış tohumların gerçek sayısını ve her bir bitkiden örneklenen bakla sayısını dikkate alması gerektiğini düşünüyorum. Geldiğim en iyi şey, belirli bir bitki için tozlaşan tohumların sayısını rastgele örneklediğim tohum baklalarının sayısına atadığım, 10.000 kez yaptığım ve ne kadar olası olduğunu görebildiğim bir çeşit çizme kayışı işi yapmak. verilen bitki için deneysel veriler bu rastgele dağılımdan çıktı.
Sadece bu konuda kaba kuvvet önyüklemesinden çok daha kolay olması gereken bir şey olduğunu hissediyorum, ama günlerce düşündükten ve aradıktan sonra pes ediyorum. Sadece bir Poisson dağılımı ile kıyaslayamıyorum çünkü üst sınır, binom değil çünkü beklenen dağılımı bir şekilde üretmem gerekiyor. Düşüncesi olan var mı? Ve ben orada R tavsiye kullanıyorum (özellikle en zarif şekilde her biri en fazla 4 top içerebilen 16 kutuya 10.000 rasgele n dağıtımını nasıl oluşturabileceğiniz) en hoş olurdu.
ADDED 9/07/2012 İlk olarak, tüm ilginiz ve yardımlarınız için hepinize teşekkürler. Cevapları okumak, sorumu biraz yeniden gözden geçirmemi sağladı. Söylediğim şey, tohumların baklalar arasında rastgele tozlaştığına dair bir hipotezim (şu an null olarak düşünüyorum) ve alternatif hipotezim, en az 1 tozlaşmış tohumu olan bir tohum kapsülünün rastgele bir işlemle beklenenden daha fazla tozlaşmış tohumlara sahip olmak. Neden bahsettiğimi göstermek için üç tesisten gerçek veriler verdim. İlk sütun, bir bakladaki tozlaşan tohumların sayısıdır, ikinci sütun, o tohum sayısına sahip baklaların sıklığıdır.
bitki 1 (toplam 3 tohum:% 4 tozlaşma)
num.seeds :: pod.freq
0 :: 16
1 :: 1
2 :: 1
3 :: 0
4 :: 0
bitki 2 (toplam 19 tohum:% 26 tozlaşma)
num.seeds :: pod.freq
0 :: 12
1 :: 1
2 :: 1
3 :: 0
4 :: 4
bitki 3 (toplam 16 tohum:% 22 tozlaşma)
num.seeds :: pod.freq
0 :: 9
1 :: 4
2 :: 3
3 :: 2
4 :: 0
1 numaralı tesiste, 18 kapsülde sadece 3 tohum tozlaştı, bir kapsülün bir tohumu vardı ve bir kapsülün iki tohumu vardı. Podlara rastgele bir tohum ekleme işlemini düşünerek, ilk iki tohumun her biri kendi kapsülüne girer, ancak 3. tohum için, zaten bir tohum bulunan ancak 16 kapsülde 64 nokta olan baklalarda 6 nokta vardır. tohumsuz, bu nedenle burada 2 tohumlu bir kapsülün en yüksek olasılığı 6/64 = 0.094'tür. Bu biraz düşük, ama gerçekten aşırı değil, bu yüzden bu bitkinin ~% 4'lük bir tozlaşma şansı ile tüm tohumlarda rastgele tozlaşma hipotezine uyduğunu söyleyebilirim. Ama bitki 2 bana çok daha aşırı görünüyor, 4 bakla tamamen tozlaştı, ancak hiçbir şey olmadan 12 bakla. Bu dağılımın olasılıklarını doğrudan nasıl hesaplayacağımı tam olarak bilmiyorum (bu nedenle bootstrap fikrim), ancak her tohumun ~% 25'lik bir tozlaşma şansı oldukça düşükse, bu dağılımın rastgele meydana gelme olasılığını tahmin ediyorum. Bitki # 3 Gerçekten hiçbir fikrim yok, bence rastgele bir dağılım için beklenenden daha fazla 0 ve 3'ler var, ancak bağırsak hissim, bu sayıdaki tohum için bu dağılımın bitki # 2'nin dağılımından çok daha fazla olması, ve bu pek olası olmayabilir. Ama belli ki ve tüm bitkiler arasında bilmek istiyorum. Ben rastgele bir dağıtım için beklenenden daha fazla 0 ve 3 olduğunu düşünüyorum ama bağırsak hissi bu tohum sayısı için bu dağılım bitki # 2 dağıtımından çok daha muhtemel olduğunu ve bu olası olmayabilir. Ama belli ki ve tüm bitkiler arasında bilmek istiyorum. Ben rastgele bir dağıtım için beklenenden daha fazla 0 ve 3 olduğunu düşünüyorum ama bağırsak hissi bu tohum sayısı için bu dağılım bitki # 2 dağıtımından çok daha muhtemel olduğunu ve bu olası olmayabilir. Ama belli ki ve tüm bitkiler arasında bilmek istiyorum.
Sonunda “Tozlaşmış tohumların tohum kabuklarındaki dağılımı, bitkilerin kısmen kendi kendine uyumlu olmadığı, ancak tohum setini etkilemek için bir tozlaştırıcının ziyaret edilmesini gerektiren hipoteze uyuyor (veya uymuyor). (istatistiksel test sonuçları). ” Bu gerçekten ileriye dönük bölümümün bir parçası, burada hangi deneylerin yapılacağı hakkında konuşuyorum, bu yüzden bunun bir şey ya da diğeri olması için umutsuz değilim, ancak mümkünse kendim için bilmek istiyorum. Bu verilerle yapmaya çalıştığım şeyi yapamazsam, bunu da bilmek istiyorum!
İlk başta oldukça geniş bir soru sordum, çünkü verilerin ilk başta sıfır şişirilmiş bir modele girip girmeyeceğini göstermek için iyi testler olup olmadığını merak ediyorum. Gördüğüm tüm örnekler şöyle görünüyor: “Bakın, burada çok sayıda sıfır var ve bunun için makul bir açıklama var, bu yüzden sıfır şişirilmiş bir model kullanalım”. Şu anda bu forumda yaptığım şey bu, ancak sayım verileri için Poisson glm kullandığım son bölümümde bir deneyim yaşadım ve danışmanlarımdan biri “Hayır, glm'ler çok karmaşık ve gereksiz, bu veriler bir acil durum tablosuna gidin ”ve ardından bana tüm önemli faktörlerim + etkileşimlerim için üç anlamlı basamağa aynı p değerlerini veren pahalı istatistik paketlerinin oluşturduğu büyük acil durum tablosunun bir veri dökümünü gönderdi !! Bu yüzden istatistikleri açık ve basit tutmaya çalışıyorum, ve şu anda sıfır şişirilmiş bir model için yapabileceğimi hissetmediğim seçimlerimi sağlam bir şekilde savunacak kadar iyi anladığımdan emin olun. Hem quasibinomial (pesudoreplicaiton'dan kurtulmak için tüm bitkiler için) hem de tedavileri karşılaştırmak ve ana deneysel sorularımı cevaplamak için yukarıdaki veriler için karışık bir model kullandım, ya da aynı işi yapacağım, ama ben de yapacağım Bunun ne kadar iyi performans gösterdiğini görmek için bu gece ZINB ile oyna. Bu verilerin ilk başta güçlü bir şekilde kümelendiğini (veya sıfır şişirildiğini) açıkça gösterebilirsem, daha sonra bu durum için iyi bir biyolojik neden sağlarsam, daha sonra bir ZINB çıkarmak için daha iyi ayarlanacağım. sadece birini kuasibinomiyal / karışık bir modelle karşılaştırın ve daha iyi sonuçlar verdiği için tartışın, bunu kullanmalıyım. şu anda sıfır şişirilmiş bir model için yapabileceğimi hissetmiyorum. Hem quasibinomial (pesudoreplicaiton'dan kurtulmak için tüm bitkiler için) hem de tedavileri karşılaştırmak ve ana deneysel sorularımı cevaplamak için yukarıdaki veriler için karışık bir model kullandım, ya da aynı işi yapacağım, ama ben de yapacağım Bunun ne kadar iyi performans gösterdiğini görmek için bu gece ZINB ile oyna. Bu verilerin ilk başta güçlü bir şekilde kümelendiğini (veya sıfır şişirildiğini) açıkça gösterebilirsem, daha sonra bu durum için iyi bir biyolojik neden sağlarsam, daha sonra bir ZINB çıkarmak için daha iyi ayarlanacağım. sadece birini kuasibinomiyal / karışık bir modelle karşılaştırın ve daha iyi sonuçlar verdiği için tartışın, bunu kullanmalıyım. şu anda sıfır şişirilmiş bir model için yapabileceğimi hissetmiyorum. Hem quasibinomial (pesudoreplicaiton'dan kurtulmak için tüm bitkiler için) hem de tedavileri karşılaştırmak ve ana deneysel sorularımı cevaplamak için yukarıdaki veriler için karışık bir model kullandım, ya da aynı işi yapacağım, ama ben de yapacağım Bunun ne kadar iyi performans gösterdiğini görmek için bu gece ZINB ile oyna. Bu verilerin ilk başta güçlü bir şekilde kümelendiğini (veya sıfır şişirildiğini) açıkça gösterebilirsem, daha sonra bu durum için iyi bir biyolojik neden sağlarsam, daha sonra bir ZINB çıkarmak için daha iyi ayarlanacağım. sadece birini kuasibinomiyal / karışık bir modelle karşılaştırın ve daha iyi sonuçlar verdiği için tartışın, bunu kullanmalıyım. Hem quasibinomial (pesudoreplicaiton'dan kurtulmak için tüm bitkiler için) hem de tedavileri karşılaştırmak ve ana deneysel sorularımı cevaplamak için yukarıdaki veriler için karışık bir model kullandım, ya da aynı işi yapacağım, ama ben de yapacağım Bunun ne kadar iyi performans gösterdiğini görmek için bu gece ZINB ile oyna. Bu verilerin ilk başta güçlü bir şekilde kümelendiğini (veya sıfır şişirildiğini) açıkça gösterebilirsem, daha sonra bu durum için iyi bir biyolojik neden sağlarsam, daha sonra bir ZINB çıkarmak için daha iyi ayarlanacağım. sadece birini kuasibinomiyal / karışık bir modelle karşılaştırın ve daha iyi sonuçlar verdiği için tartışın, bunu kullanmalıyım. Hem quasibinomial (pesudoreplicaiton'dan kurtulmak için tüm bitkiler için) hem de tedavileri karşılaştırmak ve ana deneysel sorularımı cevaplamak için yukarıdaki veriler için karışık bir model kullandım, ya da aynı işi yapacağım, ama ben de yapacağım Bunun ne kadar iyi performans gösterdiğini görmek için bu gece ZINB ile oyna. Bu verilerin ilk başta güçlü bir şekilde kümelendiğini (veya sıfır şişirildiğini) açıkça gösterebilirsem, daha sonra bu durum için iyi bir biyolojik neden sağlarsam, daha sonra bir ZINB çıkarmak için daha iyi ayarlanacağım. sadece birini kuasibinomiyal / karışık bir modelle karşılaştırın ve daha iyi sonuçlar verdiği için tartışın, bunu kullanmalıyım.
Ancak birincil sorumdan çok fazla dikkat çekmek istemiyorum, verilerimin rastgele bir dağılımdan beklenenden daha fazla şişirilmiş olup olmadığını nasıl belirleyebilirim? Benim durumumda bunun cevabı benim için gerçekten önemli olan şeydir ve model gerekçelendirmenin bir avantajı olabilir.
Tüm zaman ve yardımlarınız için tekrar teşekkürler!
Şerefe, BWGIA