Seyircinin gerçekten istatistiksel bir arka planı yoksa, açıklamayı biraz daha basitleştirmeye çalışacağımı düşünüyorum. İlk olarak, tahtada bir çizgi ile bir koordinat düzlemi çizerdim, şöyle:
y=mx+b
mx+b=y
Bu denklemin basit bir doğrusal regresyon örneği olduğunu söyleyebilirim. Daha sonra, siz (veya bir bilgisayar) bu görüntüde gösterilen gibi, veri noktalarının dağılım grafiğine nasıl böyle bir denklem sığdıracağını açıklarım:
Burada çalıştığımız organizmanın yaşını, ne kadar büyük olduğunu tahmin etmek için kullandığımızı ve elde ettiğimiz (resimde gösterilen) ortaya çıkan doğrusal regresyon denkleminin bir organizmanın ne kadar büyük olduğunu tahmin etmek için kullanılabileceğini söyleyebilirim. yaşını biliyorsak.
mx+b=y
Sonra tekrar bunun basit bir doğrusal regresyon denkleminin bir örneği olduğunu ve aslında daha karmaşık çeşitlerin olduğunu açıklayacağım. Örneğin, lojistik regresyon denilen bir çeşitlilikte , y'lerin sadece 1 veya 0 olmasına izin verilir. Birisinin hastalığı olup olmadığı gibi bir "evet" veya "hayır" cevabı tahmin etmeye çalışıyorsanız, bu tür bir modeli kullanmak isteyebilirsiniz. Başka bir özel çeşitlilik ise , "sayım" veya "olay" verilerini analiz etmek için kullanılan Poisson regresyonu denilen bir şeydir (gerçekten gerekli olmadıkça bunu daha fazla araştırmayacağım).
Daha sonra, doğrusal regresyon, lojistik regresyon ve Poisson regresyonunun gerçekten "genelleştirilmiş doğrusal model" adı verilen daha genel bir yöntemin özel örnekleri olduğunu açıklarım. "Genelleştirilmiş doğrusal modeller" ile ilgili en iyi şey, herhangi bir değer alabilen (bir organizmanın lineer regresyonda ne kadar büyük olduğu gibi), sadece 1 veya 0 (örneğin, lojistik regresyonda hastalık) veya ayrı sayımlar (Poisson regresyonundaki olay sayısı gibi) alın.
Daha sonra bu tür denklemlerde x'lerin (yordayıcılar) istatistikçilere "bağlantı fonksiyonu" dediği bir şey aracılığıyla y'nin (yanıtlar) bağlı olduğunu söyleyebilirim. Bu "link fonksiyonlarını" x'lerin y'lerle doğrusal olmayan bir şekilde ilişkili olmadığı durumlarda kullanıyoruz.
Her neyse, bunlar benim iki sentim! Belki benim önerdiğim açıklama biraz hokey ve aptalca geliyor, ama eğer bu alıştırmanın amacı izleyiciye “özü” yakalamaksa, belki de böyle bir açıklama çok kötü değil. Kavramın sezgisel bir şekilde açıklanması ve "rastgele bileşen", "sistematik bileşen", "bağlantı işlevi", "deterministik", "logit işlevi" gibi kelimeleri atmaktan kaçınmanızın önemli olduğunu düşünüyorum. Tipik bir biyolog ya da doktor gibi, hiçbir istatistiki geçmişi olmayan insanlarla konuşurken, bu kelimeleri duyurken gözleri sırlanacak. Olasılık dağılımının ne olduğunu bilmiyorlar, bir link fonksiyonunu hiç duymamışlar ve "logit" in ne olduğunu bilmiyorlar
İstatistiksel olmayan bir kitleye yaptığınız açıklamada, hangi modelin ne zaman kullanılacağına da odaklanacağım. Denklemin sol tarafına kaç tahmin edicinin dahil edilmesine izin verileceğinden bahsedebilirim (örnek boyutunuzdan bölündüğünüz gibi başparmak kurallarını duydum). Ayrıca, verileri içeren bir örnek tablo eklemek ve kitleye bir model oluşturmak için istatistiksel bir yazılım paketinin nasıl kullanılacağını açıklamak da iyi olur. Daha sonra bu modelin çıktısını adım adım izler ve tüm farklı harf ve rakamların ne anlama geldiğini açıklamaya çalışırdım. Biyologlar bu konuda clueless ve SPSS GUI'nin arkasındaki matematiği anlamaktan ziyade hangi testin kullanılacağını öğrenmekle daha çok ilgileniyorlar!
Özellikle herhangi biri hataları açıklamak veya açıklamak için daha iyi bir yol düşünüyorsa, önerilen açıklamamla ilgili herhangi bir yorum veya öneriyi takdir ediyorum!