Yanıtlar:
Bağımlı değişkeniniz olarak ikili değişkene sahip olmak ve bağımlı değişkeniniz olarak bir orana sahip olmak arasında bir fark vardır.
İkili bağımlı değişken :
Bağımlı değişken olarak oran :
Farklı gruplardaki yanıtların% 0 veya% 100'e ne kadar yakın olduğuna bağlıdır. Çok fazla aşırı değer varsa (yani% 0 veya% 100'e yığılmış birçok değer) bu zor olacaktır. (Eğer "paydaları", yani yüzdelerin hesaplandığı konuların sayısını bilmiyorsanız, olasılık tablosu yaklaşımlarını yine de kullanamazsınız.) Grup içindeki değerler daha makulse, tepki değişkeni (örneğin klasik arsin-kare-kök veya belki logit dönüşümü). Dönüştürülen verilerinizin ANOVA'nın varsayımlarını yeterli derecede karşılayıp karşılamadığına karar vermek için çeşitli grafiksel (tercih edilen) ve sıfır hipotez testi (daha az tercih edilen) yaklaşımlar vardır (varyans ve normallik homojenliği, birincisi ikincisinden daha önemlidir). Grafiksel testler: kutu grafikleri (varyans homojenliği) ve QQ grafikleri (normallik) [sonuncusu gruplar içinde veya artıklarda yapılmalıdır]. Sıfır hipotez testleri: örn. Bartlett veya Fligner testi (varyans homojenliği), Shapiro-Wilk, Jarque-Bera, vb.
Yanıt verisinin 0/1 (duman değil, duman) olması için ham verilere sahip olmanız gerekir. Sonra ikili lojistik regresyon kullanabilirsiniz. BMI'yı aralıklarla gruplamak doğru değildir. Kesim noktaları doğru değil, muhtemelen mevcut değil ve BMI'nın sigara ile ilişkili olup olmadığını resmi olarak test etmiyorsunuz. Şu anda atılan bilgilerin çoğunun BMI'nın sigara içimi ile ilişkili olup olmadığını test ediyorsunuz. Özellikle dış BMI aralıklarının oldukça heterojen olduğunu göreceksiniz.
Orantılı veriler üzerinde sıradan bir ANOVA yapmayı seçerseniz, homojen hata varyanslarının varsayımını doğrulamak çok önemlidir. Eğer (yüzde verilerinde olduğu gibi), hata varyansları sabit değilse, modeldeki bu hetero-esnekliği açıklayabilen beta regresyonunu denemek için daha gerçekçi bir alternatiftir. Aşağıda, bir yüzde veya oran olan bir yanıt değişkeni ile başa çıkmanın çeşitli alternatif yollarını tartışan bir makale bulunmaktadır: http://www.ime.usp.br/~sferrari/beta.pdf
R kullanırsanız, betareg paketi faydalı olabilir.