Bu mesele her zaman çirkin kafasını ortaya çıkarıyor gibi görünüyor ve kendi istatistik anlayışımla (ve akıl sağlığımla!) Başa çıkmaya çalışıyorum.
Genel doğrusal modellerin (t-testi, ANOVA, regresyon vb.) Varsayımları “normalliğin varsayımını” içerir, ancak bunun nadiren açıkça tanımlandığını buldum.
Sık sık, “normalliğin varsayımının” her grup için geçerli olduğunu belirten istatistik kitaplarına / el kitaplarına / vb . Rastladım. Her bir grubun normallikten ayrılmalarını incelemeliyiz .
Sorular :
varsayımlar Y veya Y kalıntıları değerlerini ifade ediyor mu?
Belirli bir grup için , Y değerleri artıklarının yaklaşık olarak (veya en azından normal olarak) yaklaşık olarak normal olmayan bir Y değer dağılımına (örneğin eğriltilmiş) sahip olmak mümkün mü?
Diğer kaynaklar, varsayımın modelin kalıntılarıyla ilgili olduğunu (grupların olduğu durumlarda, örneğin t-testleri / ANOVA) ve bu kalıntıların normalliğinin ayrıldığını incelemeliyiz (yani, sadece bir QQ arsa / testi) koşmak).
için artıkların normalliği gelmez modelinin ait artıkların normalliği ima gruplar ? Başka bir deyişle, model artıklarını incelememiz gerekir mi (birçok metindeki talimatların aksine)?
Bunu bir bağlama koymak için, bu varsayımsal örneği düşünün:
- İki popülasyon (X) arasındaki ağaç yüksekliğini (Y) karşılaştırmak istiyorum.
- Bir popülasyonda, Y dağılımı kuvvetle sağ çarpıktır (yani, çoğu ağaç kısa, çok az boylu), diğeri neredeyse normaldir
- Yükseklik normal dağılıma sahip popülasyonda daha yüksektir ('gerçek' bir fark olabileceğini düşündürmektedir).
- Verilerin dönüşümü, ilk popülasyonun dağılımını önemli ölçüde iyileştirmez.
Öncelikle, kökten farklı yükseklik dağılımları verilen grupları karşılaştırmak geçerli midir?
Burada "normallik varsayımına" nasıl yaklaşırım? Bir popülasyondaki hatırlama yüksekliği normalde dağılmaz. Kalıntıları her iki popülasyon için ayrı ayrı mı inceliyorum yoksa modele ait kalıntıları (t-testi)?
Lütfen cevaplardaki sayılara göre sorulara bakın, deneyim bana insanların kolayca kaybolduklarını ya da kırıldıklarını gösterdi (özellikle ben!). Unutma, istatistikçi değilim; Yine de istatistiklerle ilgili makul bir kavramsal (yani teknik değil!) anlayışa sahibim .
PS, arşivleri araştırdım ve anlayışımı geliştirmeyen aşağıdaki konuları okudum:
- ANOVA varsayım normalliği / artıkların normal dağılımı
- Artıkların normalliği ve örnek veriler; Peki ya t testleri?
- Normallik testi 'esasen işe yaramaz mı'?
- Test normalliği
- Dağılım normalliğini değerlendirme
- Artıkların normal dağıldığını doğrulamak için hangi testleri kullanırım?
- Kolmogorov-Smirnov testi parametrik test artıkları için önemliyken ne yapmalı, çarpıklık ve kurtosis normal görünüyorsa ne yapmalı?