Bazı durumlarda, teorinin en iyi şekilde çalışabileceği açıktır (farelerin kuyruk uzunlukları muhtemelen normal olarak dağılmıştır).
Kuyruk uzunlukları normalde dağılmaz.
Normal dağılımların sıfır değerlerin negatif değer alma olasılığı vardır; kuyruk uzunlukları yoktur.
George Box'ın ünlü çizgisi , " tüm modeller yanlış, ancak bazıları yararlı " noktasını oldukça iyi hale getiriyor. Makul bir şekilde normallik (sadece yaklaşık normallikten ziyade) iddia edebileceğimiz vakalar gerçekten çok nadirdir, neredeyse efsane yaratıklar, seraplar zaman zaman neredeyse gözün köşesinden dışarı fırlar.
Birçok durumda, muhtemelen bir veri kümesini tanımlamak için hiçbir teori yoktur, bu yüzden başlangıçta açıklamak için geliştirilen şey ne olursa olsun, oldukça iyi olan şeylere uyan bir şey mi kullanıyorsunuz?
İlgilendiğiniz miktarların seçime özellikle duyarlı olmadığı durumlarda (dağıtımın geniş özellikleri bilinenlerle tutarlı olduğu sürece), evet, sadece oldukça iyi uyan bir şey kullanabilirsiniz.
Daha fazla hassasiyetin olduğu durumlarda, 'sadece uygun olanı kullanmak' tek başına yeterli değildir. Belirli varsayımlar yapmayan bazı yaklaşımları kullanabiliriz (belki de permütasyon, önyükleme veya diğer yeniden örnekleme yaklaşımları veya sağlam prosedürler gibi dağıtımsız prosedürler). Alternatif olarak, simülasyon yoluyla dağıtım varsayımına olan duyarlılığı ölçebiliriz (aslında bunun genellikle iyi bir fikir olduğunu düşünüyorum).
Eğer gerçekten bir fikriniz yoksa, belki de sadece ampirik bir dağılım kullanmalısınız.
Soruna dayalı bir çıkarım olarak, ampirik dağılımlara dayalı bir çıkarım olarak kesinlikle birçok soruna uygun bir yasal yaklaşım (permütasyon / randomizasyon ve önyükleme iki örnektir) tarif etmem.
birisinin bu soruna yaklaşmak / düşünmek için tutarlı bir yolu var mı?
genel olarak, birçok durumda, aşağıdaki gibi soruları dikkate almaya eğilimliyim:
1) Bu formdaki veriler için araçların (veya diğer yer türü miktarlarının) nasıl davrandığı hakkında ne anlıyorum *?
* (ister teoriden, ister bu veri türünün deneyiminden veya uzman tavsiyesinden veya gerekirse verilerin kendisinden, ister ilgilenmesi gereken sorunları taşır))
2) Yayılma hakkında (varyans, IQR, vb.) - nasıl davranır?
3) Diğer dağıtım özellikleri (sınırlar, çarpıklık, ayrıklık vb.)
4) Peki ya bağımlılık, nüfusların heterojenliği, bazen çok tutarsız değerlere eğilim, vb.
Bu tür bir değerlendirme, normal bir model, bir GLM, başka bir model veya bazı sağlam veya dağıtımsız bir yaklaşım (sıra tabanlı prosedürler dahil olmak üzere önyükleme veya permütasyon / rasgele yaklaşımlar) arasında bir seçim yönlendirebilir.