Çalıştığım bir deney için dağılımın tek biçimliliğini ölçmek için bir ölçüm bulmaya çalışıyorum. Çoğu durumda eşit olarak dağıtılması gereken rastgele bir değişkenim var ve değişkenin bazı sınırlar içinde eşit olarak dağıtılmadığı veri kümelerinin örneklerini tanımlayabiliyorum (ve derecesini ölçebiliyorum).
Her biri, ölçtüğüm bir şeyin meydana gelme sıklığını temsil eden 10 ölçümden oluşan üç veri serisine bir örnek şöyle olabilir:
a: [10% 11% 10% 9% 9% 11% 10% 10% 12% 8%]
b: [10% 10% 10% 8% 10% 10% 9% 9% 12% 8%]
c: [ 3% 2% 60% 2% 3% 7% 6% 5% 5% 7%] <-- non-uniform
d: [98% 97% 99% 98% 98% 96% 99% 96% 99% 98%]
C gibi dağılımları a ve b gibi gruplardan ayırt edebilmek ve c'nin tek tip bir dağılımdan sapmasını ölçmek istiyorum. Aynı şekilde, bir dağılımın ne kadar tek biçimli olduğuna dair bir ölçüt varsa (sıfıra yakın std. Sapma?), Belki de bunu yüksek varyansa sahip olanları ayırt etmek için kullanabilirim. Ancak, verilerim yukarıdaki c örneği gibi yalnızca bir veya iki aykırı olabilir ve bunun kolayca tespit edilip edilmeyeceğinden emin değilim.
Bunu yazılımda yapacak bir şeyi hackleyebilirim, ancak bunu resmi olarak haklı çıkarmak için istatistiksel yöntemler / yaklaşımlar arıyorum. Yıllar önce ders aldım, ancak istatistikler alanım değil. Bu iyi bilinen bir yaklaşıma sahip olması gereken bir şeye benziyor. Bunlardan herhangi biri tamamen kemik başlıysa özür dilerim. Şimdiden teşekkürler!