Sürekli bir dağıtımdan örneklenen verilerin 'modunu' takmak için en iyi yöntemler nelerdir?
Mod, sürekli bir dağıtım için teknik olarak tanımlanmamış (doğru?) Olduğundan, gerçekten 'en yaygın değeri nasıl buluyorsunuz?'
Üst dağıtımın gauss olduğunu varsayarsanız, verileri depolayabilir ve modun en fazla sayılan depo konumu olduğunu söyleyebilirsiniz. Ancak, kutu boyutunu nasıl belirliyorsunuz? Sağlam uygulamalar var mı? (yani aykırı değerlere karşı sağlam). Ben kullanın python
/ scipy
/ numpy
ama muhtemelen çevirebilir R
çok fazla zorlanmadan.