Kesilenin ne anlama geldiğini düşünün: Prototip durumda, önce verilerinizi artan sırayla sıralarsınız. Sonra alttan kırpma yüzdesine kadar sayılır ve bu değerleri atarsınız. Örneğin,% 10 oranında kesilmiş ortalama yaygındır; bu durumda, kümenizdeki tüm verilerin% 10'unu geçene kadar en düşük değerden sayılırsınız. Bu işaretin altındaki değerler bir kenara konur. Benzer şekilde, kırpma yüzdenizi geçene kadar en yüksek değerden geri sayın ve tüm değerleri bir kenara koyun. Artık orta% 80 ile kaldı. Bunun ortalamasını alıyorsunuz ve bu% 10 kesilmiş ortalamanız. (İki kuyruktan eşit olmayan oranları kırpabileceğinizi veya yalnızca bir kuyruğu kırpabileceğinizi unutmayın, ancak bu yaklaşımlar daha az yaygındır ve durumunuz için geçerli görünmemektedir.)
Şimdi,% 50 kesilmiş bir ortalama hesaplarsanız ne olacağını düşünün. Alt yarı, üst yarı gibi bir kenara bırakılır. Ortada (sıralı olarak) yalnızca tek bir değer kalacaksınız. Kesilmiş ortalamanız olarak bunun anlamını (yani, sadece bu değeri alırsınız) alacaksınız. Ancak, bu değerin medyan olduğunu unutmayın. Başka bir deyişle, medyan kesilmiş bir ortalamadır (% 50 kesilmiş bir ortalamadır). Sadece çok agresif. Aslında, verilerinizin% 99'unun kontamine olduğunu varsayar. Bu, nihai güç / verimlilik kaybı pahasına aykırı değerlere karşı en üst düzeyde koruma sağlar .
Tahminim medyan /% 50 kesilmiş bir ortalama, verileriniz için gerekli olandan çok daha agresiftir ve sizin için mevcut olan bilgilerden çok boşa gitmektedir. Var olan aykırı değerlerin bir oranı varsa, bu bilgiyi kırpma yüzdesini ayarlamak ve uygun kesilmiş ortalamayı kullanmak için kullanırdım. Kırpma yüzdesini seçmek için herhangi bir temeliniz yoksa, çapraz doğrulamayla bir tane seçebilir veya yalnızca bir kesmeli güçlü bir regresyon analizi kullanabilirsiniz.