Basıklık aykırı değerleri ölçer. Aykırı değerler, normal dağılıma dayanan standart çıkarımlar için (örn., T-testleri, t-aralıkları) sorunludur. Hikayenin sonu bu! Ve bu gerçekten oldukça basit bir hikaye.
Bu hikayenin iyi anlaşılmamasının nedeni, basıklığın "doruk noktası" ölçtüğü kadim mitin devam etmesidir.
İşte basıklığın neden "dorukluk" değil aykırı değerleri ölçtüğünü gösteren basit bir açıklama.
Aşağıdaki veri kümesini göz önünde bulundurun.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
Basıklık (z-değerleri) ^ 4'ün beklenen değeridir. İşte (z-değerleri) ^ 4:
6.51, 0.30, 5.33, 0.45, 0.00, 0.30, 6.51, 0.00, 0.45, 0.30, 0.00, 6.51, 0.00, 0.00, 0.30, 0.00, 27.90, 0.00, 0.30, 0.45
Ortalama 2.78'dir ve bu basıklık için bir tahmindir. (Aşırı basıklık istiyorsanız 3 çıkarın.)
Şimdi, son veri değerini 999 ile değiştirin, böylece bir aykırı değer olur:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Şimdi, (z-değerleri) ^ 4:
0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00.0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 360.98
Ortalama 18.05'tir ve bu basıklık için bir tahmindir. (Aşırı basıklık istiyorsanız 3 çıkarın.)
Açıkçası, sadece aykırı değerler önemlidir. "Zirve" veya orta noktaya yakın veriler hakkında hiçbir şey yok.
İkinci veri kümesiyle standart istatistiksel analizler yaparsanız, sorun beklemelisiniz. Büyük basıklık sizi sorun konusunda uyarır.
İşte ayrıntılı bir makale:
Westfall, PH (2014). Dorukluk olarak Kurtosis, 1905 - 2014. RIP Amerikan İstatistikçisi, 68, 191-195.