Verilerin üstel veya normal dağılımları takip edip etmediğini görmek için standart istatistiksel testler nelerdir?
Verilerin üstel veya normal dağılımları takip edip etmediğini görmek için standart istatistiksel testler nelerdir?
Yanıtlar:
Görünüşe göre verilerinizi normal veya üstel dağılımı kullanarak modellemeye karar verin. Bu dağılımlar birbirinden çok farklı olduğu için bu benim için biraz garip görünüyor.
Normal dağılım simetrikken, üstel dağılım negatif değere sahip olmadan sağa doğru eğimlidir. Tipik üstel dağılımından örnek nispeten yakın birçok gözlemler içerecektir ve gelen sağa kadar sapma birkaç obervations . Bu farkı grafik olarak görmek genellikle kolaydır.
Burada simüle ettik bir örnek , normal ortalama ile dağıtım gözlemler ve varyans , ortalama bir üstel dağılım ve varyans :
Normal dağılımın simetrisi ve üstelin çarpıklığı, yukarıdaki şekilde gösterildiği gibi histogramlar, kutu grafikleri ve saçılım grafikleri kullanılarak görülebilir.
Bir başka çok yararlı araç da QQ grafiğidir . Aşağıdaki örnekte, numune normal bir dağılımdan geliyorsa noktalar yaklaşık olarak çizgiyi takip etmelidir. Gördüğünüz gibi, bu normal veriler için geçerlidir, ancak üstel veriler için geçerli değildir.
Herhangi bir nedenle grafik inceleme sizin için yeterli değilse, dağıtımınızın normal veya üstel olup olmadığını belirlemek için bir test kullanabilirsiniz. Normal dağılım bir ölçek ve konum ailesi olduğundan, ölçek ve konumdaki değişiklikler altında değişmez bir test kullanmak isteyeceksiniz (yani ölçümlerinizi inçten santimetreye değiştirirseniz veya ).
Sıfır hipotezi dağılımın normal, alternatif hipotez ise üstel olması durumunda, en güçlü yer ve ölçek değişmez testi burada örnek ortalaması, örnekteki en küçük gözlemdir ve , örnek standart sapmasıdır. çok büyükse normallik üstellik lehine reddedilir .
Bu test aslında Grubbs'un aykırı değerlere yönelik testinin tek taraflı bir versiyonudur . Bunu çoğu istatistiksel yazılımda uygulanmış bulacaksınız (ancak doğru sürümü kullandığınızdan emin olun - aykırı test için kullanılan birkaç alternatif test istatistikleri vardır!).
En güçlü test olan için referans : HC Thode tarafından Normallik Testi için Bölüm 4.2.4 .
Üstel dağılım için Moran veya Bartlett testi denen bir test kullanabilirsiniz. Test istatistiği , kaydedilen için örnek ortalama ve örnek ortalama içerir Boş hipotez altında yaklaşık ve iki taraflı bir test çalışır. Bu test gama alternatiflerine karşı tasarlanmıştır. B n ∼ χ 2 ( n - 1 )
Mühendislik tasarımında KC Kapur ve LR Lamberson Güvenilirliği bölümüne bakınız . Wiley 1977.
Normallik için Anderson-Darling ve Shapiro-Wilk en iyisi olarak kabul edilir. Üstel Lillerfors testi için özel olarak tasarlanmıştır.
Verilerin nasıl davrandığını görmek için grafik yöntemleri düşündünüz mü?
Olasılık grafiği teknikleri genellikle verileri sıralamayı, ters CDF'yi uygulamayı ve ardından sonuçları Kartezyen düzlemde çizmeyi içerir. Bu, birkaç değerin varsayılan dağıtımdan sapıp sapmadığını ve muhtemelen sapma nedenini açıklayıp açıklamadığını görmenizi sağlar.