Acemi sorular:
İki ayrı veri setinin aynı dağıtımdan gelip gelmediğini test etmek istiyorum. Bana bir Kolmogorov-Smirnov testi önerildi.
Conover ( Pratik Parametrik Olmayan İstatistik , 3d), Kolmogorov-Smirnov Testinin bu amaç için kullanılabileceğini söylüyor, ancak davranışı, ayrık dağılımlarla “muhafazakar” ve burada ne anlama geldiğinden emin değilim.
DavidR'in başka bir soru üzerine yaptığı yorumda “KS istatistiklerine dayanarak hala bir seviye α testi yapabilirsiniz, ancak kritik değeri elde etmek için başka bir yöntem bulmanız gerekecek, örneğin simülasyon yoluyla.”
Dgof R paketi (içinde ks.test sürümü () makale , cran ) istatistik paket () ks.test varsayılan sürümünde bulunmayan bazı yetenekleri ekler. Diğer şeylerin yanı sıra, dgof :: ks.test bu parametreyi içerir:
simulate.p.value: sadece belirli uyumsuzluk testleri için p-değerlerinin Monte Carlo simülasyonu ile hesaplanıp hesaplanmayacağını gösteren bir mantık.
Simulate.p.value = T, DavidR'in önerdiği şeyi gerçekleştirmek için mi?
Öyle olsa bile, iki örneklemli bir test için gerçekten dgof :: ks.test kullanıp kullanamayacağımdan emin değilim. Sürekli bir dağıtım için sadece iki örnekli bir test sağlıyor gibi gözüküyor:
Y sayısal ise, x ve y'nin aynı sürekli dağılımdan çizildiği boş hipotezin iki örneklem bir testi yapılır.
Alternatif olarak, y, sürekli (kümülatif) bir dağıtım fonksiyonunu (veya böyle bir fonksiyonu) isimleyen bir karakter dizgisi veya ayrık bir dağılım veren bir ecdf fonksiyonunu (veya sınıf stepfun nesnesini) içerebilir. Bu durumlarda, x örneklemeli dağıtım fonksiyonunun dağılım y olduğu boşluğundan tek örnekli bir test yapılır.
(Arka plan ayrıntıları: Açıkça konuşursak, temel dağılımlarım süreklidir, ancak veriler bir avuç noktaya çok yakındır. Her nokta bir simülasyonun sonucudur ve -1 ile 10 arasında gerçek sayıların ortalamasıdır. 1. Simülasyonun sonunda, bu sayılar neredeyse her zaman 0,9 veya -,9'a çok yakındır, bu nedenle araçlar birkaç değer etrafında toplanır ve ben bunları ayrık olarak ele alıyorum. Verilerin iyi bilinen bir dağılım izlediğini düşünmek için sebep.)
Tavsiye?