Bir örneği karşılaştırıp bazı, ayrık, dağılım olarak dağıtıp dağıtmadığını kontrol ediyorum. Ancak, Kolmogorov-Smirnov'un uygulandığından emin değilim. Vikipedi öyle olmadığı anlamına geliyor. Olmazsa, numunenin dağılımını nasıl test edebilirim?
Bir örneği karşılaştırıp bazı, ayrık, dağılım olarak dağıtıp dağıtmadığını kontrol ediyorum. Ancak, Kolmogorov-Smirnov'un uygulandığından emin değilim. Vikipedi öyle olmadığı anlamına geliyor. Olmazsa, numunenin dağılımını nasıl test edebilirim?
Yanıtlar:
Ayrık dağılımlar için geçerli değildir. Bkz http://www.itl.nist.gov/div898/handbook/eda/section3/eda35g.htm örneğin.
Ki-kare uyum iyiliği testini kullanamamanızın bir nedeni var mı? Daha fazla bilgi için http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm adresini ziyaret edin .
İstatistiklerde sıklıkla olduğu gibi, ne demek istediğinizi temel alır .
"Test istatistiğimi belirli bir dağılımdan çizilen bir örnek üzerinde hesaplarım ve sonra standart tablolara bakarım" demek isterseniz, o zaman seçtiğinizden daha düşük (muhtemelen çok daha düşük) gerçek bir tip I hata oranı elde edersiniz.
Dağılımın ne kadar “ayrık” olduğuna bağlıdır. Herhangi bir sonucun olasılığı oldukça düşükse (bu nedenle verilerdeki bağlı değerlerin oranının düşük olması beklenir) o zaman çok önemli olmayacaktır - çoğu insan 5'i çalıştırmada sorun yaşamazdı % 4.5,% test diyor. Örneğin, [1,1000] üzerinde ayrı bir üniforma test ediyorsanız, muhtemelen endişelenmenize gerek yoktur.
Ancak, bir değere bağlı bir yüksek olasılık varsa, o zaman Tip I hata oranı üzerindeki etkisi işaretlenebilir. 0.05 istediğinizde 0.005 anlamlılık seviyesine sahipseniz, buna bağlı olarak gücü etkileyeceği için bu bir sorun olabilir.
Bunun yerine "Ayrık bir dağılımdan çizilmiş bir örnek üzerinde test istatistiğimi hesaplarım ve daha sonra uygun bir kritik değer kullanırım / durumum için uygun bir p-değeri hesaplarım" (örneğin, bir permütasyon testi ile) Tabii ki, doğru tip I hata oranını alacağınız ve tabii ki test istatistiklerinin mahremiyetine kadar kesinlikle geçerlidir . (Her ne kadar sürekli durumda olduğu gibi, kendi amacınız için daha iyi testler olsa da)
Test istatistiğinin kendi dağılımının artık dağılımsız olmadığını, ancak bir permütasyon testinin bu konuyu önlediğini unutmayın.
Bu yüzden bazen standart tabloları ayrık dağılımlarda bile kullanmakta sorun yoktur ve tamam olmasa bile, sorunla ilgili kullandığınız kritik değerler / p değerleri kadar test istatistiği değildir.