R'de yapılan tek örnekli Kolmgorov-Smirnov testinde “Bağlar olmamalı”


12

Kolmogorov-Smirnov testini R'deki MYDATA'nın normalliğini test etmek için kullanacağım. Bu yaptığımın bir örneği

 ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))

İşte R'nin bana verdiği sonuç:

 data:  MYDATA
 D = 0.13527, p-value = 0.1721
 alternative hypothesis: two-sided

 Warning message:
 In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
    ties should not be present for the Kolmogorov-Smirnov test

Bir sorun olduğunu düşünüyorum, bu uyarıda "bağlar" ne anlama geliyor?


2
Neden bu normallik testini yapmak istiyorsunuz? Çoğu durumda, bir değişkenin normallerinin test edilmesi oldukça işe yaramaz , ancak gerilemeyi takiben artıkların normallerinin test edilmesi önemli olabilir.
EdM

2
Bağları olmasa bile, KS testi genel normallik için bir test değil, tam olarak belirlenmiş bir dağılımdır (verilerden ortalama ve sd'yi tahmin ediyorsunuz). P değerleriniz saçma olacaktır. Sitemizde Lilliefors testi
Glen_b -Restate Monica

Yanıtlar:


10

Burada iki probleminiz var:

KS testi sürekli bir dağıtım içindir ve bu nedenle MYDATA herhangi bir bağ içermemelidir (tekrarlanan değerler).

KS testinin altında yatan teori, yaptığınız gibi verilerden dağılım parametrelerini tahmin etmenize izin vermez. Ks.test'in yardımı bunu açıklıyor.


neden ks.testiki örnekli bir durumda bağların her ikisinden de çıkarılmasını istiyor xve y? Yani, xve y( unique(x)ve unique(y)) arasında bağım yok, ama iki vektörün ortak bir değeri var. Bağlar sadece xve içindeki değerler arasında düşünülmemeli ymidir?
Nemesi

@Nemesi Yeni bir sorunuz varsa lütfen Soru Sor düğmesini kullanarak sorunuzu sorun.
mdewey

Bu farklı bir soru olmak için yeterli olmasa da, işte burada: stats.stackexchange.com/questions/389151/…
Nemesi

5

@Mdewey tarafından açıklandığı gibi, KS testi verilerden parametreler hesaplanırken uygun değildir. Normallik için Anderson-Darling testine dayanan ve ortalamayı ve stddev'i sağlamanızı gerektirmeyen aşağıdaki kodu kullanabilirsiniz. Bu testin doğruluğu Lilliefors testinden daha güçlüdür.

install.packages("nortest")
library(nortest)
ad.test(MYDATA)

"Doğruluk", dar ancak yanlış yönlendirilmiş bir arama için olabilir. Her iki durumda da, bu testlerden herhangi birinin çoğu uygulaması en kötü yararsızdır ve çoğu durumda yanıltıcıdır. İnsanlara genellikle bunları, regresyon yöntemleri hakkındaki varsayımları hatalı anlayan kişiler tarafından kullanmaları öğretilir. KS testinin göreceli zayıflığının, sonuçların saf kullanıcı için yanıltıcı olma olasılığının daha düşük olacağı için, daha güçlü alternatiflerin kullanılmasının aslında "daha iyi" olmasını sağladığını düşünüyorum.
DWin
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.