Tartışma uzun sürdüğü için, bir yanıta verdiğim yanıtları aldım. Ama düzeni değiştirdim.
Permütasyon testleri asemptotikten ziyade "kesin" tir (örneğin, olasılık oranı testleri ile karşılaştırın). Böylece, örneğin, araçlar arasındaki farkın null altındaki dağılımını hesaplayamadan bile bir araç testi yapabilirsiniz; ilgili dağıtımları belirtmeniz bile gerekmez. Tam bir parametrik varsayım kadar duyarlı olmadan bir dizi varsayım altında iyi güce sahip bir test istatistiği tasarlayabilirsiniz (sağlam ancak iyi ARE'ye sahip bir istatistik kullanabilirsiniz).
Verdiğiniz tanımların (ya da daha doğrusu orada alıntı yaptığınız kimin verdiğinin) evrensel olmadığını unutmayın; bazı insanlar U'ya permütasyon testi istatistiği derlerdi (permütasyon testini yapan şey istatistik değil, p değerini nasıl değerlendirdiğinizdir). Ancak bir permütasyon testi yaptıktan ve 'bunun uçları H0 ile tutarsız' olarak bir yön atadıktan sonra, yukarıdaki T için bu tür bir tanım temelde p-değerlerini nasıl çalıştığınızdır - bu sadece permütasyon dağılımı en azından sıfırın altındaki örnek kadar uç (bir p-değerinin tanımı).
Örneğin, iki örnekli bir t-testi gibi araçların (tek kuyruklu, basitlik için) bir testini yapmak istersem, istatistikimi t-istatistiğinin veya t-istatistiğinin kendisinin payı yapabilirim, ya da ilk numunenin toplamı (bu tanımların her biri diğerlerinde monotoniktir, birleştirilmiş numuneye koşulludur) ya da bunların herhangi bir monotonik dönüşümüdür ve aynı teste sahiptir, çünkü aynı p değerlerini verirler. Tek yapmam gereken, hangi istatistiki seçtiğim örnek istatistiklerin permütasyon dağılımının ne kadar (orantılı olarak) yattığını görmek. Yukarıda tanımlandığı gibi T, seçebildiğim kadar iyi olan başka bir istatistiktir (T'de U'da monotonik olarak tanımlandığı gibi).
T tam olarak aynı olmayacaktır, çünkü bu sürekli dağılımlar gerektirecektir ve T mutlaka ayrıktır. U ve bu nedenle T, belirli bir istatistiğe birden fazla permütasyon eşleyebildiğinden, sonuçlar eşit değildir, ancak "tekdüze benzer" bir cdf ** vardır, ancak adımların boyut olarak eşit olmadığı bir .
** ( , ve her atlamanın sağ sınırında buna kesinlikle eşit - muhtemelen bunun gerçekte bir adı var)F(x)≤x
sonsuzluğa gittikçe makul istatistikler için dağılımı eşitliğe yaklaşmaktadır. Bence onları anlamaya başlamanın en iyi yolu, onları çeşitli durumlarda yapmaktır. nT
Herhangi bir örnek X için T (X), U (X) 'e dayalı p-değerine eşit olmalı mı? Doğru anlarsam, bu slaytların 5. sayfasında buldum.
T, p-değeridir (büyük U'nun boş ve küçük U'dan sapmayı gösterdiği durumlar için). Dağılımın numuneye bağlı olduğunu unutmayın. Yani dağıtımı 'herhangi bir örnek için' değildir.
Permütasyon testini kullanmanın yararı, orijinal test istatistiği U'nun p-değerini null altında dağılımını bilmeden hesaplamaktır? Bu nedenle, T (X) 'un dağılımı her zaman aynı olmayabilir mi?
T'nin tek tip olmadığını zaten anlattım.
Sanırım permütasyon testlerinin faydaları olarak gördüklerimi daha önce açıkladım; diğer insanlar başka avantajlar önerecektir ( örneğin ).
"T, p-değeri (büyük U'nun sıfırdan sapmayı ve küçük U'nun onunla tutarlı olduğunu gösterdiği durumlar için)", test istatistiği U ve X numunesi için p-değerinin T (X) olduğu anlamına mı geliyor? Neden? Bunu açıklamak için bir referans var mı?
Alıntıladığınız cümle, T'nin bir p-değeri olduğunu ve ne zaman olduğunu açıkça belirtir. Bu konuda neyin belirsiz olduğunu açıklayabilirseniz belki daha fazlasını söyleyebilirim. Neden gelince, p-değerinin tanımına bakın (bağlantıdaki ilk cümle) - bu doğrudan doğrudan takip eder
Burada permütasyon testleri hakkında iyi bir temel tartışma var .
-
Düzenleme: Burada küçük bir permütasyon testi örneği ekleyin; bu (R) kodu sadece küçük numuneler için uygundur - orta numunelerde aşırı kombinasyonları bulmak için daha iyi algoritmalara ihtiyacınız vardır.
Tek kuyruklu bir alternatife karşı bir permütasyon testi düşünün:
H0:μx=μy (bazı insanlar * konusunda ısrar ediyor )μx≥μy
H1:μx<μy
* ama genellikle bundan kaçınırım çünkü özellikle boş dağıtımlar yapmaya çalışırken öğrenciler için sorunu karıştırmaya eğilimlidir
aşağıdaki verilerde:
> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99
7 gözlemi 3 ve 4 boyutlu numunelere bölmenin 35 yolu vardır:
> choose(7,3)
[1] 35
Daha önce de belirtildiği gibi, 7 veri değeri göz önüne alındığında, ilk numunenin toplamı ortalamalar arasındaki farkta monotoniktir, bu yüzden bunu bir test istatistiği olarak kullanalım. Böylece orijinal numunenin test istatistiği vardır:
> sum(x)
[1] 64.77
Şimdi permütasyon dağılımı:
> sort(apply(combn(c(x,y),3),2,sum))
[1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07
(Bunları sıralamak şart değil, sadece test istatistiğinin sondan itibaren ikinci değer olduğunu görmeyi kolaylaştırmak için yaptım.)
(Bu durumda muayene ile) 2/35 olduğunu görebiliriz veyap
> 2/35
[1] 0.05714286
(Burada yalnızca xy çakışma olmaması durumunda p değerinin .05'in altında olması mümkündür. Bu durumda, muntazam bir değer olacaktır çünkü bağlı değerler yoktur .)TU
Pembe oklar x eksenindeki örnek istatistiği ve y eksenindeki p değerini gösterir.