Permütasyon testlerini kullanmanın yararı nedir?


10

Bir test istatistik alternatif hipotez karşı bazı boş test ederken , burada , dizi permütasyon testi uygulamak üzerinde permütasyon ve yeni bir istatistik sahip U(X)X={xi,...,xn}GX

T(X):=#{πG:U(πX)U(X)}|G|.
  1. Permütasyon testini kullanmamanın faydası nedir? Yani permütasyon testi çalıştığında neye benziyor?

  2. Bunu yapmak için hangi koşullar? Test istatistiği ve / veya sıfır hipotezi üzerindeki bazı koşullar gibi ?U

Örneğin,

  1. Örnek için , dayalı p-değerine eşit olmalı mı ? Evet ise, neden? (referanslar da takdir edilmektedir)T(X)U(X)X

    un p değeri, olarak tanımlanır . Permütasyon testi U (X) ' un permütasyon dağılımını tahmin edecekse | X = x , T (X) , X = x'deki U (X) ' un p-değerine nasıl eşittir ? Özellikle, H boşluğunda birden fazla dağılım olabilir ve T (X) boş dağılımları tek tek dikkate almaz ve sonra \ sup_ {H} içinde F} ve \ inf_ {c: U (x) almaz. \ geq c} .U(X)

    infcR:U(x)csupFHP(U(X)c|XF)
    U(X)|X=xT(X)U(X)X=xHT(X)supFHinfc:U(x)c
  2. Permütasyon testi , boş hipotezler üzerinde T(X) dağılımını serbest bırakmalı mıdır? Bunu hangi koşullar sağlayacak?

  3. Meli T(X) düzgün dağılmış olması [0,1] ? Bunu hangi koşullar sağlayacak? Zaman olduğuna dikkat edin U() sabit bir fonksiyonu olan T() de, aynı zamanda sabittir 1 ve dağılımı T(X) üzerinde olan standart olmaktan uzaktır [0,1] .

Teşekkürler ve saygılar!


@Glen_b: Teşekkürler! Herhangi bir örnek için , dayalı p-değerine eşit olmalı mı ? Eğer doğru anlamak, ben sayfa 5 buldum bu slaytlar permütasyon testi kullanılarak yararı orijinal test istatistiğinin p değeri hesaplamak için Yani dağılımını bilmeden boş altında? Bu nedenle, un dağılımı her zaman aynı olmayabilir mi? T(X)U(X)XUXT(X)
Tim

Yapar test istatistiği p-değeri, bu ortalama, "T p değeridir (büyük bir u boş sapmayı gösterir durumlarda ve küçük u ile tutarlıdır)" ve örnek olan ? UXT(X)
Tim

Neden? Bunu açıklamak için bir referans var mı?
Tim

Yanıtlar:


18

Tartışma uzun sürdüğü için, bir yanıta verdiğim yanıtları aldım. Ama düzeni değiştirdim.

Permütasyon testleri asemptotikten ziyade "kesin" tir (örneğin, olasılık oranı testleri ile karşılaştırın). Böylece, örneğin, araçlar arasındaki farkın null altındaki dağılımını hesaplayamadan bile bir araç testi yapabilirsiniz; ilgili dağıtımları belirtmeniz bile gerekmez. Tam bir parametrik varsayım kadar duyarlı olmadan bir dizi varsayım altında iyi güce sahip bir test istatistiği tasarlayabilirsiniz (sağlam ancak iyi ARE'ye sahip bir istatistik kullanabilirsiniz).

Verdiğiniz tanımların (ya da daha doğrusu orada alıntı yaptığınız kimin verdiğinin) evrensel olmadığını unutmayın; bazı insanlar U'ya permütasyon testi istatistiği derlerdi (permütasyon testini yapan şey istatistik değil, p değerini nasıl değerlendirdiğinizdir). Ancak bir permütasyon testi yaptıktan ve 'bunun uçları H0 ile tutarsız' olarak bir yön atadıktan sonra, yukarıdaki T için bu tür bir tanım temelde p-değerlerini nasıl çalıştığınızdır - bu sadece permütasyon dağılımı en azından sıfırın altındaki örnek kadar uç (bir p-değerinin tanımı).

Örneğin, iki örnekli bir t-testi gibi araçların (tek kuyruklu, basitlik için) bir testini yapmak istersem, istatistikimi t-istatistiğinin veya t-istatistiğinin kendisinin payı yapabilirim, ya da ilk numunenin toplamı (bu tanımların her biri diğerlerinde monotoniktir, birleştirilmiş numuneye koşulludur) ya da bunların herhangi bir monotonik dönüşümüdür ve aynı teste sahiptir, çünkü aynı p değerlerini verirler. Tek yapmam gereken, hangi istatistiki seçtiğim örnek istatistiklerin permütasyon dağılımının ne kadar (orantılı olarak) yattığını görmek. Yukarıda tanımlandığı gibi T, seçebildiğim kadar iyi olan başka bir istatistiktir (T'de U'da monotonik olarak tanımlandığı gibi).

T tam olarak aynı olmayacaktır, çünkü bu sürekli dağılımlar gerektirecektir ve T mutlaka ayrıktır. U ve bu nedenle T, belirli bir istatistiğe birden fazla permütasyon eşleyebildiğinden, sonuçlar eşit değildir, ancak "tekdüze benzer" bir cdf ** vardır, ancak adımların boyut olarak eşit olmadığı bir .

** ( , ve her atlamanın sağ sınırında buna kesinlikle eşit - muhtemelen bunun gerçekte bir adı var)F(x)x

sonsuzluğa gittikçe makul istatistikler için dağılımı eşitliğe yaklaşmaktadır. Bence onları anlamaya başlamanın en iyi yolu, onları çeşitli durumlarda yapmaktır. nT

Herhangi bir örnek X için T (X), U (X) 'e dayalı p-değerine eşit olmalı mı? Doğru anlarsam, bu slaytların 5. sayfasında buldum.

T, p-değeridir (büyük U'nun boş ve küçük U'dan sapmayı gösterdiği durumlar için). Dağılımın numuneye bağlı olduğunu unutmayın. Yani dağıtımı 'herhangi bir örnek için' değildir.

Permütasyon testini kullanmanın yararı, orijinal test istatistiği U'nun p-değerini null altında dağılımını bilmeden hesaplamaktır? Bu nedenle, T (X) 'un dağılımı her zaman aynı olmayabilir mi?

T'nin tek tip olmadığını zaten anlattım.

Sanırım permütasyon testlerinin faydaları olarak gördüklerimi daha önce açıkladım; diğer insanlar başka avantajlar önerecektir ( örneğin ).

"T, p-değeri (büyük U'nun sıfırdan sapmayı ve küçük U'nun onunla tutarlı olduğunu gösterdiği durumlar için)", test istatistiği U ve X numunesi için p-değerinin T (X) olduğu anlamına mı geliyor? Neden? Bunu açıklamak için bir referans var mı?

Alıntıladığınız cümle, T'nin bir p-değeri olduğunu ve ne zaman olduğunu açıkça belirtir. Bu konuda neyin belirsiz olduğunu açıklayabilirseniz belki daha fazlasını söyleyebilirim. Neden gelince, p-değerinin tanımına bakın (bağlantıdaki ilk cümle) - bu doğrudan doğrudan takip eder

Burada permütasyon testleri hakkında iyi bir temel tartışma var .

-

Düzenleme: Burada küçük bir permütasyon testi örneği ekleyin; bu (R) kodu sadece küçük numuneler için uygundur - orta numunelerde aşırı kombinasyonları bulmak için daha iyi algoritmalara ihtiyacınız vardır.

Tek kuyruklu bir alternatife karşı bir permütasyon testi düşünün:

H0:μx=μy (bazı insanlar * konusunda ısrar ediyor )μxμy
H1:μx<μy

* ama genellikle bundan kaçınırım çünkü özellikle boş dağıtımlar yapmaya çalışırken öğrenciler için sorunu karıştırmaya eğilimlidir

aşağıdaki verilerde:

> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99

7 gözlemi 3 ve 4 boyutlu numunelere bölmenin 35 yolu vardır:

> choose(7,3)
[1] 35

Daha önce de belirtildiği gibi, 7 veri değeri göz önüne alındığında, ilk numunenin toplamı ortalamalar arasındaki farkta monotoniktir, bu yüzden bunu bir test istatistiği olarak kullanalım. Böylece orijinal numunenin test istatistiği vardır:

> sum(x)
[1] 64.77

Şimdi permütasyon dağılımı:

> sort(apply(combn(c(x,y),3),2,sum))
 [1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07

(Bunları sıralamak şart değil, sadece test istatistiğinin sondan itibaren ikinci değer olduğunu görmeyi kolaylaştırmak için yaptım.)

(Bu durumda muayene ile) 2/35 olduğunu görebiliriz veyap

> 2/35
[1] 0.05714286

(Burada yalnızca xy çakışma olmaması durumunda p değerinin .05'in altında olması mümkündür. Bu durumda, muntazam bir değer olacaktır çünkü bağlı değerler yoktur .)TU

permütasyon dağılımı

Pembe oklar x eksenindeki örnek istatistiği ve y eksenindeki p değerini gösterir.


Teşekkürler! Bu nedenle, permütasyon testi,U(X) null dağılımı altında X, değil mi? YaniT(X) null dağılımına bağlıdır X, ancak p-değeri, tüm null dağıtımlarında FP oranının X, ve T(X) için p-değeri U ve X?
Tim

Permütasyon dağılımını tahmin eder. U(X)|X=x. Tüm permütasyonları eşit derecede olası olarak değerlendirirsiniz, bu da onu 'sıfırın altında' yapar (çünkü sıfırın altında permütasyonların eşit olması gerekir).
Glen_b

(1) p değeri U(X) olarak tanımlanır
infcR,:U(x)cyudumF'HP(U(X)c|X~F)
. Permütasyon testi, permütasyon dağılımınıU(X)|X=x, nasıl T(X) p değerine eşittir U(X) en X=x? Özellikle, boşta birden fazla dağıtım olabilirH, ve T(X) null dağılımları tek tek dikkate almaz ve sonra supFH ve infc:U(x)c. (2) YaparT(X)tüm null dağılımlar için aynı dağılıma sahipler, yani null dağıtımdan bağımsız?
Tim

(1) 'e ek olarak, permütasyon testi sadece basit null'lar için değil, aynı zamanda kompozit null'lar için de geçerlidir, değil mi?
Tim

(1) Nerede tanımlı? Bu tuhaf bir tanım gibi görünüyor. X'in dağılımını neden belirlersiniz? ŞartlandırıyorsunX=x. Karışıklıklarınız oldukça garip bir tanımdan kaynaklanıyor gibi görünüyor. (2) bana hiç mantıklı gelmiyor.
Glen_b -Mons Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.