Asimetrik null dağılımlı iki kuyruklu testte P değeri


18

Benim durumum şöyledir: Monte-Carlo çalışmasıyla, iki farklı testin p -değerlerini tahmini bir parametrenin istatistiksel anlamlılığıyla karşılaştırmak istiyorum (null "etki yok - parametre sıfır" ve zımni alternatif " parametresi sıfır değil "). Test A , null altında eşit varyanslara sahip standart "araçların eşitliği için bağımsız iki örnekli t-testidir" .

Test B Kendimi kurdum. Burada kullanılan sıfır dağılımı, asimetrik bir jenerik ayrık dağılımdır. Ancak Rohatgi & Saleh'de şu yorumu buldum (2001, 2. baskı, s. 462)

"Dağılım simetrik değilse, p değeri iki taraflı durumda iyi tanımlanmamıştır, ancak birçok yazar tek taraflı - pdeğerini iki katına çıkarmayı önermektedir " .

Yazarlar bunu daha fazla tartışmazlar ve tek taraflı - pdeğerini iki katına çıkarmak için "birçok yazar önerisi" hakkında yorum yapmazlar . (Bu, " hangi tarafın p değerini iki katına çıkarır ? Neden bu tarafı değil, diğer tarafı değil?"

Bu konuda başka bir yorum, görüş ya da sonuç bulamadım. Asimetrik dağılımla, parametrenin değerine ilişkin sıfır hipotezi etrafında bir aralık simetrik olarak düşünebilmemize rağmen, ikinci olağan simetriye, olasılık kütle tahsisininkine sahip olmayacağımızı anlıyorum. Ama bunun neden p değerini "iyi tanımlanmamış" hale getirdiğini anlamıyorum . Şahsen, tahmin edenin değerleri için sıfır hipotezi etrafında bir simetrik aralık kullanarak tanımlayıcı görmüyorum"null dağılımının sınırlara eşit veya bu aralığın dışında değerler üretme olasılığı XX'dir." Bir taraftaki olasılık kütlesinin diğer taraftaki olasılık kütlesinden farklı olacağı gerçeği, en azından benim amacım için sıkıntılara yol açıyor gibi görünmüyor. Ama Rohatgi & Saleh'in bilmediğim bir şeyi bilmesinden daha muhtemel.

Yani bu sorum: null dağılımı simetrik olmadığında iki taraflı bir test söz konusu olduğunda p değeri ne anlamda "iyi tanımlanmamıştır"?

Belki de önemli bir not: Konuyu daha çok bir Balıkçı ruhu ile ele alıyorum, Neyman-Pearson anlamda katı bir karar kuralı elde etmeye çalışmıyorum. Çıkarım yapmak için değeri bilgilerini diğer bilgilerin yanında kullanmayı testin kullanıcısına bırakıyorum .p


4
Olasılık temelli ("Fisherian") ve LR temelli (NP) yaklaşımlara ek olarak, başka bir yöntem kısa güven aralıklarının nasıl elde edileceğini göz önünde bulundurur ve hipotez testi için olanları kullanır. Bu, uzunluğun kayıp fonksiyonuna dahil edildiği karar teorisi ruhunda (ve yöntemlerini kullanarak) yapılır. Test istatistiğinin unimodal simetrik dağılımları için, simetrik aralıklar (esasen tek taraflı testlerin "esasen" iki katına çıkarılması ") kullanılarak mümkün olan en kısa aralıklar elde edilir. En kısa uzunluk aralıkları parametrelendirmeye bağlıdır: bu nedenle Balıkçılar olamazlar.
whuber

Burada gönderilen cevapların beta dağıtımlarında da geçerli olup olmayacağını merak ediyordum. Teşekkürler.
JLT

@JLT: Evet, neden olmasın?
Scortchi

Yanıtlar:


12

2x2 kesin testine bakarsak ve bunu bizim yaklaşımımız olarak görürsek, "daha uç" olan şey doğrudan "düşük olasılık" ile ölçülebilir. (Agresti [1], çeşitli yazarlar tarafından , 2x2 Fisher kesin testinin bu vakası için iki kuyruklu p-değerini hesaplamaya yönelik bir dizi yaklaşımdan bahseder;

Sürekli (unimodal) bir dağılım için, diğer kuyrukta sadece örnek değerinizle aynı yoğunluğa sahip noktayı bulursunuz ve diğer kuyrukta eşit veya daha düşük olasılığı olan her şey p-değeri hesaplamanızda sayılır.

Kuyruklarda monoton olarak artmayan ayrık dağılımlar için bu kadar basittir. Eklediğim varsayımlara ("kuyruk" terimini fikre uydurmak için) göre, örneklemden eşit veya daha düşük olasılıkla her şeyi sayıyorsunuz, bunu çözmenin bir yolu var.

HPD aralıklarına aşina iseniz (ve yine, tekdüzenlikle uğraşıyoruz), temel olarak, örnek istatistiğinizle bir kuyrukta sınırlanmış açık bir HPD aralığının dışındaki her şeyi almak gibidir.

enter image description here

[Tekrarlamak gerekirse - bu, burada eşitlediğimiz sıfırın altında olma olasılığıdır.]

Yani en azından unimodal durumda, Fisher'ın kesin testini taklit etmek ve hala iki kuyruk hakkında konuşmak yeterince basit görünüyor.

Bununla birlikte, Fisher'in tam test ruhunu bu şekilde çağırmayı düşünmemiş olabilirsiniz.

Bu yüzden bir şeyi bir an için `` ya da daha uç '' yapan şeyin ne olduğunun düşüncesinin dışında düşünelim, şeylerin Neyman-Pearson sonlarına doğru biraz daha ilerleyelim. (Test etmeden önce!), Bazı genel düzeyde yürütülen bir test için bir reddetme bölgesi tanımlamak için yardımcı olabilir . En kısa sürede, davanız için iki kuyruklu p-değerini hesaplamanın yolu belli olacaktır.α

Bu yaklaşım, olağan olabilirlik oranı testinin dışında bir test yapsa bile değerli olabilir. Bazı uygulamalar için, asimetrik permütasyon testlerinde p değerlerinin nasıl hesaplanacağını bulmak zor olabilir ... ancak önce bir reddetme kuralı düşünürseniz genellikle oldukça basitleşir.

F-varyans testleri ile, "çift bir kuyruk p-değeri" nin doğru yaklaşım olarak gördüğümden oldukça farklı p-değerleri verebileceğini fark ettim. [Hangi gruba “örnek 1” adını verdiğiniz ya da daha büyük veya daha küçük varyansı paylaştırıcıya koymanız önemli değildir.]

[1]: Agresti, A. (1992),
Acil Tablolar için Kesin Çıkarım Araştırması
İstatistik Bilimi , Cilt. 7 , No. 1. (Şub.), Sayfa 131-153.


1
ctd ... Bir olasılık oranı testi yapıyorsak, olasılık oranı her zaman tek kuyrukludur, ancak bazı istatistiğe dayalı eşdeğer iki kuyruklu bir test oluşturursak, yine de "daha uç" bulmak için daha küçük olabilirlik oranlarına bakarız.
Glen_b

2
Tek kuyruklu p değerinin iki katına çıkarılması, iki tek kuyruklu testin gerçekleştirilmesi için bir Bonferroni düzeltmesi olarak savunulabilir. Sonuçta, iki kuyruklu bir testin ardından, genellikle sıfırın gerçeğine dair herhangi bir şüphe, yönü verilerle belirlenen başka bir hipotezi destekleme eğilimindedir.
Scortchi - Monica'yı eski durumuna getirin

1
@Alecos simetrik bir seçimi haklı çıkarmak için yeterince basit! Simetrik bir seçimin herhangi bir şekilde geçerli bir şey olmadığını öne sürdüğünü yazdığımı nasıl okuduğunuzu görmekte zorlanıyorum (bu seçim ret kuralı hakkında verdiğim tartışma kapsamındadır - kolayca bir simetrik oluşturabilirsiniz ret kuralı). Cevabımın ilk kısmı Fisher hakkındaki soruya cevap vermekti. Fisher hakkında soru sorarsanız, Fisher'ın benzer koşullarda ne yaptığını temel alarak neler yapabileceğini tartışmamalı mıyım? Cevabımı olduğundan daha fazlasını söyleyerek yorumluyorsun.
Glen_b

1
@Alecos Özellikle Fisher ya da Neyman Pearson yaklaşımlarını savunmuyorum (olasılık oranı testleri ya da sadece hipotez testleri hakkında konuşalım) ya da atladığım herhangi bir şeyin yanlış olabileceğini önermeye çalıştığımı düşünmemelisiniz . Sadece sorunuzda gündeme getirdiğiniz bazı şeyleri tartışıyorum.
Glen_b

2
Sonuçta, evet. Fisher'ın yaklaşımı ile ilgili en güzel şey, alternatif olmadan bile p değerine ulaşmanın çok mantıklı bir yoludur. Ancak, belirli ilgi alanlarınız varsa, alternatiflerin örneklerinizi reddetme bölgesi olarak koyma eğilimi göstereceği örnek alanın bölümlerini bildirerek reddetme bölgenizi az çok hassas olarak bu alternatiflere hedefleyebilirsiniz. Bir test istatistiği T, özünde, tek bir sayıyı içindeki her bir nokta ile ilişkilendirerek (bize T tarafından ölçüldüğü gibi 'daha aşırı' vererek) ulaşmanın uygun bir yoludur. ...
ctd

9

STST=|S|

t=min(PrH0(S<s),PrH0(S>s))S2t

SST=fS(S)X1.661.66

p=Pr(X>1.66)+Pr(X<1.66)=0.048457+0.048457=0.09691.
Ye1.66=5.25930.025732=e3.66
p=Pr(Y>5.2593)+Pr(Y<0.025732)=0.048457+0.00012611=0.04858.

enter image description here

Kümülatif dağılım işlevlerinin sipariş koruma dönüşümlerine değişmez olduğunu unutmayın, bu nedenle yukarıdaki örnekte en düşük p değerini iki katına çıkarmak verir.

p=2t=2min(Pr(X<1.66),Pr(X>1.66))=2min(Pr(Y<5.2593),Pr(Y>5.2593))=2min(0.048457,0.951543)=2×0.048457=0.09691.

Alternatif hipotez açıkça beyan ettiği deney inşaat bazı ilkelerini tartışmaya bu cevaba devamı Bir çeşit bulunabilir burada .

S

pL=PrH0(Ss)
pU=PrH0(Ss)

alt ve üst tek kuyruklu p değerleri için, iki kuyruklu p değeri

Pr(Tt)={pL+PrH0(PUpL)when pLpUpU+PrH0(PLpU)otherwise

2t


1
Vay canına. Bu çok iyi bir nokta, +1. Öyleyse tavsiyen nedir? Ayrıca, bu tutarsızlığı, test istatistiği için farklı (bu durumda örtük) seçimlere karşılık gelen olarak yorumlayabilir miyim?
amip diyor Reinstate Monica

1
@amoeba: Yazım hatası değil! Ve 1.66 gözlemlediğinizde, en az 0.952 ve 0.048 alırsınız. Eğer -3.66'yı gerçekten gözlemlediyseniz, minimum 0.0001 ve 0.9999 olurdu.
Scortchi - Monica'yı eski durumuna döndürün

1
@Scortchi Glen_b'in cevabını yeni kabul ettim çünkü dar anlamda benim için daha "yararlı "ydı. Ama seninki , gelecekteki riskler için mükemmel bir sigorta poliçesi olan "hepsi bu kadar" diye düşünmekten kaçınmamı sağladı . Tekrar teşekkürler.
Alecos Papadopoulos

1
@Scortchi Kabul etmek zorundayım; cevabım oldukça basit ve tek taraflı bir görüş aldı ve cevabı nitelendirmeli, genişletmeli ve haklı çıkarmalıyım. Bunu muhtemelen birkaç aşamada yapacağım.
Glen_b

1
@ Glen_b: Teşekkürler, dört gözle bekliyorum. Ayrıca, puan testlerinin ve genelleştirilmiş olabilirlik oranı testlerinin (genel olarak) nasıl farklı cevaplar verdiğini göstermek için madeni genişletmek istiyorum; & Tarafsız testler teorisinden kesinlikle bu bağlamda bahsetmeye değer (ama bunu neredeyse hatırlayamıyorum).
Scortchi - Eski durumuna getir Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.