UMP olmadığında Reddetme Bölgesi nasıl tanımlanır?


13

Doğrusal regresyon modelini düşünün

y=Xβ+u ,

uN(0,σ2I) ,

E(uX)=0 .

Let vs .H 1 : σ 2 0σ 2H0:σ02=σ2H1:σ02σ2

Biz anlamak ki , burada dim (\ mathbf {X}) = n \ kez k . Ve \ mathbf {M_X} Yokedici matrisi için tipik gösterim, bir \ mathbf {M_X} \ mathbf {y} = \ hat {\ mathbf {y}} , \ şapka {\ mathbf {y}} bağımlı değişken olarak \ mathbf {y} üzerinde \ mathbf {X} geriledi .dım(x)=nxkEX-Mxy= y y yXyTMXyσ2χ2(nk)dim(X)=n×kMXMXy=y^y^yX

Okuduğum kitapta şunlar belirtiliyor: resim açıklamasını buraya girin

Daha önce bir Reddetme Bölgesi'ni (RR) tanımlamak için hangi kriterlerin kullanılması gerektiğini sordum, bu sorunun cevaplarına bakın ve asıl olan, testi mümkün olduğunca güçlü hale getiren RR'yi seçmekti.

Bu durumda, alternatif bilateral kompozit hipotez olmakla birlikte genellikle UMP testi yoktur. Ayrıca, kitapta verilen cevapla, yazarlar RR'lerinin gücü üzerinde bir çalışma yapıp yapmadığını göstermezler. Bununla birlikte, iki kuyruklu bir RR seçtiler. Hipotez RR'yi 'tek taraflı' belirlemediğinden neden bu?

Düzenleme: Bu resim 4.14 egzersiz için çözüm olarak bu kitabın çözüm kılavuzunda bulunmaktadır .



@Scortchi bağlantı için teşekkürler. Size bu soru hakkında bir şey sorabilir miyim? İlginç buluyor musun? İlginç sorular yapıp yapmadığımı veya çıkarlarımı başka alanlara yöneltmem gerekip gerekmediğini değerlendirmeye çalışıyorum ...
Denizdeki yaşlı bir adam.

Herkes teoriyi ilginç bulmuyor, ancak bazı insanlar (ben dahil) yapıyor ve neredeyse 2k qs ile etiketleniyoruzmathematical-statistics . Yani, güzel bir q. IMO. Bu bir olan küçük geniş ama iyi bir cevap çeşitli yaklaşımlar ve değerlendirmeler anket düşünüyorum, ve motive edici bir örnek, bir çok yardımcı olur. (Mümkün olduğunca basit bir örnek seçmiştim - normal bir dağılımın bilinen ortalamaya veya üstel dağılımın ortalamasına ilişkin testler.) [BTW Onlara yorum yaptığımda sıklıkla q'lara oy vermeyi unuturum .]
Scortchi - Monica'yı eski durumuna döndürün

@Scortchi Geri bildiriminiz için teşekkür ederiz. Bazen soruyu iyi yapılandırıp yapılandırmadığımdan emin değilim, çünkü bunu kendim inceliyorum.
Denizde yaşlı bir adam.

2
Sen tanımlamalıdırMX
Taylor

Yanıtlar:


7

Regresyon katsayılarının bilindiği ve sıfır hipotezinin basit olduğu durumda ilk çalışmanın daha kolay olması. O zaman yeterli istatistik , burada artıktır; null altındaki dağılımı aynı zamanda ile ölçeklendirilmiş bir -kare şeklindedir ve serbestlik derecesi örnek boyutuna eşittir . z σ 2 0 nT=Σz2zσ02n

Olasılıkların oranını & ve bunun herhangi bir için artan bir işlevi olduğunu onaylayın : σ = σ 2 T σ 2 > σ 1σ=σ1σ=σ2Tσ2>σ1

Günlük olabilirlik oranı işlevi ve olduğunda pozitif gradyanlı ile doğrudan orantılıdır .Tσ2>σ1

(σ2;T,n)-(σ1;T,n)=n2[günlük(σ12σ22)+Tn(1σ12-1σ22)]
Tσ2>σ1

Karlin-Rubin teoremi ile tek kuyruklu testlerin her biri vs & vs eşit olarak en güçlü olanıdır. Açıkçası ve UMP testi yoktur . Bahsedildiği gibi burada hem tek kuyruklu testler yürüten ve her iki kuyrukları eşit büyüklükte ret bölgelerle yaygın kullanılan teste çoklu karşılaştırmalar düzeltme potansiyel uygulanarak, & onunla bu ya iddia ne zaman kesileceği oldukça makul null reddettiğinizde veya bu .H A : σ < σ 0 H 0 : σ = σ 0 H A : σ < σ 0 H 0 : σ = σ 0 H A : σ σ 0 σ > σ 0 σ < σ 0'H0:σ=σ0'Hbir:σ<σ0'H0:σ=σ0'Hbir:σ<σ0'H0:σ=σ0'Hbir:σσ0σ>σ0σ<σ0

Sonra altındaki olasılıkların oranını, ve için maksimum olabilirlik tahminini : σ σ = σ 0σ=σ^σσ=σ0

Şöyle , logaritmik değeri oranı Test istatistiği( σ ;T,n)-(σ0;T,n)=n-σ^2=Tn

(σ^;T,n)-(σ0;T,n)=n2[günlük(nσ02T)+Tnσ02-1]

Bu, verilerin üzerinden ne kadar desteklediğini ölçmek için iyi bir istatistiktir . Olabilirlik-oran testinin tersine çevrilmesinden oluşan güven aralıkları, aralık içindeki tüm parametre değerlerinin dışarıdakilerden daha yüksek olma ihtimaline sahip olduğu çekici özelliğe sahiptir. Log-olabilirlik oranının iki katının asimptotik dağılımı iyi bilinmektedir, ancak kesin bir test için, dağılımını çözmeye çalışmanıza gerek yoktur - sadece her kuyrukta karşılık gelen değerlerinin kuyruk olasılıklarını kullanın .H 0 : σ = σ 0 T'Hbir:σσ0'H0:σ=σ0T

Tekdüze en güçlü sınamaya sahip olamıyorsanız, null değerine en yakın alternatiflere karşı en güçlü sınamayı isteyebilirsiniz. - skor işlevi ile ilgili log-olasılık fonksiyonunun türevini bulun :σ

d(σ;T,n)dσ=Tσ3-nσ

Büyüklüğünü değerlendirmek, yerel olarak en güçlü ve . Test istatistiği aşağıda sınırlandırıldığı için, küçük örneklerle ret bölgesi üst kuyruğa sınırlandırılabilir. Yine, kare skorunun asimptotik dağılımı iyi bilinmektedir, ancak LRT ile aynı şekilde kesin bir test alabilirsiniz.H 0 : σ = σ 0 H A : σ σ 0σ0'H0:σ=σ0'Hbir:σσ0

Başka bir yaklaşım, dikkatinizi tarafsız testlerle sınırlamaktır, yani herhangi bir alternatif altındaki gücün boyutu aştığı testler. Yeterli istatistiğin üstel ailede bir dağılımı olduğunu kontrol edin; eğer bir testi, eğer veya , başka , ϕ ( T ) = 1 T < c 1 T > c 2 ϕ ( T ) = 0 E ( ϕ ( T ) )αφ(T)=1T<c1T>c2φ(T)=0

E(φ(T))=αE(Tφ(T))=αET

Bir çizim, eşit kuyruk alanları testindeki ve nasıl ortaya çıktığı sapmalarını göstermeye yardımcı olur:

Alternatiflere karşı testin gücü grafiği

Değerleri de biraz fazla üst kuyruk reddi reddinde düşen Test istatistikleri artan olasılığı onun alt-kuyruk reddetme bölgesi ve gücüne düşme düşük olasılık telafi etmez Test boyutunun altına düşer.σ 0σσ0

Tarafsız olmak iyidir; ancak alternatifin içindeki parametre boşluğunun küçük bir bölgesi üzerindeki büyüklükten biraz daha düşük bir güce sahip olmanın, bir testi tamamen ekarte etmek kadar kötü olduğu açık değildir.

Yukarıdaki iki kuyruklu testlerden ikisi çakışır (bu durumda, genel olarak değil):

LRT, nötr testler arasında UMP'dir. Bunun doğru olmadığı durumlarda LRT hala asemptolojik olarak tarafsız olabilir.

Bence, tek kuyruklu testler bile kabul edilebilir, yani tüm alternatifler altında daha güçlü veya daha güçlü bir test yoktur - testi bir yöne göre alternatiflere karşı daha güçlü hale getirebilirsiniz, ancak diğerine alternatiflere karşı daha az güçlü hale getirebilirsiniz. yön. Örnek boyutu arttıkça, ki kare dağılımı daha fazla simetrik hale gelir ve tüm iki kuyruklu testler aynı olur (kolay eşit kuyruklu testi kullanmanın bir başka nedeni).

Bileşik sıfır hipotezi ile argümanlar biraz daha karmaşık hale gelir, ancak bence hemen hemen aynı sonuçları alabilirsiniz, mutatis mutandis. Tek kuyruklu testlerden birinin değil diğerinin UMP olduğunu unutmayın!


Scortchi Cevabınız için teşekkürler. Yine de bazı şüphelerim var. İlk olarak, aşağıdaki cümle hakkında biraz daha ayrıntı verebilir misiniz? «Birden fazla karşılaştırma düzeltmesi uygulamak, her iki kuyrukta eşit boyutta reddetme bölgeleriyle yaygın olarak kullanılan sınamaya yol açar ve σ> σ0 veya null değerini reddettiğinizde σ <σ0 olduğunu iddia etmek oldukça mantıklıdır.» Ayrıca neden makul olduğunu söylüyorsun? Sanırım yanılmıyorsam sorumun özü bu. ;)
Denizde yaşlı bir adam.

Bu paragrafı sizden bağlantılı cevaptan okudum, ama iyi anlamadım «En düşük tek kuyruklu p değerini ikiye katlamak, iki tek kuyruklu testi gerçekleştirmek için çoklu karşılaştırma düzeltmesi olarak görülebilir.» Lütfen biraz daha açıklayabilirseniz minnettar olurum. ;)
Denizde yaşlı bir adam.

Bkz. Bonferroni düzeltmesi . İki ayrı boyutta testi gerçekleştirirseniz, aileye uygun Tip I hatası değerinden fazla değildir ve ret bölgeleri birbirinden ayrıldığında tam olarak . Eşit kuyruk alanları testinin bu şekilde görülebileceğini belirtmek istedim çünkü insanlar bazen bunu kullanmanın tek nedeninin diğer testlere hesaplama ve yaklaşım kolaylığı olduğunu düşünüyor gibi görünüyor. Aslında her testin kendi mantığı vardır: bu yüzden bunun sorunuzun özü olduğunu söyleyemem; bu kurslar için bir at meselesi. α/2αα
Scortchi - Eski durumuna getir Monica

1

Bu durumda, alternatif bilateral kompozit hipotez olmakla birlikte genellikle UMP testi yoktur.

Bunun genel olarak doğru olup olmadığından emin değilim. Elbette, klasik sonuçların birçoğu (Neymon-Pearson, Karlin-Rubin) ya basit ya da tek taraflı hipoteze dayanır, ancak iki taraflı kompozit hipoteze genellemeler vardır. Bununla ilgili bazı notlar ve burada daha fazla tartışma bulabilirsiniz .

Sorununuz için özel olarak, bir UMP testinin olup olmadığını bilmiyorum. Ancak sezgisel olarak, 0-1 kaybı altında, tek taraflı bir testin muhtemelen kabul edilemeyeceği ve bu nedenle kabul edilebilir test sınıfının tüm iki taraflı testler olacağı anlaşılmaktadır. İki taraflı testlerin sınıfını verin, amaç bir modu etrafında miktarları seçerek otomatik olarak gerçekleşmesi gereken en büyük güce sahip olanı bulmaktır . (Bunların hepsi sezgiye dayanır).χ2


3
Açıkça bile yok tekdüze çünkü farklı yönlere belli alternatiflere karşı en güçlü değişik testlerin varlığı bu durumda en güçlü testi . Güç açısından tanımlanan bir "en iyi" test için, tüm tarafsız testlerin veya tüm değişmez testlerin aynı şekilde en güçlü testini aramanız gerekir ; veya yerel olarak en güçlü test için; ya da bunun gibi bir şey - ve belki de kabul edilebilir herhangi bir test için sonuçlanır. σ0
Scortchi - Eski durumuna getir Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.