Ağır kuyruklu dağıtılmış bir işlemin önemli ölçüde iyileşip iyileşmediğini belirleyin


12

Sürecin değişiklikle düzelip düzelmediğini öğrenmek için bir değişiklikten önce ve sonra bir işlemin işlem sürelerini gözlemliyorum. İşlem süresi kısalırsa süreç iyileşmiştir. İşlem süresinin dağılımı yağ kuyrukludur, bu nedenle ortalamaya göre karşılaştırma mantıklı değildir. Bunun yerine, değişiklikten sonra daha düşük bir işlem süresi gözlemleme olasılığının önemli ölçüde% 50'nin üzerinde olup olmadığını bilmek istiyorum.

, değişiklikten sonraki işlem süresi ve önceki işlem için rastgele değişken olsun . Eğer belirgin üzerinde sonra işlem geliştirdi say.Y, P ( x < Y ) 0.5XYP(X<Y)0.5

Şimdi var gözlemler ait ve gözlemler ait . Gözlenen olasılığı olan .X i X, m, y j -Y P ( x < Y ) p = 1nxiXmyjYP(X<Y)p^=1nmij1xi<yj

Hakkında Ne söyleyebilirim gözlemleri verilen ve ?x i y jP(X<Y)xiyj

Yanıtlar:


12

Tahmininiz , Mann-Whitney istatistiğine (teşekkürler, Glen!) Bölünmesine eşittir ve bu nedenle Wilcoxon rank-sum istatistiği (Wilcoxon-Mann-Whitney istatistiği olarak da bilinir) ile eşdeğerdir : ; burada , örnek büyüklüğüdür (bağ olmadığı varsayılır.) Bu nedenle Wilcoxon testinin tablolarını / yazılımını kullanabilir ve bunları tekrar dönüştürebilirsiniz. güven aralığı veya değeri almak için.p^UmnWW=U+n(n+1)2nyUp

, = örnek büyüklüğü olsun . Sonra asimptotik olarak,mxNm+n

W=Wm(N+1)2mn(N+1)12N(0,1)

Kaynak: Hollander ve Wolfe , Parametrik Olmayan İstatistiksel Yöntemler, kabaca s. 117, ama muhtemelen parametrik olmayan istatistik kitaplarının çoğu sizi oraya götürecektir.


@Glen_b - teşekkürler, cevabı güncelledim. Orada hata nedeni hakkında yapılan çok cömert tahmin!
jbowman

13

@jbowman, stres mukavemeti modeli olarak bilinen tahmini problemine standart bir çözüm sunar .θ=P(X<Y)

ve bağımsız olduğu durumda Baklizi ve Eidous'ta (2006) başka bir parametrik olmayan alternatif önerilmiştir . Bu aşağıda açıklanmaktadır.XY

Tanım gereği

θ=P(X<Y)=FX(y)fY(y)dy,

burada , ve , yoğunluğudur . Daha sonra, numune ile ve alırız çekirdek tahmin edicileri arasında ve ve bunun sonucu olarak ve kestirimcisiFXXfYYXYFXfYθ

θ^=F^X(y)f^Y(y)dy.

Bu, aşağıdaki R kodunda bir Gauss çekirdeği kullanılarak uygulanır.

# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}

# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
} 

KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
} 

# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))  
}

# Example when X and Y are Cauchy
datx = rcauchy(100,0,1)
daty =  rcauchy(100,0,1)

nonpest(datx,daty)

için bir güven aralığı elde etmek için bu tahmin edicinin bir önyükleme örneğini aşağıdaki gibi alabilirsiniz.θ

# bootstrap
B=1000
p = rep(0,B)

for(j in 1:B){
dat1 =  sample(datx,length(datx),replace=T)
dat2 =  sample(daty,length(daty),replace=T)
p[j] = nonpest(dat1,dat2)
}

# histogram of the bootstrap sample
hist(p)

# A confidence interval (quantile type)
c(quantile(p,0.025),quantile(p,0.975))

Diğer bootstrap aralıkları da düşünülebilir.


2
İlginç ve iyi bir kağıt referansı (+1). Ben repertuarıma ekleyeceğim!
jbowman

0

Eşleştirilmiş fark göz önünde , o için edilir IID Bernoulli rastgele değişkenler. Sayısı Yani ve binom olan . O zaman olasılık ve güven aralıklarının tarafsız bir tahminidir ve binom temel alınarak hipotez testleri yapılabilir.XiYiP(XiYi<0)=pI{XiYi<0}i=1,2,..,nXXi<Yin p=P(XiYi<0)X/n


2
Eşleştirmenin temeli nedir, Michael?
whuber

OP, "X, değişiklikten sonraki işlem süresi için rastgele değişken olsun ve Y'den önce bir tane olsun" dedi.
Michael R. Chernick

Sayımların (potansiyel olarak) farklı olduğunu fark ettiniz mi? Görünüşe göre . Benim okuma bir "işlem" zamansal ve bir olaydan önce örnek ve bir olaydan sonra örnek olmasıdır. m=nXiYj
whuber

1
Haklısın. Yukarıda jbowman tarafından önerilen Wilcoxon gibi bir tür iki örnek testi uygun olacağını düşünüyorum. Testteki Mann-Whitney formunun Xis <Yjs sayısını sayması ilginçtir.
Michael R.Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.