Durbin-Watson dışında, hangi hipotez testleri sonuçsuz sonuç verebilir?


10

Durbin-Watson test istatistiği bu reddetme veya (sıfır otokorelasyon, bu durumda) hipotezini reddetmek için başarısız ya hiç mümkün değildir yetersiz bir bölgede, arasında olabilir.

Başka hangi istatistiksel testler "sonuçsuz" sonuçlar verebilir?

Bu test grubunun neden ikili "reddetme" / "reddetme" kararı veremediğine dair genel bir açıklama var mı (el sallama gayet iyi)?

Birisi ikinci soruya verdikleri cevabın bir parçası olarak karar teorik çıkarımlarından bahsedebilirse bir bonus olur - ek bir (in) sonuç kategorisinin varlığı, Tip I ve Tip II'nin maliyetlerini dikkate almamız gerektiği anlamına mı gelir? daha karmaşık bir şekilde?


2
Biraz konu dışı, ancak rastgele testlerde böyle bir lezzet var. Verilerin bazı değerleri için, kabul etme ve reddetme konusunda rasgele seçmeniz gerekir.
Christoph Hanck

@ChristophHanck teşekkürler, bu fark etmeyeceğim ilginç bir bağlantıydı. Neyi planladığım gibi değil, ama soruyu bir yakalama tümüyle umuduyla kasten belirsiz tutuyordum - cevaplara bağlı olarak daha sonra odağını sıkabilirim.
Silverfish

Yanıtlar:


10

Wikipedia makalesi geçersiz hipoteze göre test istatistiğinin dağılımı gerileme kullanılan belirleyici değerlerin tasarım matrisi-özellikle yapılandırmasına bağlı olduğunu açıklar. Durbin ve Watson pozitif otokorelasyon için deney için, belirli bir anlam seviyelerinde, reddetmelidirler altında istatistiksel test için alt sınır hesaplanan herhangi bir deney için eleme başarısız gereken fazla matrisinin, ve üst sınır , herhangi matrisinin. "Sonuçsuz bölge", kesin bir cevap almak için tasarım matrisinizi dikkate alarak kesin kritik değerleri hesaplamanız gereken bölgedir.

Benzer bir durum, sadece t-istatistiği bildiğiniz zaman tek örnekli tek kuyruklu bir t testi yapmak zorunda kalacak ve örnek boyutunu değil : 1.645 & 6.31 (sonsuz özgürlük derecelerine karşılık gelen ve sadece bir tane) 0.05 büyüklüğünde bir test için sınırlar.

Karar teorisine gelince, örnekleme varyasyonunun yanı sıra dikkate almanız gereken yeni bir belirsizlik kaynağınız var, ancak neden bileşik sıfır hipotezleriyle aynı şekilde uygulanmaması gerektiğini anlamıyorum. Oraya nasıl geldiğinizden bağımsız olarak, rahatsız edici bir parametresi bilinmeyen biriyle aynı durumdasınız; bu nedenle, tüm olasılıklar üzerinde Tip I hatasını kontrol ederken bir reddetme / tutma kararı vermeniz gerekiyorsa, muhafazakar bir şekilde reddedin (yani Durbin-Watson istatistiği alt sınırın altındaysa veya t-istatistiği 6.31'in üzerindeyse).

† Ya da belki de masalarınızı kaybettiniz; ancak standart bir Gauss için bazı kritik değerleri ve Cauchy kantil işlevinin formülünü hatırlayabilir.


(+1) Teşekkürler. Bunun Durbin-Watson testi için geçerli olduğunu biliyordum (sorumu gerçekten belirtmiş olmalıydım), ancak bunun daha genel bir fenomenin bir örneği olup olmadığını ve eğer öyleyse, hepsinin temelde aynı şekilde çalışıp çalışmadığını merak ettim. Benim tahminim, örneğin, sadece özet verilere erişime sahipken (bir regresyonda olması gerekmez) belirli testleri gerçekleştirirken olabileceğiydi, ancak DW, derlenmiş ve tablolanmış üst ve alt kritik değerleri gördüğümü hatırlayabildiğim tek durum . Soruyu nasıl daha iyi hedefleyebileceğim hakkında herhangi bir düşünceniz varsa, bu çok hoş olurdu.
Silverfish

İlk soru biraz belirsiz ("Başka hangi istatistiksel testler [...]?"), Ama ikincisine cevap vermeden açıklığa kavuştuğunuzu sanmıyorum ("Genel bir açıklama var mı [...]?") kendiniz - genel olarak bence durum iyi.
Scortchi - Monica'yı eski durumuna döndürün

7

Muhtemelen sonuçsuz olan bir testin başka bir örneği, sadece örneklem büyüklüğü değil, orantı mevcut olduğunda bir orantı için bir binom testidir. Bu tamamen gerçekçi değil - sık sık rapor edilen "insanların% 73'ü bunu kabul ediyor ..." şeklindeki iddialarını görüyor veya duyuyoruz.

Örneğin yalnızca örnek oranı bilmek varsayalım en yakın tam yüzde doğru yuvarlanır , ve deney isteyen karşı de düzeyinde.H 1 : π 0,5 α = 0,05H0:π=0.5H1:π0.5α=0.05

Gözlenen oranımız ise, gözlemlenen oran için örnek büyüklüğü en az 19 olmalıdır, çünkü en düşük paydaya sahip olan ve olacak şekilde kesirdir . Gözlemlenen başarı sayısının aslında 19 üzerinden 1, 20 üzerinden 1, 21 üzerinden 1, 22 üzerinden 1, 37 üzerinden 2, 38 üzerinden 2, 55 üzerinden 5, 5 1000'den 100 veya 50 ... ancak hangisi olursa olsun, sonuç düzeyinde anlamlı olacaktır .1p=5% %5α=0.051195%α=0.05

Öte yandan, örnek oranının olduğunu bilirsek, gözlemlenen başarı sayısının 100 üzerinden 49 (bu seviyede anlamlı olmaz) veya 10.000 üzerinden 4900 ( sadece önem kazanır). Yani bu durumda sonuçlar kesin değildir.p=49%

Not Bununla yuvarlak hatta: yüzde, bir bölge "red başarısız" olduğunu 2 denemeler: 1 başarı gibi 49,500 reddedilmesine neden olur 100,000 üzerinden başarıları, hem de numuneler gibi örnekleri ile tutarlıdır reddedilemez .H 0p=50%H0

Durbin-Watson testinden farklı olarak, yüzdeleri önemli olan tablo sonuçları görmedim; kritik durum için üst ve alt sınırlar olmadığından bu durum daha incedir. nin bir sonucu açıkça sonuçsuz olacaktır, çünkü bir denemede sıfır başarı önemsiz olacaktır, ancak bir milyon denemede hiçbir başarı çok önemli olmayacaktır. Daha önce nin sonuçsuz olduğunu ancak aralarında gibi önemli sonuçlar olduğunu gördük . Dahası, bir kesme olmaması sadece ve anormal vakalarından kaynaklanmaz . Biraz oynamak, değerine karşılık gelen en az önemli örnekp=0%p=50%p=5%p=0%p=100%p=16%19 örnekleminde , bu durumda yani anlamlı olacaktır; için biz önemsiz 6 çalışmalarda 1 başarılı olabilir, Bu durumda (açıkça diğer örnekleri vardır çünkü yetersiz yani hangi anlamlı olacaktır); için 11 çalışmalarda 2 başarılar olabilir (önemsiz ) bu durumda da kesin değildir, böylece; ancak için en az anlamlı örnek olan 19 çalışmada , bu yine önemlidir.Pr(X3)0.00221<0.025p=17%Pr(X1)0.109>0.025p=16%p=18%Pr(X2)0.0327>0.025p=19%Pr(X3)0.0106<0.025

Aslında ,% 5'in altında net bir şekilde anlamlı olmak için% 50'nin altında en yüksek yuvarlanmış yüzdedir (en yüksek p değeri, 17 denemede 4 başarı için olurdu ve sadece önemlidir), sonuçsuz olan en düşük sıfır olmayan sonuçtur (çünkü 8 denemede 1 başarıya karşılık gelebilir). Yukarıdaki örneklerden de görülebileceği gibi, aralarında olanlar daha karmaşıktır! Aşağıdaki grafiğin kırmızı çizgisi var : çizginin altındaki noktalar kesin olarak anlamlıdır, ancak üstündeki olanlar sonuçsuzdur. P-değerlerinin paterni, sonuçların açık bir şekilde anlamlı olması için, gözlemlenen yüzde üzerinde tek alt ve üst sınır olmayacak şekildedir.p=24%p=13%α=0.05

Bilinmeyen örnek büyüklüğü ile binom testinin en az anlamlı p değeri

R kodu

# need rounding function that rounds 5 up
round2 = function(x, n) {
  posneg = sign(x)
  z = abs(x)*10^n
  z = z + 0.5
  z = trunc(z)
  z = z/10^n
  z*posneg
}

# make a results data frame for various trials and successes
results <- data.frame(successes = rep(0:100, 100),
    trials = rep(1:100, each=101))
results <- subset(results, successes <= trials)
results$percentage <- round2(100*results$successes/results$trials, 0)
results$pvalue <- mapply(function(x,y) {
    binom.test(x, y, p=0.5, alternative="two.sided")$p.value}, results$successes, results$trials)

# make a data frame for rounded percentages and identify which are unambiguously sig at alpha=0.05
leastsig <- sapply(0:100, function(n){
    max(subset(results, percentage==n, select=pvalue))})
percentages <- data.frame(percentage=0:100, leastsig)
percentages$significant <- percentages$leastsig
subset(percentages, significant==TRUE)

# some interesting cases
subset(results, percentage==13) # inconclusive at alpha=0.05
subset(results, percentage==24) # unambiguously sig at alpha=0.05

# plot graph of greatest p-values, results below red line are unambiguously significant at alpha=0.05
plot(percentages$percentage, percentages$leastsig, panel.first = abline(v=seq(0,100,by=5), col='grey'),
    pch=19, col="blue", xlab="Rounded percentage", ylab="Least significant two-sided p-value", xaxt="n")
axis(1, at = seq(0, 100, by = 10))
abline(h=0.05, col="red")

(Yuvarlama kodu bu StackOverflow sorusundan alınmıştır .)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.