Yeterince büyük örneklem büyüklüğü verildiğinde, gerçek etki büyüklüğü tam olarak sıfır olmadıkça bir test her zaman önemli sonuç gösterecektir. Niye ya?


21

Wikipedia'nın makalesinde, etki büyüklüğüyle ilgili bir iddiada bulunmaktan korkuyorum . özellikle:

[...] boş olmayan bir istatistiksel karşılaştırma, popülasyon etki büyüklüğü tamamen sıfır olmadıkça her zaman istatistiksel olarak anlamlı sonuçlar gösterecektir.

Bunun ne anlama geldiği / ne anlama geldiğinden emin değilim, onu destekleyecek bir tartışma bırakalım. Sonuçta, bir etkinin bir istatistiği, yani bir numuneden hesaplanan, kendi dağılımına sahip bir değeri olduğunu tahmin ediyorum. Bu, etkilerin hiçbir zaman yalnızca rastgele değişimlerden kaynaklanmadığı anlamına mı geliyor? O zaman sadece etkinin yeterince güçlü olup olmadığını düşünüyor muyuz - mutlak değeri yüksek?

En aşina olduğum etkiyi düşünüyorum: Pearson korelasyon katsayısı r bununla çelişiyor gibi görünüyor. Neden herhangi bir istatistiksel olarak anlamlı olsun? Eğer eden regresyon çizgisi küçük r y = a x + b = r ( s yrr

y=ax+b=r(sysx)=ϵx+b

İçin küçük, sıkı 0, bir F-testi olası eğim 0 içeren aralık güven ihtiva edecektir. Bu bir karşı örnek değil mi?ϵ


10
İpucu: Alıntılanan bölümden önceki bölüm şart. " Yeterince büyük bir örneklem büyüklüğü verildiğinde , boş olmayan bir istatistiksel karşılaştırma, nüfus etki büyüklüğü tamamen sıfır olmadıkça her zaman istatistiksel olarak anlamlı sonuçlar gösterecektir…"
Kodiolog

@Kodiolog: Fakat benim örneğime göre bu, örneklem büyüklüğü daha büyük olsaydı, o zaman r'nin kendisinin de büyük olacağını, ya da en azından ifadesinin , örnek büyüklüğü daha büyük olsaydı daha büyük olacağı anlamına mı gelirdi? Ben görmüyorum r(sy/sx)
gary

5
Bu doğru olmasaydı, istatistiksel yöntemdeki bir kusur olurdu. Eğer , mutlaka bazı örnek büyüklüğü farkı tespit etmek için yeterince büyük olduğunu. μ>μ0
John Coleman

Yanıtlar:


26

Basit bir örnek olarak, bazı istatistiksel mumbo jumbo kullanarak boyunuzu tahmin ettiğimi varsayalım.

Her zaman başkalarına 177 cm (5 ft 10 inç) olduğunu söylemiştiniz.

Bu hipotezi test edersem (yüksekliğiniz 177 cm, eşittir) ve ölçümümdeki hatayı yeterince azaltabilirsem, aslında 177 cm olmadığını kanıtlayabilirim . Sonunda, boyunuzu yeteri kadar ondalık basamağa kadar tahmin edersem, neredeyse kesinlikle 177.00000000 cm belirtilen yükseklikten sapabilirsiniz. Belki de 177.02 cm; 177 cm olmadığını anlamak için sadece hatayı 02.0'ın altına düşürmem gerekiyor.h=177

İstatistiklerdeki hatayı nasıl azaltabilirim? Daha büyük bir örnek al. Yeterince büyük bir örnek alırsanız, hata o kadar küçük olur ki boş hipotezden en küçük sapmaları saptayabilirsiniz.


2
Bu çok açık ve özlü bir açıklamadır. Bunun neden olduğunu anlamak için daha matematiksel cevaplardan daha büyük olasılıkla daha faydalı olur. Aferin.
Kimse

1
Güzel bir şekilde açıklanmış, ancak belirtilen değerin gerçekten tam olduğu durumlar olduğunu düşünmenin de önemli olduğunu düşünüyorum. Örneğin, sicim teorisinde vb. Olan garip şeyleri bir kenara koymak, evrenimizin (yapılabilecek) mekansal boyutlarının sayısının bir ölçüsünü 3 verecek ve bu ölçümü ne kadar hassas yaparsanız yapın, hiçbir zaman tutarlı bir şekilde 3'ten istatistiksel olarak anlamlı sapmalar bulamazsınız. Tabii ki yeterli süreyi test etmeye devam ederseniz, sadece sapma nedeniyle bazı sapmalar elde edersiniz, ama bu farklı bir konudur.
David Z,

Muhtemelen naif bir soru ama 177 cm olduğumu iddia edersem, önemli basamak kavramı sadece 176,5 ile 177,5 arasında olduğumu söylediğim anlamına gelmiyor mu? Cevap doğru, iyi bir teorik kavram veriyor gibi görünüyor, fakat yanlış bir öncül değil mi? Neyi kaçırıyorum?
JimLohse,

Bu durumda, 177'nin belirtilen yüksekliği istatistikteki boş hipoteze benzemektedir. Eşitlik için geleneksel hipotez testinde, bir eşitlik beyanı yaparsınız (örneğin ). Mesele şu ki, boyunuzu ne olursa olsun, null hipotezi tam olarak doğru değilse, hatayı azaltarak ispat edebilirim. Yüksekliği anlaşılması kolay bir örnek olarak kullandım, ancak bu kavram diğer alanlarda da aynı (madde x kansere neden olmaz, madeni para adil, vb.) μ=177
Aynıdır

13

@Kodiologist'in işaret ettiği gibi, bu gerçekten büyük örneklem büyüklüğü için olanlarla ilgilidir. Küçük örneklem büyüklükleri için yanlış pozitif veya yanlış negatif olmamanızın bir nedeni yoktur.

Bence testi asimptotik vakayı netleştiriyor. Elimizdeki varsayalım x 1 , ... , x , n IID ~ N ( μ , 1 ) ve bir test istiyoruz H 0 : μ = 0 vs H A : u 0 . Test istatistiklerimiz Z n = ˉ X n - 0zX1,,XniidN(μ,1)H0:μ=0HA:μ0

Zn=X¯n01/n=nX¯n.

yaniZn=X¯nN(μ,1n). P(|Zn|α)ile ilgileniyoruz. P(|Z, n|α)=P(Z, n-α)+P(ZNα)=1+Φ(-α-uZn=nX¯nN(μn,1)P(|Zn|α)

P(|Zn|α)=P(Znα)+P(Znα)
Let, Y~N(0,1)Referans değişken. Altında, H0μ=0Elimizdeki böyleceP(|Z, n|α)=1-P(-αYα)biz seçebilmesiαarzu olarak tip hata oranını kontrol etmek için. Ancak altındalHBiru
=1+Φ(αμn)Φ(αμn).
YN(0,1)H0 μ=0P(|Zn|α)=1P(αYα)αHA yüzden , P(|Z, n|a)1+Φ(±∞ iken)-Φ(±∞ iken)=1 ret olacaktır olasılık 1 ile çokH0iseu0(±söz konusu olduğu durumda^ ı<0, ancak her iki şekilde de sonsuzluklar aynı işarete sahip olur).μn0
P(|Zn|α)1+Φ(±)Φ(±)=1
H0μ0±μ<0

μ 0μ01nHA1n

H0:ρ=ρ0HA:ρρ01


1
μ<0 - ∞ iken ∞ ikenZn

1
Güzel, ama durumunda ne olacağı, daha "hızlı" olup olmamasına bağlı olmalı , değil mi? Bir rastgele değişkenler dizisi ve bir tam sayı dizisi için yakınsama oranını nasıl “karşılaştıracağınızdan” bile emin değilim - muhtemelen Slutsky teoremi veya bunun gibi bir şey uygulanmalıdır. ˉ Xp 0 μ=0X¯p0n
DeltaIV

1
@DeltaIV, doğru, yakınsama oranı farklı olsaydı, dejenere olmayan bir boş dağılım elde etmek için farklı bir ölçeklemeye ihtiyaç duyulurdu. Ancak bu örnek için root-n doğru orandır.
Christoph Hanck

1
0nX¯ clt standart bir normal yakınsak, yok etmek . 0
erkek

7

Muhtemelen ne söyledi ise eğer "bu kullanımlarını dışında başka bir nedenle, yanlış hep olur".

Bu karışıklık püf noktası ise bilmiyorum sen ediyoruz sahip ama birçok do düşünmek ve bu karıştı alacak çünkü onu göndeririz:

" olur yeterince büyük olduğu"n Xn does DEĞİL ortalama "Eğer ardından ".n > n 0 Xn>n0X

Aksine, .limnPr(X)=1

Kelimenin tam anlamıyla söylediklerini şuna çevirir:

Herhangi bir numune boyutu için minimum bir boyutu yukarıda doğru etki büyüklüğü tam olarak sıfır ise, herhangi bir boş olmayan testinin sonucu önemli olduğu garanti edilir.n 0nn0

Onlar ne çalışıyor demek olsa da, şudur:

Herhangi bir önem seviyesi için, örneklem büyüklüğü arttıkça, boş olmayan bir testin gerçek sonuç büyüklüğü tam olarak sıfır değilse 1'e önemli bir sonuç verme olasılığı ortaya çıkar.

Burada çok önemli farklılıklar var:

  • Garanti yok. Daha büyük bir örnekle yalnızca önemli bir sonuç elde etmeniz daha olasıdır . Şimdi, burada suçlamanın bir kısmını atlayabilirler, çünkü şu ana kadar sadece bir terminoloji sorunu var. Bir olasılık bağlamda, bir deyim anlaşılmaktadır "n yeterince büyük olduğunda X ise" olabilir ayrıca anlamında yorumlanmalıdır "X olarak doğru olduğuna daha da yatkın hale gelir n büyük büyür" .
    Ancak bu yorum, "her zaman" olduğunu söyledikleri anda penceremden çıkar. Burada uygun terminoloji bunun " yüksek olasılıkla " olduğunu söylerdi 1 .

  • Bu ikincildir, ancak ifadeleri kafa karıştırıcıdır; bu, örneklem büyüklüğünüzü "yeterince büyük" olarak sabitlediğiniz anlamına gelir ve daha sonra ifade, herhangi bir anlamlılık düzeyi için de geçerlidir. Ancak, kesin matematiksel ifadenin ne olduğuna bakılmaksızın, bu gerçekten mantıklı gelmiyor: her zaman önce anlamlılık seviyesini belirlersiniz ve sonra yeterince büyük olacak şekilde örnek boyutunu seçersiniz.
    Ama her nasılsa başka bir yol olabileceğini öneri etrafında maalesef vurgulayan "yeterince büyük", yorumlanması böylece daha da kötü Yukarıdaki sorunu yapar.n>n0

Ama bir kez edebiyatı anladıktan sonra, söylemeye çalıştıkları şeyi elde edersiniz.

(Not: bu arada, bu, pek çok insanın Wikipedia'da yaşadığı sorunların aynısıdır. Sık sık, sadece malzemeyi zaten biliyorsanız ne söylediklerini anlamak mümkündür, bu nedenle sadece bir referans veya hatırlatma olarak iyi öz-öğretim materyali olarak değil.)

1 Diğer meslektaşlarımız için (merhaba!), Evet, terimin bağlantılı olduğumdan daha özel bir anlamı var. Muhtemelen burada istediğimiz en zayıf teknik terim "asimptotik olarak neredeyse kesindir" . Buraya bakınız .


"Boş olmayan bir testin gerçek sonuç büyüklüğü tam olarak sıfırsa 0'a önemli bir sonuç vermesi olasılığı 0'a yaklaşıyor" tam olarak doğru olmayabilir: eğer test anlamlılık seviyesine sahipse, o zaman önemli bir sonuç elde etme olasılığı olabilir veya tüm örneklem büyüklüklerindeααα
Henry

@ Henry: Oh vur, haklısın! O kadar hızlı yazdım ki düşünmeyi bırakmadım. Bir ton teşekkürler! Düzelttim. :)
Mehrdad

3

En sevdiğim örnek cinsiyete göre parmak sayısı. İnsanların büyük çoğunluğunda 10 parmak var. Bazıları kaza nedeniyle parmaklarını kaybetti. Bazılarının ekstra parmakları var.

Erkeklerin kadınlardan daha fazla parmağı olup olmadığını bilmiyorum (ortalama olarak). Kolayca elde edilebilecek tüm kanıtlar, kadın ve erkeklerin her ikisinde de 10 parmağın olduğunu gösteriyor.

Bununla birlikte, eğer tüm erkek ve tüm kadınlardan bir nüfus sayımı yaparsam, bir cinsiyetin diğerinden daha fazla parmağa (ortalama) sahip olacağından eminim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.