Z-skorları ile p-değerleri arasındaki fark nedir?


11

Ağ motifi algoritmaları, bir hem döndürmek için oldukça yaygın görünüyor p değeri ve Z-skoru "Giriş ağ subgraph G X kopyalarını içerir" a istatistik için. Bir alt çizgi tatmin ederse bir motif olarak kabul edilir

  • p değeri <A,
  • Z skoru> B ve
  • X> C, bazı kullanıcı tanımlı (veya topluluk tanımlı) A, B ve C için.

Bu şu soruyu motive eder:

Soru : p değeri ve Z skoru arasındaki farklar nelerdir?

Ve sorgulama:

Soru : Aynı istatistiğin p-değeri ve Z-puanının zıt hipotezler önerebileceği durumlar var mı? Yukarıda listelenen birinci ve ikinci koşullar temelde aynı mıdır?

Yanıtlar:


9

Sorunuza dayanarak, üç test arasında fark olmadığını söyleyebilirim. Bu, hangi kriteri kullandığınızdan bağımsız olarak aynı karara varılacak şekilde her zaman A, B ve C'yi seçebileceğiniz anlamındadır. Her ne kadar p değerinin aynı istatistiğe (yani Z skoruna) dayanması gerekiyorsa

Z-skorunu kullanmak için, hem ortalama hem de varyans bilindiği varsayılır ve dağılım normal kabul edilir (veya asimptotik / yaklaşık normal). Diyelim ki p değeri kriteri normal% 5'tir. Sonra elimizde:σ 2μσ2

p=Pr(Z>z)<0.05Z>1.645Xμσ>1.645X>μ+1.645σ

Yani hepsi aynı kesme değerlerini temsil eden üçlü var.(0.05,1.645,μ+1.645σ)

Sayılar farklı olsa da, aynı yazışmanın t-testi için geçerli olacağını unutmayın. İki kuyruk testi de benzer bir yazışmaya sahip olacak, ancak farklı sayılarla.


Bunun için teşekkürler! (ve diğer cevaplayanlara da teşekkürler).
Douglas S. Stones

8

Bir -score standart sapma birimi cinsinden ortalama adresinin sapmayı açıklamaktadır. Sıfır hipotezinizi kabul edip etmeme konusunda açık değildir.Z

Bir -değeri geçersiz hipoteze göre biz istatistik gibi aşırı uçta olan bir noktayı gözlemlemek olabilir olasılığıdır. Bu, açıkça bir test boyutu sıfır hipotezinizi reddettiğinizi veya kabul edip etmediğinizi .αpα

ve sıfır hipotezinin olduğu bir örnek düşünün . Sonra gözlemlersiniz . Sizin -score 5'tir (sadece açısından sizin sıfır hipotezinin sapma ne kadar anlatır ki ) ve -değeri 5.733e-7'dir. % 95 güven için, test boyutuna sahip olacaksınız ve olduğundan boş hipotezi reddedeceksiniz. Ancak herhangi bir istatistik için, testlerin aynı olacağı şekilde eşdeğer ve olmalıdır .μ = 0 x 1 = 5 Z σ p α = 0.05 p < α A BXN(μ,1)μ=0x1=5Zσpα=0.05p<αAB


3
@Gary - p değeri size Z puanını reddetmenizi ya da daha fazlasını reddetmenizi söylemez. Onlar sadece rakamlardır. Kabul etmeyi veya reddetmeyi belirleyen karar kuralıdır. Bu karar kuralı, Z skoru açısından eşit derecede iyi tanımlanabilir (örneğin, veya kuralı)3 σ2σ3σ
olasılık

@probabilityislogic Sana katılıyorum. Gerçekten de, skor eşiğine dayalı bir test oluşturabilirsiniz, ancak klasik anlamda (yani olasılık açısından) açıkça bir test boyutu tanımlamanıza izin vermez. Dağıtımınızın kalın kuyrukları varsa, bu tür kriterler sorun olabilir. Bir test oluşturduğunuzda, açıkça bir test boyutu tanımlarsınız ve bu nedenle değeri, kabul etmeye veya reddetmeye karar verirseniz, bu da yapmaya çalıştığım noktadır. pZp
Gary

@gary - tam olarak değil, çünkü p değeri alternatiflere atıfta bulunmaz. Dolayısıyla alternatifleri doğrudan karşılaştırmak için kullanılamaz. Örneğin, karşı . için p değeri aynı kalır . Yani "null değerini reddet", "alternatifi kabul et" anlamına gelir ve . Ama bu çok saçma, kimse bunu yapmaz, ama burada kullandığınız p-değeri kuralı bunu yapar. Başka bir deyişle, açıkladığınız p-değeri kuralı, "sıfır hipotezi" (çözünürlük geliyor) olarak adlandırılana göre değişmez değildir, H A : μ = - 1 H 0 5 x 10 - 7 μ = - 1H0:μ=0HA:μ=1H05×107μ=1
olasılık

Görünen saçmalıkların çözümü, p-değerinin "mutlak" bir test değil, örtük bir alternatif hipotezle tanımlanan göreceli bir test olduğuna dikkat çeker. Bu durumda, örtük alternatif . Ne p-değerini hesaplamak eğer işaret ederek görebilirsiniz alıyorum p-değerinden daha küçük, hangi . Şimdi bu örnekte, "örtük alternatif" sezgiyle bulmak kolaydır, ancak rahatsızlık parametrelerinin veya yeterli istatistiğin olmadığı daha karmaşık problemlerde bulmak çok daha zordur. , H bir 1 x 10 - 9 H 0Himp:μ=5HA1×109H0
olasılık

1
@Gary - p değeri sadece bir olasılık olduğu için daha titiz değildir. Z-skorunun monotonik bire bir dönüşümüdür. p-değerinin sahip olduğu herhangi bir "titreme" de Z-skoruna sahiptir. İki taraflı bir test kullanıyorsanız, eşdeğer Z-skorunun mutlak değeridir. Ve ile null değerini karşılaştırmak için, bir "minimax" yaklaşımını benimsemeniz gerekir: bu, veriler tarafından en çok desteklenen ve ile tutarlı olan keskin hipotezi . H 1 P ( X | μ 1 )H1:μ0H1P(X|μ1)
probabilityislogic

6

zp değeri istatistiğin ne kadar düşük olduğunu gösterir. -score ortalamadan ne kadar uzakta olduğunu gösterir. Örneklem büyüklüğüne bağlı olarak aralarında bir fark olabilir.z

Büyük numuneler için ortalamadan küçük sapmalar bile olası değildir. Yani değeri, düşük puanı için bile çok küçük olabilir . Tersine, küçük örnekler için büyük sapmalar bile olası değildir. Yani büyük bir puanı mutlaka küçük bir değeri anlamına gelmez .z z ppzzp


örnek boyutu büyükse, standart sapma küçük olacaktır, bu nedenle Z skoru yüksek olacaktır. Sayısal bir örnek denediyseniz bunu keşfedebilirsiniz.
olasılık

1
Pek sayılmaz. N (0, 1) 'den örnek alın. Sonra std örnek boyutundan bağımsız olarak yaklaşık 1 olacaktır. Daha küçük olacak olan standart sapma değil, ortalamanın standart hatasıdır. p-değerleri std'ye değil SEM'ye dayanmaktadır.
SheldonCooper

Z-skoru (gözlenen-ortalama) / (standart sapma) 'dır. Ancak, ortalama ve standart sapma, bileşenlerinin çizildiği popülasyondan değil, gözlenen istatistikten kaynaklanmaktadır. Gevşek terminolojim burada yakalandı. Bununla birlikte, ortalamayı test ediyorsanız, Z skorundaki uygun standart sapma, standart p'dir ve bu da p değeri ile aynı oranda küçülür.
olasılık
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.