Fisher'ın z-dönüşümü ne zaman uygundur?


13

Örnek bir korelasyon p-değerlerini kullanarak anlam açısından test etmek istiyorum.r

H0:ρ=0,H1:ρ0.

Bunu hesaplamak için Fisher'ın z-dönüşümünü kullanabileceğimi anladım

zobs=n32ln(1+r1r)

ve p değerini

p=2P(Z>zobs)

standart normal dağılımı kullanarak.

Sorum şu: ne kadar büyük bu uygun bir transformasyon olması için olmalıdır? Açıkçası, 3'ten büyük olmalıdır. Ders kitabım herhangi bir kısıtlamadan bahsetmiyor, ancak bu sunumun 29. slaytında 10'dan büyük olması gerektiğini söylüyor. veriler için gibi bir şeyim olacak .n n 5 n 10nnn5n10


2
Ara sayfa listeleri standart hata verilir numune boyutu. Yani en az 4 tam çifte ihtiyacınız olacak. Örneklem büyüklüğü ile ilgili herhangi bir kısıtlamanın farkında değilim. 1 / zobs N1/N3N
COOLSerdash

8
Kendi üniversite adını yazamayan birinden gelen bir sunuma ne kadar güveneceğinden emin değilim. Daha ciddisi, işlerin belirli bir numune boyutunun üstünde olduğunu ve aksi takdirde korkunç olduğunu ima eden tüm tavsiyelere dikkat edin. Bu, örneklem büyüklüğü ile ve ayrıca verilerin dağılımına bağlı olarak sorunsuz bir şekilde artan bir yaklaşık kalite meselesidir. Basit tavsiye çok dikkatli olmak, her şeyi çizmek ve önyükleme yapılan güven aralıklarıyla çapraz kontrol etmektir.
Nick Cox

1
Slayt 17, özel durum için bir t-testini tanımlar . ρ=0
whuber

Yanıtlar:


8

Bu tür sorular için sadece bir simülasyon çalıştırır ve -değerlerinin beklediğim gibi davranıp davranmadığını görürüm . -değeri rasgele boş hipotezi doğruysa sapması bu veri olarak boş hipotezinden kadar en azından Eğer gözlenen bir örneği alınması olasılığıdır. Dolayısıyla, bu tür çok sayıda örneğimiz varsa ve bunlardan birinde değeri .04 olsaydı, bu örneklerin% 4'ünün .04'ten düşük bir değere sahip olmasını beklerdik. Aynı şey diğer tüm olası -değerleri için de geçerlidir .p p ppppp

Aşağıda Stata'da bir simülasyon var. Grafikleri olmadığını kontrol -değerleri onlar ölçmek için gereken ne ölçmek olduğunu, bunlar gösteriyor ne kadar örneklerin oranları -değerlerinin az Nominal daha , nominal gelen -değer Deviate'ların -değeri. Gördüğünüz gibi, test bu kadar az sayıda gözlemle biraz problemlidir. Araştırmanız için çok sorunlu olup olmadığı yargılama çağrınızdır.p p ppppp

clear all
set more off

program define sim, rclass
    tempname z se
    foreach i of numlist 5/10 20(10)50 {
        drop _all
        set obs `i'
        gen x = rnormal()
        gen y = rnormal()
        corr x y 
        scalar `z'  = atanh(r(rho))
        scalar `se' = 1/sqrt(r(N)-3)
        return scalar p`i' = 2*normal(-abs(`z'/`se'))
    }
end

simulate p5 =r(p5)  p6 =r(p6)  p7  =r(p7)     ///
         p8 =r(p8)  p9 =r(p9)  p10 =r(p10)    ///
         p20=r(p20) p30=r(p30) p40 =r(p40)    ///
         p50=r(p50), reps(200000) nodots: sim 

simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

resim açıklamasını buraya girin

simpplot p20 p30 p40 p50 , name(less_small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

resim açıklamasını buraya girin


1
:-) yerine 3 yerine 2.5 çıkarmayı deneyin . n
whuber

5

FWIW Myers & Well'teki önerisini görüyorum (araştırma tasarımı ve istatistiksel analizler, ikinci baskı, 2003, s. 492). Dipnot şunları ifade eder:N10

Açıkça söylemek gerekirse, dönüşümü miktarı ile önyargılıdır : bakınız Pearson ve Hartley (1954, s.29). Sürece bu eğilim genellikle önemsiz olacaktır küçüktür ve büyük ve biz burada bunu görmezden.r / ( 2 ( N - 1 ) ) N ρZr/(2(N1))Nρ


3
Bu bana bir cevap gibi görünüyor.
gung - Monica'yı eski

1

Bir Fisher'ın dönüşümünün burada uygun olup olmadığından emin değilim . For (Not: Boş hipotez nüfus için ise , değil örnek ) gerek Fisher'in budur, çarpıklık azaltmak, böylece korelasyon katsayısının örnekleme dağılımı, zaten simetriktir amaçları yapmak, ve Student yaklaşımını kullanabilirsiniz.zH0:ρ=0ρrzt

anlamına varsayarsak , bu PDF'nin çarpıklığı önerilen değerine bağlı olacaktır , bu nedenle ne kadar büyük olması gerektiği konusunda genel bir cevap olmayacaktır. Ayrıca, minimum değerleri üzerinde çalıştığınız önem seviyesine bağlıdır . Değerini belirtmediniz.H0:ρ=ρ00ρ0nnα

Nick'in noktası adil: Yaklaşımlar ve öneriler her zaman gri bir alanda çalışıyor.

, O zaman, Fisher yaklaşım iyi (= simetrik) yeterli ise, aşıp kullanmak için geçerli dağıtımı:, numune standart sapma. Normalliğe yeterince yakınsa, bu .n(tα/2s/ϵ)2tsn(1.96s/ϵ)2


4
Bence bu , kısmen matematiğin yanı sıra matematiğin bir amacı olan Fisher "amacını" da basitleştiriyor . Çarpıklık ya da değil, resmin yalnızca bir parçasıdır; sınırlı bir dağılımı sınırsız olana dönüştürür, bu da güven aralıkları için önemlidir. Aslında, sıfır korelasyonun sıfır hipotezi de bilimsel bir soru olmadıkça, Fisher güven aralıkları için kullanılmasının P değeri elde etmeye çalışmaktan çok daha verimli olduğunu iddia ediyorum . zzz
Nick Cox

1
Üzgünüm, Fisher'ın dönüşümü konusunda yeniyim. Sadece test etmek istiyorsam kullanmalı mıyım ? P-değerlerinin hesaplanmasının nedeni, birden fazla karşılaştırma yaparken ailenin hata oranını kontrol etmek için Holm-Bonferroni yöntemini kullanmak istememdir. Bir öğrencinin dağılımındaki P-değerlerini hesaplamayı tercih etmeli miyim ? zH0:ρ=ρ00t
Gunnhild

3
Soru bence yanlış yol. Fisher'ın güven aralıkları ve genellikle çıkarım için daha iyi bir yöntemdir. Çoğu yazılım, sanırım, test için tabanlı bir hesaplama kullanır . Şüpheniz varsa, bir yöntem kullanmanın verileriniz için bir fark yaratıp yaratmadığını göstermek gerçekten önemli olabilir. Yani, yöntemler kabul ederse, sorun yoktur. ztρ=0
Nick Cox

1
Fisher'ın dönüşümü hakkında daha fazla bilgiyi buradan edinebilirsiniz: stata-journal.com/article.html?article=pr0041z
Maarten Buis

Tamam, teşekkür ederim @ NickCox! @Lucozade, ne üzerinde bağlanmış içinde ? nϵn
Gunnhild
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.