Fisher dönüşümü kullanılarak üç veya daha fazla korelasyonun önem testi


9

Daha önceki yayınlarımdan sonra, anlayabildiğim kadarıyla, üç korelasyon katsayım varsa, aralarında önemli bir fark olup olmadığını görmek için bunları çiftler halinde test etmem gerekecek.

Bu, r'nin z skorunu ve sonra z'nin p değerini (önceki yazılarda önerilen hesap makinelerinin neyse ki yaptığı) çalışmak için Fishers dönüşümünü kullanmam ve daha sonra p değerinin daha yüksek veya daha düşük olup olmadığını tespit etmem gerektiği anlamına gelir. her bir çift için alfa değerim (0.05).

yani 21 ila 30 yaş grubu 1, 31 ila 40 yaş grubu 2 ve 41 ila 50 yaş grubu 2 ise, alışveriş alışkanlıkları ile kilo kaybı arasındaki korelasyonları karşılaştırmam:

  • Grup 1 ve Grup 2
  • Grup 1 ve Grup 3
  • Grup 2 ve Grup 3

Üç ayrı hesaplama yapmak yerine, tüm bu hesaplamaları tek bir adımda yapmanın bir yolu var mı?


1
Lütfen biraz daha ayrıntılı olabilir misiniz? Olduğu gibi - cevabınız, açıklayıcı değişkenleriniz ve hangi korelasyonlarla ilgileniyorsunuz? Fisher'in korelasyonu test etmek için dönüşümü olmayabilir, basit bir t testi yeterli olabilir.
suncoolsu

@ suncoolsu Bu üç grup için alışveriş alışkanlığı ve kilo alımı arasındaki ilişkiyi test ediyorum. Sonuçlarım şu şekildedir: Grup 1: r = .8978, n = 105; Grup 2: r = 0,5678, n = 95; ve Grup 3: r = .7865, n = 120.
Adhesh Josh

Bence verileriniz IOTT'yi geçiyor. Bu interoküler travma testidir - sizi gözlerinizin arasına vurur. .9, .6 ve .8 korelasyonları birbirinden farklı değilse, nedir? Ama gerçekten ilgileniyorsanız
Peter Flom

Yanıtlar:


4

Sorunuz, nicel ve nitel öngörücülere sahip regresyon modellerine mükemmel bir örnektir . Özellikle, üç yaş grubu -1,2,&3 - nitel değişkenler ve nicel değişkenler alışveriş alışkanlıkları ve kilo kaybı (bunu tahmin ediyorum çünkü korelasyonları hesaplıyorsunuz).

Bunun modellemenin ayrı grup-bilişsel korelasyonları hesaplamaktan çok daha iyi bir yol olduğunu vurgulamalıyım çünkü modellemek için daha fazla veriye sahipsiniz, bu nedenle hata tahminleriniz (p-değerleri, vb.) Daha güvenilir olacaktır. Daha teknik bir neden, t-test istatistiğinde regresyon katsayılarının önemini test etmek için ortaya çıkan daha yüksek serbestlik dereceleridir.

Aşağıdaki kurallara göre c nitel öngörücüler c-1 gösterge değişkenleri, sadece iki gösterge değişkeni, X1,X2, burada aşağıdaki şekilde tanımlanan gereklidir:

X1=1 kişi 1. gruba aitse;0 aksi takdirde.
X2=1 kişi grup 2'ye aitse;0 aksi takdirde.

Bu şu grubu ima eder 3 ile temsil edilir X1=0,X2=0; yanıtınızı temsil edin - alışveriş alışkanlığıY ve nicel açıklayıcı değişken kilo kaybı W. Artık bu doğrusal modele uyuyorsunuz

E[Y]=β0+β1X1+β2X2+β3W.
Açık olan soru şu ki, biz değiştirirsek önemli midir W ve Y(çünkü yanıt değişkeni olarak alışveriş alışkanlıklarını rastgele seçtim). Cevap, evet - regresyon katsayılarının tahminleri değişecek, ancak gruplar üzerinde koşullandırılmış "burada t-testi, ancak tek bir tahmin değişkeni için korelasyon testi ile aynıdır)" değişiklik. Specficially,

E[Y]=β0+β3W - üçüncü grup için,
E[Y]=(β0+β2)+β3W - ikinci grup için,
E[Y]=(β0+β1)+β3W - ilk grup için,
Bu, çizerseniz gruplara bağlı olarak 3 ayrı satıra sahip olmakla eşdeğerdir. Y vs W. Bu, neyi test ettiğinizi görselleştirmek için iyi bir yoldur (temel olarak bir EDA ve model kontrolü biçimi, ancak gruplandırılmış gözlemler arasında doğru bir şekilde ayrım yapmanız gerekir). Üç paralel çizgi, üç grup arasında etkileşim olmadığını gösterir veWve birçok etkileşim bu çizgilerin birbiriyle kesişeceğini ima ediyor.

İstediğiniz testler nasıl yapılır. Temel olarak, modele uyup tahminlere sahip olduğunuzda, bazı kontrastları test etmeniz gerekir. Özellikle karşılaştırmalarınız için:

Grup 2 ve Grup 3: β2+β0-β0=0,
Grup 1 ve Grup 3: β1+β0-β0=0,
Grup 2 ve Grup 1: β2+β0-(β0+β1)=0.

Eğimlerin eşdeğerliğini test etmek, korelasyonların eşdeğerliğini test etmekten farklıdır. Bkz. Örneğin: jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Wolfgang

Kabul ediyorum, ancak tek bir öngörücü değişken için, bu ilişki nedeniyle aynı olmalılar t*=ρn-21-ρ2~tn-2.
suncoolsu

Ayrıca, belgeniz tek bir yordayıcı değil farklı popülasyonları karşılaştırmaktan bahsediyor.
suncoolsu

Mesele şu ki 'H0:β1=β2=β3 doğru olabilirken 'H0:ρ1=ρ2=ρ3yanlış olabilir (ve tersi de olabilir). X ve Y arasındaki korelasyon sadeceβ, aynı zamanda X'teki varyans ve hatalardaki varyans. X ve / veya hatalardaki fark 3 grupta farklıysa, farklı hipotezleri test edersiniz.
Wolfgang

Evet haklısın (daha önce söylediğim gibi), ama benim cevabım OP'nin wt.loss ve alışveriş alışkanlıkları arasındaki ilişkiyi gruplara göre belirlemekle ilgilendiğini varsayıyor (ille de korelasyon değil). Sanırım yanıldım çünkü OP diğer cevabı kabul etti. Bununla birlikte, bu cevap faydalı bir alternatif olarak hizmet eder (umarım).
suncoolsu

1

Bu durumda ikili test, veri açıklamasıyla (henüz) doğrulanmamıştır. Çok değişkenli regresyon yöntemlerini kullanıyor olmalısınız. Bir R çağrısı şunlar olabilir:

lm( weight_end ~ shop_habit + age_grp + weight_begin)

Sınıflandırma sürekli ilişkileri bozabileceğinden ve spline terimleri keyfi bölünme noktaları seçme ihtiyacını ortadan kaldırabildiğinden, 3 kategori oluşturmak yaş için kontrol etmenin en iyi yöntemi değildir (ya da birincil soru ise katkısını analiz etmek). Uygun bir analizden sonra ağırlık değişiminin bir ilişkisi hakkında yeterli kanıt bulunduğunda, konuşlandırılabilen geçici test seçenekleri olacaktır.

(@Whuber'ın bir yorumda ifade ettiklerinin çoğuna katılıyorum ve genellikle yorumunu yetkili buluyorum, ancak regresyon yaklaşımlarına ilişkin tutumunu anlamıyorum.)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.