Yanıtlar:
Evet, bu mümkün ve her türlü şekilde olabilir. Açık bir örnek, A ve B üyeliğinin x ve y değerlerini yansıtacak şekilde seçilmesidir. Başka örnekler de mümkündür, örn. @ Macro'nun yorumu alternatif bir olasılık önerir.
Aşağıdaki örneği göz önünde bulundurun, R ve x'de yazılmış standart normal değişkenlerdir, ancak bunları x ve y'nin nispi değerlerine göre gruplara ayırırsam, adınızı soyduğunuz sıralamayı alırım. Grup A ve grup B'de x ve y arasında istatistiksel olarak anlamlı bir korelasyon vardır, ancak gruplama yapısını göz ardı ederseniz korelasyon yoktur.
> library(ggplot2)
> x <- rnorm(1000)
> y <- rnorm(1000)
> Group <- ifelse(x>y, "A", "B")
> cor.test(x,y)
Pearson's product-moment correlation
data: x and y
t = -0.9832, df = 998, p-value = 0.3257
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.09292 0.03094
sample estimates:
cor
-0.03111
> cor.test(x[Group=="A"], y[Group=="A"])
Pearson's product-moment correlation
data: x[Group == "A"] and y[Group == "A"]
t = 11.93, df = 487, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.4040 0.5414
sample estimates:
cor
0.4756
> cor.test(x[Group=="B"], y[Group=="B"])
Pearson's product-moment correlation
data: x[Group == "B"] and y[Group == "B"]
t = 9.974, df = 509, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.3292 0.4744
sample estimates:
cor
0.4043
> qplot(x,y, color=Group)
Bir olasılık, etkilerin her grupta farklı yönlere doğru gitmesi ve bunları topladığınızda iptal edilmesidir . Bu, bir regresyon modelinde önemli bir etkileşim terimini bıraktığınızda, ana etkilerin nasıl yanıltıcı olabileceği ile de ilgilidir.
Örneğin, grup olarak varsayalım , cevap arasındaki gerçek ilişki ve öngörücü dır-dir:
ve grup halinde ,
Grup üyeliğinin dağıtıldığını ve
Bu nedenle, , ve bağımlı değil hiç. Dolayısıyla, her iki grupta da bir ilişki vardır, ancak onları birleştirdiğinizde bir ilişki yoktur. Başka bir deyişle, grup üyeliğini bilmediğimiz popülasyonda rastgele seçilen bir birey için, ortalama olarak, ve . Ancak, her grupta vardır.
Herhangi bir örnek her gruptaki efekt boyutlarını mükemmel bir şekilde dengeler de bu sonuca yol açacaktır - bu, hesaplamaları kolaylaştırmak için sadece bu oyuncak örneğiydi :)
Not: Normal hatalarda, doğrusal regresyon katsayısının önemi Pearson korelasyonunun önemine eşdeğerdir, bu nedenle bu örnek gördüğünüz şey için bir açıklamayı vurgular.