Korelasyonun geçişsizliği: cinsiyet ve beyin büyüklüğü arasındaki ve beyin büyüklüğü ile IQ arasındaki korelasyonlar, fakat cinsiyet ile IQ arasındaki korelasyon yok


18

Bir blogda aşağıdaki bir açıklamayı buldum ve korelasyonun geçişsizliği hakkında daha fazla bilgi almak istiyorum:

Aşağıdaki tartışılmaz gerçeklere sahibiz:

  • Ortalama olarak, erkekler ve kadınlar arasında beyin hacminde bir fark var
  • IQ ile beyin büyüklüğü arasında bir korelasyon vardır; korelasyon 0.33'tür ve bu nedenle IQ değişkenliğinin% 10'una karşılık gelir

Bu bina 1 ve 2'den mantıklı bir şekilde takip ediyor gibi görünüyor: ortalama olarak kadınlar erkeklerden daha düşük bir IQ'ya sahiptir. Ama bu bir yanılgıdır! İstatistiklerde, korelasyonlar geçişli değildir. Kanıt, sadece IQ testlerinin sonuçlarına bakmanız gerektiğidir ve erkekler ve kadınların IQ'larının ortalama olarak farklı olmadığını göstermektedir.

Korelasyonun bu geçişsizliğini biraz daha derinden anlamak istiyorum.

Eğer IQ ve beyin büyüklüğü arasındaki korelasyon 0.9 ise (ki bunun (1) olmadığını biliyorum), ortalama olarak IQ'nun erkeklerden daha düşük olduğunu düşündürmek yine de bir yanlışlık olur mu?

Lütfen burada IQ (ve testin sınırları), cinsiyetçilik, kadın basmakalıplığı, kibir vb. Hakkında konuşmak için burada değilim (2). Sadece yanlışlığın arkasındaki mantıksal akıl yürütmeyi anlamak istiyorum.


(1) bunun olmadığını biliyorum: Neandertallerin homo sapiens'ten daha büyük beyinleri vardı, ancak daha akıllı değildi;

(2) Ben bir kadınım ve genel olarak, kendimi ya da diğer kadınları erkeklerden daha az akıllı görmüyorum, IQ testini umursamıyorum, çünkü sayı insanların değeridir ve entellektüel yetenekler.


Fransızca orijinal kaynak :

Bir les tartışılmaz suivants uyuyor:

  • hacim ya da cérébral en moyenne entre hommes et femmes
  • il ya une korrelation QI ve volüm cérébral; la corrélation est 0.33 ve yazışmalar don à% 10 de la variabilité

1 adet 2, il semble découler logiquement que: les femmes ont en moyenne un QI inférieur aux hommes.

Mais c'est une erreur de raisonnement! En istatistikçi, les corrélations ne sont pas transitives. La preuve, c'est que pour en avoir le cœur net, il QI, et ceux ci ci montrent que les QI des hommes et des femmes ne diffèrent pas en moyenne.

resim açıklamasını buraya girin


5
Bu ifadelerin korelasyonla nasıl bir ilgisi olduğunu anlamıyorum (ve "geçiş" e atıfta bulunmak bu bağlamda tamamen uygunsuz görünüyor). Sonuçta, sonuç ortalama bir farkla ilgilidir. Bu istatistik (ilk an), korelasyondan tamamen bağımsızdır (ikinci anlardan türetilmiştir). Korelasyon mükemmel bir olsa bile , birinci değişkenin ortalama farkına dayalı olarak ikinci değişkenin ortalama farkları hakkında herhangi bir sonuç çıkaramaz. ±1
whuber

5
Kareli korelasyonların toplamı 1'den büyükse pozitif korelasyonun geçişli olduğunu gösterebilir (Langford, Schwertman ve Owens (2001)): ρXY2+ρYX2>1ρXZ>0
CloseToC

2
@whuber: Evet, ama bu X ve Y ortalamaları (beyin büyüklüğü ve IQ) arasındaki ilişki ile ilgili bir soru değil, iki farklı kümede Y araçları arasındaki ilişki ile ilgili bir soru ... Bence bu açık. beyin büyüklüğü ile IQ arasındaki korelasyon mükemmelse (yani IQ beyin büyüklüğünün doğrusal bir fonksiyonuysa) ve ortalama beyin büyüklüğü erkekler ve kadınlar arasında farklılık gösteriyorsa, ortalama IQ erkekler ve kadınlar arasında farklılık gösterir.
amip diyor Reinstate Monica

2
@Amoeba Bu yorum için teşekkür ederim. Teklif mantıklı olmaya başlar (sonunda!). Ancak buna “korelasyonun geçişliliği” olarak atıfta bulunmak, açıkça yanıltıcı olacak kadar belirsizdir. (Cümle orijinal Fransızca'dadır, bu yüzden çeviriyi bile suçlayamayız.)
whuber

3
@amoeba Bu makul. Ama sanırım oraya varmak için işleri biraz germek zorundasınız! Alıntı, cinsiyet ve beyin büyüklüğü arasındaki ilişkiyi bir “korelasyon” olarak nitelendirmez - sadece iki grup arasındaki (farkla standart bir korelasyon ölçüsü değildir ) ortalamalar arasındaki fark olarak karakterize edilir . Ama sanırım “korelasyon” u geniş anlamda “bağımlılık eksikliği” ya da bunun gibi bir şey olarak anlamamız gerekiyor.
whuber

Yanıtlar:


16

Evet, yine de bir yanlışlık olurdu.

Dört farklı durumu gösteren çok basit bir rakam. Her durumda kırmızı noktalar kadınları, mavi nokta erkekleri, yatay eksen beyin boyutunu ve dikey eksen IQ'yu temsil eder. Dört veri kümesini de şu şekilde oluşturdum:

  • erkekler arasındaki ortalama beyin boyutunda her zaman aynı fark vardır ( ) ile kadınlar ( 28 - birimler isteğe bağlıdır)vardır. Bunlar popülasyon araçlarıdır, ancak bu fark herhangi bir makul örneklem büyüklüğü ile istatistiksel olarak anlamlı olacak kadar büyüktür;2228

  • erkekler ve kadınlar (her ikisi de ) arasındaki ortalama IQ'da her zaman sıfır farkı ve cinsiyet ile IQ arasında sıfır korelasyon vardır;100

  • beyin büyüklüğü ve IQ arasındaki korelasyon gücü şekilde gösterildiği gibi değişir.

correlations

Sol üst subplot içinde-cinsiyet korelasyon içinde (erkekler üzerinde ayrı ayrı hesaplanır ve ayrı ayrı kadınlar üzerinde, daha sonra ortalama) 'dir senin alıntıda olduğu gibi. Sağ üst alt alanda genel korelasyon (birlikte erkekler ve kadınlar üzerinde) 0,3'tür . Fiyat teklifinizin 0,33 sayısının ne anlama geldiğini belirtmediğini unutmayın . Korelasyon olduğu içinde-cinsiyet sol alt subplot ise 0.9 varsayımsal örnekte olduğu gibi; Sağ alt subplot genel bir ilişki olduğunu 0.9 .0.30.30.330.90.9

Yani herhangi bir korelasyon değerine sahip olabilirsiniz ve genel veya grup içi hesaplanması önemli değildir. Korelasyon katsayısı ne olursa olsun, cinsiyet ile IQ arasında sıfır korelasyon ve ortalama IQ'da sıfır cinsiyet farkı olması mümkündür.


Geçişsizliği keşfetmek

@Kjetil tarafından önerilen yaklaşımı izleyerek olasılıkların tamamını keşfedelim. Eğer üç değişken olduğunu varsayalım ila (genelliği kaybı olmadan) o korelasyon varsayalım x 1 ve x 2 olan bir > 0 ila korelasyon x 2x1,x2,x3x1x2a>0x2 ve olduğu b > 0 . Soru şudur: x 1 ve 1 arasındaki λ korelasyonunun olası minimum pozitif değeri nedirx3b>0λx1x3? Bazen pozitif olmalı mı yoksa her zaman sıfır olabilir mi?

Korelasyon matrisi ve negatif olmayan bir belirleyiciye sahip olması gerekir, yani d e t R = - λ 2 + 2 a b λ - ( a

R=(1aλa1bλb1)
yani λ bir b ± arasında olmalıdır
detR=λ2+2abλ(a2+b21)0,
λHer iki kök de pozitifse,λ'nınolası minimum değeridaha küçük köke eşittir (veλpozitif olmalıdır!). Bu iki kök arasında sıfır varsa,
ab±(1a2)(1b2).
λλ sıfır olabilir.λ

Bunu sayısal olarak çözebilir ve farklı a ve b için minimum pozitif değerini çizebilirizλab :

Exploring non-transitivity

Gayri resmi olarak, a > 0 ve b > 0 olduğu takdirde korelasyonların geçişli olacağını söyleyebiliriz , λ > 0 olduğu sonucuna varılabilir . Görüyoruz ki a ve değeri değerlerinin çoğu içina>0b>0λ>0a , λ korelasyon olmayan geçişli olduğu anlamına gelir, sıfır olabilir. Bununla birlikte, a ve b'nin yeterince yüksek bazı değerleri için, λ korelasyonupozitif olmalıdır, yani sonuçta "bir dereceye kadar geçişlilik" vardır, ancak sadece çok yüksek korelasyonlarla sınırlıdır. Her iki a ve b korelasyonuna dikkat edinbλabλ ab yüksek olmak zorunda.

Bu "geçiş" için kesin bir koşul belirleyebiliriz: yukarıda belirtildiği gibi, daha küçük kök pozitif olmalıdır, yani eşdeğerdir,bir2+b2>1. Bu bir dairenin denklemidir! Ve gerçekten, yukarıdaki şekle bakarsanız, mavi bölgenin bir dairenin dörtte birini oluşturduğunu fark edeceksiniz.ab(1a2)(1b2)>0a2+b2>1

Spesifik örneğinizde, cinsiyet ve beyin büyüklüğü arasındaki korelasyon oldukça ılımlıdır (belki de ) ve beyin büyüklüğü ile IQ arasındaki korelasyona=0.5 (mavi bölgedeki sıkıca olan bir 2 + b 2 < 1 ), yani λ pozitif, negatif veya sıfır olabilir.b=0.33a2+b2<1λ


Orijinal çalışmanın ilgili rakamı

Cinsiyet ve beyinleri tartışmaktan kaçınmak istediniz, ancak orijinal makaledeki tam rakama bakıldığında ( Gur ve ark. 1999 ), sözlü IQ skorunda cinsiyet farkı bulunmadığını, mekansal IQ skorunda bariz ve anlamlı bir fark! D ve F alt grafiklerini karşılaştırın.

Gur et al.


2
Oluşturduğunuz grafikleri seviyorum. Kağıttan olanlar, çok değil ...
Shadowtalker

1
@AleksandrBlekh: Doğruyu söylemek gerekirse, emin değilim. "Sıcaklık haritası"? "Kontur çizim" ama renkli ve kontür olmadan?
amip diyor Reinstate Monica

2
Teşekkür ederim. Bir araya geliyor. Fakat şunu belirtmeme izin verin: (1) ilk grafik dizisinde cinsiyetle olan ilişkilerin sıfır olduğunu gerçekten göstermediğinizi; ve (2) sonunda, korelasyonun "geçişliliğini" tartışmanıza rağmen, bu cümle ile ne demek istediğinizi henüz açıklamadınız . Kesinlikle geçişli bir ilişkinin olağan matematiksel anlamı yoktur, bu nedenle bazı açıklamalar faydalı olacaktır. (BTW sonunda, sen tartışırken gibi görünen ziyade  başka deyişle, analiz ettik. Mutlak yerine korelasyon kendisinden daha korelasyonu.)|λ|λ
whuber

1
@whuber: Çok iyi yorumlar, teşekkürler. (1) Aslında, cinsiyet ile korelasyon inşaatla sıfırdır! Sanırım bu rakamı örneklem yerine popülasyon korelasyonlarını bildirmek için değiştirmeliyim. Verileri kendim ürettiğim için nüfus parametreleri üzerinde tam kontrole sahibim. (2) Transitivite ile gayri resmi olarak, ve y arasındaki pozitif korelasyonlar ve y ve z , x ve z arasındaki pozitif korelasyon anlamına gelir . Demek istediğim, genellikle yanlış, ancak yeterince güçlü korelasyonlar için doğru. Ben düzenleyeceğim. (3) ise , bir ve b her ikisi de 0 , sonra A, xyyzxzab0 . λ0
amip diyor Reinstate Monica

1
Bu uzun ve ayrıntılı cevap için amip teşekkürler (ve hatta çok ekstra eklendi, bu arada çok hoş geldiniz)! Her şeyi netleştirir! Kavramsal olarak eğitimsiz beynim için kavramın kavranması çok zordur ve problemi ışıklandırdınız! Cevabınızı göndermek için ayırdığınız zaman için çok teşekkürler!
MagTun

8

Yi, ve x 3 , her iki korelasyon (beyin hacmi gibi) başka bir değişken. Diyelim ki kor ( x 1 , x 2 ) = λ ,x1=IQ,x2=genderx3λ için mümkün olan en küçük değernedir? Bir korelasyon matrisi pozitif yarı-tanımlanmış olmalıdır, dolayısıyla belirleyicisi negatif olmamalıdır. Bu bir eşitsizlik sağlamak için kullanılabilir. Deneyelim: Korelasyon matrisi R = ( 1 λ ρ λ 1 ρ ρ ρ 1 ) Sonra ρ'nın determinantını hesaplayabiliriz

cor(x1,x2)=λ,cor(x1,x3)=cor(x2,x3)=ρ=0.9
λ
R=(1λρλ1ρρρ1)
ρ ilk sıra boyunca genişleyerek : eşitsizliğe yol açar ρ 2
detR=1(1ρ2)λ(λρ2)+ρ(λρρ)=1λ22ρ2+2λρ20,
. Ρ=0.9değeriλ0,62'yeyol açar.ρ2λ+12ρ=0.9λ0.62

Güncelleme:

Yorumlara yanıt olarak yukarıdaki cevabı biraz güncelledim. Şimdi, bundan ne yapabiliriz? Yukarıdaki hesaplamalara göre, IQ ve beyin hacmi arasında 0.9 korelasyonu (ampirikten çok daha büyük). Daha sonra, cinsiyet ve IQ arasındaki korelasyon en az 0.62 olmalıdır. Bu ne anlama geliyor? Yorumlarda bazıları bunun cinsiyet arasındaki ortalama farklılıklar hakkında hiçbir şey ifade etmediğini söylüyor. Ama bu doğru olamaz! Evet, normal olarak dağıtılmış değişkenler için ilişki olmadan korelasyon ve araçlar atayabiliriz. Ama cinsiyet böyle değişken için orada, bir sıfır-bir değişkendir olan korelasyon ve ortalama farklar arasında bir ilişki. Somut olarak, IQ normalde dağılmışken, cinsiyet ayrıkken sıfırdır. Ortalama olduğunu varsayalım.p=0.5μ1=E(x1|x2=1)μ0=E(x1|x2=0)μ=E(x1)μ=0=μ1+μ0μ0=μ1x1N(μ=0,σ2)x2p=1/2

corr(x1,x2)=E(x1μ)E(x2p)σ12=Δ2σ
Δ=μ1μ0=2μ1σ=10Δ/20IQ ortalama farkı hakkında bilgi yanlış! Cinsiyet, açıkçası olmadığı sürekli bir değişken olsaydı, bu doğru olurdu. Bu gerçeğin binom dağılımı için varyans ortalamanın bir fonksiyonu olduğu ile ilgilidir (olması gerektiği gibi, çünkü değişecek tek bir serbest parametre vardır). Yukarıda yaptığımız şey gerçekten bunu kovaryans / korelasyona genişletmektir.

ρ=0.33λ0.7822λ=0


1
cor(x1,x2)0.62E(x1)E(x2)

5
+1 - Ama erkek ve kadın IQ'ları arasındaki ilişki kavramını biraz kafa karıştırıcı buluyorum, çünkü böyle bir değeri asla hesaplayamazsınız.
Andy W

1
Erkekler ve kadınlar IQ arasındaki ilişki ne anlama geliyor ?!
amip diyor Reinstate Monica

evet, doğru @amoeba! Karışıklığımı ifade etmek için doğru kelimeleri kullanmamış olabilirim (bu, istatistiklere alışkın olmadığım için zor), ancak değişken gerçekten cinsiyet, IQ ve beyin boyutudur.
MagTun

7

Bu, doğrudan etkileri ve dolaylı etkileri ve bu ikisinin genel korelasyonları nasıl etkilediğini göstermek için yol diyagramlarını kullanmayı sevdiğim bir durumdur .

Orijinal tanım gereği aşağıda bir korelasyon matrisi vardır. Beyin büyüklüğü IQ ile yaklaşık 0.3, kadın ve IQ birbirleri ile 0 korelasyona sahiptir. Kadın ve beyin büyüklüğü arasındaki negatif korelasyonu -0.3 olarak dolduruyorum (eğer tahmin etmem gerekiyorsa bundan daha küçüktür, ancak bu gösterim amaçlarına hizmet edecektir).

       Brain  Female  IQ
 Brain   1
Female  -0.3    1
    IQ   0.3    0      1

IQ'nun beyin boyutunun ve kadın olmanın bir fonksiyonu olduğu bir regresyon modeline uyursak, bunu bir yol diyagramı olarak gösterebiliriz. Oklar üzerindeki kısmi regresyon katsayılarını doldurdum ve B düğümü beyin boyutunu ve F düğümü dişiyi temsil ediyor.

enter image description here

Şimdi bu ne kadar çılgın - beyin büyüklüğünü kontrol ederken, bu korelasyonlar göz önüne alındığında, dişilerin IQ ile pozitif bir ilişkisi var. Marjinal korelasyon sıfır olduğunda neden bu? Doğrusal yol diyagramları olan kurallara göre ( Wright, 1934 ), beyin boyutunu ve dolaylı etkiyi kontrol ederken marjinal korelasyonu doğrudan etkinin bir fonksiyonu olarak parçalayabiliriz:

ToplamF,IQ=direktF,IQ+DolaylıF,B,IQ

ToplamF,IQ=kor(F,IQ)

DolaylıF,B,IQ=kor(F,B)kor(B,IQ|F)-0.099=-0.30.33

Toplam etki sıfır olduğundan, doğrudan etkinin dolaylı etkinin tam tersi işareti ve büyüklüğü olması gerektiğini biliyoruz , bu nedenle bu örnekte doğrudan etki 0.099'a eşittir. Şimdi, burada, kadınların beklenen IQ'sunu değerlendirirken iki farklı cevap alıyoruz, ancak muhtemelen soruyu belirtirken başlangıçta beklediğiniz gibi değil. Kadınlara karşı erkeklerin beklenen marjinal IQ'sunu değerlendirirken, fark sizin tanımladığınız şekilde sıfırdır (sıfır korelasyona sahip olarak). Beyin büyüklüğüne bağlı olarak beklenen farkı değerlendirirken, dişiler IQ'dan erkeklere göre daha büyüktür.

You can insert into this example either larger correlations between brain size and IQ (or smaller correlations between female and brain size), given the limits kjetil shows in his answer. Increasing the former makes the disparity between the conditional IQ of women and men even greater in favor of women, decreasing the latter makes the differences smaller.


If you look at the picture provided, it shows a positive (and stronger than men's) correlation of women's brain volume with IQ.
Alecos Papadopoulos

1
@Andy W I'm totally ashamed to ask this silly question, but what software did you use to draw the nodes graph?
mugen

1
It was a quick job in inkscape @mugen. Taking more time I think the ones I make using Latex and Tikz are nicer.
Andy W

+1 Could you point me to theory behind your second formula?
Aleksandr Blekh

2
@AleksandrBlekh - the Wright paper I cite is the seminal source. Judea Pearl goes into more more extensive commentary in his Causality book, although there are simpler treatments. (For linear models the decompositions are often given cursory treatment in structural equation modelling books.)
Andy W

3

To provide the purely abstract mathematical answer, denote v the brain volume and q the IQ index. Use 1 to index men and 2 to index women. Let's assume that the following are facts:

(1)E(v1)>E(v2)=βE(v1),0<β<1,ρ(v1,q1)>0,ρ(v2,q2)>0

Note that while the quoted text talks about "correlation between brain volume and IQ" in general, the supplied image makes a distinction with the two trend-lines (i.e. it shows the correlation for the two subgroups separately). So we consider them separately (which is the correct way to go).

Then

ρ(v1,q1)>0Cov(v1,q1)>0E(v1q1)>E(v1)E(q1)

(2)E(v1q1)E(q1)>E(v1)

and

ρ(v2,q2)>0Cov(v2,q2)>0E(v2q2)>E(v2)E(q2)

(3)E(v2q2)βE(q2)>E(v1)

Does the above obtained inequalities necessitate E(q1)>E(q2)??

To check this assume on the contrary that (4)E(q1)=E(q2)=q¯

Then it must be the case that

(5)(2),(4)E(v1q1)q¯>E(v1)

and that

(6)(3),(4)E(v2q2)βq¯>E(v1)

Well, it certainly can be the case, that inequalities (5) and (6) hold at the same time, and so "equal IQ on average" is perfectly compatible with the initial assumptions that we took as facts.
In fact it could very well happen that we could have a higher average IQ from women than for men, for the same set of facts in (1).

In other words, the correlation assumptions/facts in (1) do not impose any constraint whatsoever about the relation between average IQ's at all. All possible relation between E(q1) and E(q2) may hold, and be compatible with the assumptions in (1).


2
Despite all the calculations shown here, I still do not see how correlation reveals anything at all (or imposes any constraints whatsoever) concerning relationships between mean values.
whuber

@whuber The whole answer is about showing that it doesn't. The last sentences say exactly that. Let's add one more to that effect.
Alecos Papadopoulos

But this is absolutely basic: one doesn't need an entire page of equations to show it! It suffices to observe that correlation coefficients are location-invariant, QED. Am I misinterpreting the question?
whuber

1
@whuber With all due respect and no offense meant to anyone, but I fear that you are "misinterpreting" the knowledge level of the OP. Otherwise, the question would not have been posted.
Alecos Papadopoulos

4
I would encourage you, then, to reflect on whether and how any reply that relies heavily on mathematical equations is appropriate for addressing posters who appear to be asking for elementary expositions of basic concepts. This is a subtle issue because sometimes that is exactly the right approach. Furthermore, the degree to which one uses mathematics--and how one expounds the mathematical ideas--can be a matter of taste. But IMHO this kind of reply is effective only when the mathematics is clear and consistently focused on an essential idea.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.