Bu diktatör oyunu örneğinde nedensellikten korelasyon çıkarabilir misiniz?


17

Sadece iki değişkenle sunulduğumuz sınavı geçtim. Bir diktatörün 100 USD verildiği ve kendisi için ne kadar gönderileceğini veya tutabileceğini seçebilen bir diktatör oyununda, yaş ile katılımcıların ne kadar para tutmaya karar verdikleri arasında pozitif bir korelasyon vardı.

Benim düşüncem, nedenselliği bundan çıkaramazsın çünkü nedenselliği korelasyondan çıkaramazsın. Sınıf arkadaşım yapabileceğinizi düşünüyor, çünkü örneğin, katılımcıları üç ayrı gruba ayırırsanız, ne kadar tuttukları ve ne kadar paylaştıkları konusunda ne kadar farklı olduklarını görebilirsiniz ve bu nedenle yaşın daha fazla kalmasına neden olduğu sonucuna varırsınız. Kim haklı ve neden?


8
Normalde, tasarlanmış bir denemeniz olmadıkça nedenselliği korelasyondan çıkaramazsınız.
user2974951

6
Birey olarak dünyamız hakkında bildiğimiz her şeyi, korelasyon yoluyla biliyoruz. Dolayısıyla evet, nedenselliğin var olduğu söylenebildiği kadarıyla nedenselliği korelasyondan çıkarabiliriz. Tabii ki, doğru yapmak zor.
Aleksandr Dubinsky

Bu diktatör oyunu, diktatör olmak için atamanın rastgele olduğu bir laboratuvarda mı gerçekleşiyor?
Dimitriy V. Masterov

Örnek büyüklüğü neydi?
EngrStudent - Monica'yı

4
DimitriyV.Masterov, büyük olasılıkla tüm katılımcılara diktatör olarak 'atandı' ve ikinci oyuncu bir bitkiydi . Ancak, eminim hiç kimse yaşlarına rastgele atanmadı.
gung - Monica'yı eski

Yanıtlar:


10

Genel olarak, korelasyonun nedensellik anlamına geldiğini varsaymamalısınız - olası tek neden gibi göründüğü durumlarda bile.

Örneğin, kültürün yaş kuşak yönleri ile ilişkili başka şeyler olduğunu düşünün. Belki de bu üç grup yaşlandıkça bile aynı kalacak, ancak gelecek nesil bu eğilimi artıracak?

Tüm söylenenler, muhtemelen genç insanların daha büyük bir miktar tutma ihtimalinin daha yüksek olduğu konusunda haklısınız, ancak sadece başka olasılıkların olduğunu unutmayın.


Diğer cevaplara ek olarak, mevcut deney, tutulan paranın yaşın bir işlevi olduğu ve tutulan paranın doğum yılının bir işlevi olduğu model arasında ayrım yapamaz. İkinci modelin tarih boyunca doğrusal olmayabileceğini ve farklı tarihsel dönemlerden alınan 20 yaşın çok farklı miktarda nakit tutmaya karar verebileceğini unutmayın.
NofP

7

Ben Sürebilirdik birkaç Verilerinizden Cansın Arda.

  1. Yaş ölçülür ve sonra tutulan para miktarı. Daha yaşlı katılımcılar daha fazla para tutmayı tercih ederler (belki daha akıllı veya daha az idealisttirler, ama asıl mesele bu değildir).

  2. Tutulan para miktarı ve daha sonra yaş ölçülür. Daha fazla para tutan insanlar saymak için daha fazla zaman harcarlar ve bu nedenle yaş ölçüldüğünde daha yaşlıdırlar.

  3. Hasta insanlar daha fazla para tutar çünkü (muhtemelen hayat kurtarıcı) ilaç veya tedavi için paraya ihtiyaçları vardır. Gerçek korelasyon hastalık ve tutulan para arasındadır, ancak bu değişken "gizli" dir ve bu nedenle yanlış sonuca atlarız, çünkü yaş ve hastalık olasılığı deney için seçilen demografik grupta ilişkilidir.

(143 teoriyi atlamak; bunu oldukça kısa tutmam gerekiyor)

  1. Deneyci, gençlerin anlamadığı ve bu nedenle yanlışlıkla yanlış seçeneği seçtiği eski, belirsiz bir lehçede konuştu.

Sonuç: haklısınız, ancak sınıf arkadaşınız 147 kez düzeltici olduğunu iddia edebilir.

Bir diğer ünlü korelasyon düşük IQ ile günlük izlenen TV saatleri arasındadır. TV izlemek bir aptal mı, yoksa aptal insanlar daha fazla TV mi izliyor? Her ikisi de olabilir.


Gençler, liderlik konusunda fakir olduklarını düşündürerek değerlerini düşük değerlendiriyor olabilirler. Değeri anlamıyorlarsa, neden stratejik veya hatta rasyonel olarak karar verebilirler?
EngrStudent - Monica'yı

5
"Sınıf arkadaşının 147 kat düzeltici olduğunu iddia edebilir" ile ne elde ettiğiniz açık değil. Sınıf arkadaşı yanlış - bu veriler, yaşın paylaşım eksikliğine neden olduğu anlamına gelmez.
Nükleer Wang

@NuclearWang Bence 150 eşit derecede muhtemelen hipotez varsa, hiçbiri olası değildir. Resim illüstrasyon girişimi kadar katı değil
aaaaa diyor Monica

2
Başka bir teori: hayatta kalma yanlılığı.
R .. GitHub BUZA YARDIMCI DURDUR

1
Peki .... TV, bu web sitesi gibi zorlu hiçbir şey sunmuyor.
Carl

4

Nedeni genel olarak korelasyondan çıkarmak, problemlidir çünkü korelasyonun başka nedenleri olabilir. Örneğin, çelişkiler , seçim yanlılığı (örneğin, yalnızca belirli bir eşiğin altında bir geliri olan katılımcıları seçmek) veya nedensel etki nedeniyle sahte korelasyonlar basitçe diğer yöne gidebilir (örneğin, bir termometre sıcaklıkla ilişkilidir, ancak kesinlikle neden olmaz. o). Bu vakaların her birinde, sınıf arkadaşınızın prosedürü, yokken nedensel bir etki bulabilir.

Ancak, katılımcılar rastgele seçildiyse, karışıklıkları ve seçim yanlılığını dışlayabiliriz. Bu durumda, her iki yaş sebep olmalıdır para tuttu ya para tuttu zorunluluk nedeni yaşı . İkincisi, birisini belirli bir miktar para tutmaya zorlamanın yaşlarını bir şekilde değiştireceğini ima eder. Böylece, yaşın paranın korunmasına neden olduğunu güvenli bir şekilde varsayabiliriz .

Nedensel etkinin "doğrudan" veya "dolaylı" olabileceğini unutmayın . Farklı yaştaki insanlar farklı bir eğitim almış olacak, farklı bir servete sahip olacaklar ve bu nedenlerden dolayı farklı bir tutarı 100 $ tutmayı tercih edebilirler. Bu aracılar aracılığıyla nedensel etkiler hala nedensel etkilerdir, ancak dolaylıdır.


3
İkinci paragrafta bunun bir nedensellik olması gerektiğini belirtiyorsunuz. Rastgele seçimden hala gürültü olabileceğini unutmayın (diğer yaşlı katılımcılar para harcıyor [neden onları tutuyorlar?] Ve diğer genç katılımcılar da [emekli / ev almak istiyorum].
llrs

1
Rastgele seçim yeterli mi? Basit deneysel tasarımlarda, nedensel etkilere ilişkin geçerli kararlar için “tedavi” nin - burada, yaşın - rastgele tahsisini istiyoruz . (Tabii ki, insanlara farklı yaşlar atayamayız, bu yüzden bu basit deneysel tasarımın uygulanması mümkün olmayabilir.)
locobro

1
p(ydo(age))=p(yage)

4
You've excluded a possibility. A correlation between A and B can be explained as follows: A might cause B, or B might cause A, or another previously unknown factor C might cause both A and B.
Tim Randall

1
@locobro: Is this really a confounder or a form of selection bias? Since you are selecting for people still alive. Nevertheless an interesting observation which I did not think of, so perhaps truely random selection is not possible here.
Lucas

3

Correlation is a mathematical concept; causality is a philosophical idea.

Öte yandan, sahte korelasyon bir olduğunu çoğunlukla çoğunlukla dava olan şekilde tanımlanabilir teknik (eğer tedbir-teorik olasılık ders kitaplarında bulamazsınız) kavramı.

Bu fikir, bilimde yanlışlama fikriyle yakından ilgilidir - amacın hiçbir zaman bir şeyi kanıtlamak değil , sadece onları çürütmek .

Tıp biyolojide olduğu gibi istatistik de matematiğe aittir. Zengin teknik bilginin desteğiyle en iyi kararınızı vermeniz istenir, ancak bu bilgi asla tüm dünyayı kapsamak için yeterli değildir. Yani bir istatistikçi olarak yargıya varacak ve başkalarına sunacaksanız, belirli kalite standartlarına uyulduğunu takip etmeniz gerekir; yani sağlam tavsiyelerde bulunuyorsunuz, onlara paralarını veriyorlar. Bu aynı zamanda risklerin asimetrisinin göz önünde bulundurulması anlamına gelir - tıbbi testlerde yanlış negatif sonuç verme maliyeti (insanların erken tedavi görmesini engelleyebilir) yanlış pozitif verme maliyetinden daha yüksek olabilir (bu da sıkıntıya neden olur) .

In practice these standards will vary from field to field -- sometimes it's triple-blind RCTs, sometimes it's instrumental variables and other techniques to control for reverse causation and hidden common causes, sometimes it's Granger causality -- that something in the past consistently correlates with something else in the presence, but not in the reverse direction. It might even be rigorous regularization and cross-validation.


3
(-1) Causation nowadays has found extensive mathematical treatment. See, for example, the work by Judea Pearl. Also, what is a "technical" and "most actionable" definition of spurious correlation?
Julian Schuessler

3

The relationship between correlation and causation has stumped philosophers and statisticians alike for centuries. Finally, over the last twenty years or so computer scientists claim to have sorted it all out. This does not seem to be widely known. Fortunately Judea Pearl, a prime mover in this field, has recently published a book explaining this work for a popular audience: The Book of Why.

https://www.amazon.com/Book-Why-Science-Cause-Effect/dp/046509760X

https://bigthink.com/errors-we-live-by/judea-pearls-the-book-of-why-brings-news-of-a-new-science-of-causes

Spoiler alert: You can infer causation from correlation in some circumstances if you know what you are doing. You need to make some causal assumptions to start with (a causal model, ideally based on science). And you need the tools to do counterfactual reasoning (The do-algebra). Sorry I can't distill this down to a few lines (I'm still reading the book myself), but I think the answer to your question is in there.


5
Pearl & his work are quite prominent. It would be an uncommon statistician who's never heard of this. Note that whether he has truly "sorted it all out" is very much open for debate. There is no question that his methods work on paper (when you can guarantee the assumptions are met), but how well is works in real situations is much hazier.
gung - Reinstate Monica

4
I want to give a (+1) and (-1) at the same time, so no vote from me. The (+1) is for mentioning Judea Pearl and his work; his work is definitely helped establish the field of causal statistics. The (-1) for saying it has stumped philosophers and statisticians for centuries but now Pearl solved it. I believe that Pearl approach is the best way to think about things, but at the same time, if you use this approach (which you should), your answer is "if my untestable assumptions are correct, I've shown a causal relation. Let's cross our fingers about those assumptions".
Cliff AB

2
btw, my last sentence isn't knocking Pearl's approach. Rather, it's recognizing that causal inference is still very hard and you need to be honest about the limitations of your analysis.
Cliff AB

1
Pearl promotes a kind of neo-Bayesianism (following in the footsteps of the great E.T. Jaynes) which is worth knowing. But your own answer says: << You need to make some causal assumptions to start with (a causal model, ideally based on science).>> -- there you go. Jaynes was a prominent critic of mainstream statistics, which shies away from giving explicit priors and instead contrives "objective" systems where causality is lost. Pearl goes further and gives us tools to propagate causality assumptions from priors to posteriors -- which is not causality ex nihilo.
user8948

1
I'm also avoiding a +1 for the overly poetic part at the beginning. I mean, a lot of things have "stumped [intellectuals of some sort] for ages", but such observations tend to be the result of biased sampling and play into this false narrative of human knowledge as though it's some sort of block chain that everyone reads and writes to. But, it seems baseless to assert that no one across the ages has understood a concept merely because it was misunderstood by others. Sorry to rant, just, the initial dramatic language seems to detract from the rest.
Nat

2

Causal claim for age would be inappropriate in this case

The problem with claiming causality in your exam question design can be boiled down to one simple fact: aging was not a treatment, age was not manipulated at all. The main reason to do controlled studies is precisely because, due to the manipulation and control over the variables of interest, you can say that the change in one variable causes the change in the outcome (under extremely specific experimental conditions and with a boat-load of other assumptions like random assignment and that the experimenter didn't screw up something in the execution details, which I casually gloss over here).

Ancak sınav tasarımının tanımladığı şey bu değildir - sadece bilinen iki farklı katılımcı grubuna sahiptir, bunların belli bir gerçeği, onları farklı kılar (yaşları); ancak grubun farklı olduğu diğer yolları bilmenin hiçbir yolu yok. Kontrol eksikliğinden dolayı, sonuçtaki değişikliğe neden olan yaş farkının olup olmadığını veya 40 yaşındaki çocukların bir araştırmaya katılma nedeninin 20 yaşındakiler için paraya ihtiyaç duymalarıdır. sınıf kredisine katılan ve bu nedenle farklı motivasyonları olan öğrenciler veya gruplarınızdaki diğer olası doğal farklılıklardan herhangi biri.

Şimdi, bu tür şeyler için teknik terminoloji alana göre değişmektedir. Katılımcı yaşı ve cinsiyeti gibi ortak terimler "katılımcı özelliği", "yabancı değişken", "özellik bağımsız değişkeni" vb .'dir. Sonuçta "gerçek deney" veya "gerçek kontrollü deney" olmayan bir şeyle sonuçlanırsınız, çünkü - yaş gibi - hakkında bir iddiada bulunmak istediğiniz şey gerçekten sizin kontrolünüzde değildi, bu yüzden çok daha ileri yöntemler olmadan umabileceğiniz en fazla şey (nedensel çıkarım, ek koşullar, boyuna veriler, vb.) bir korelasyon olduğunu iddia etmektir.

This also happens to be one of the reasons why experiments in social science, and understanding hard-to-control attributes of people, is so tricky in practice - people differ in lots of ways, and when you can't change the things you want to learn about, you tend to need more complex experimental and inferential techniques or a different strategy entirely.

How could you change the design to make a causal claim?

Imagine a hypothetical scenario like this: Group A and B are both made up of participants who are 20 years old.

You have Group A play the dictatorship game as usual.

For Group B, you take out a Magical Aging Ray of Science (or perhaps by having a Ghost treat them with horrifying visage), which you have carefully tuned to aging all the participants in Group B so that they are now 40 years old, but otherwise leaving them unchanged, and then have them play the dictator game just as Group A did.

Ekstra titizlik için, sentetik yaşlanmanın doğal yaşlanma ile karşılaştırılabilir olduğunu teyit etmek için doğal olarak 40 yaşındakilerden oluşan bir C Grubu alabilirsiniz, ancak işleri basit tutmaya ve yapay yaşlanmanın "önceki" iş".

Şimdi, B Grubu, A Grubundan daha fazla para tutarsa, deneyin yaşlanmanın insanların daha fazla para tutmasına neden olduğunu gösterdiğini iddia edebilirsiniz . Tabii ki hala iddianızın yanlış olabileceği yaklaşık bin neden var, ancak denemenizin en azından geçerli bir nedensel yorumu var.


2

Hayır. Nedensellik ile korelasyon arasında tek yönlü bir mantıksal ilişki vardır.

Consider correlation a property you calculate on some data, e.g. the most common (linear) correlation as defined by Pearson. For this particular definition of correlation you can create random data points that will have a correlation of zero or of one without having any kind of causality between them, just by having certain (a)symmetries. For any definition of correlation you can create a prescription that will show both behaviours: high values of correlation with no mathematical relation in between and low values of correlation, even if there is a fixed expression.

Yes, the relation from "unrelated, but highly correlated" is weaker than "no correlation despite being related". But the only indicator (!) you have if correlation is present is that you have to look harder for an explanation for it.


A higher bar than "no correlation" is statistical independence, which implies e.g. P(A|B) = P(A). Indeed, Pearson correlation zero does not imply statistical independence, but e.g. zero distance correlation does.
user8948

2

Generally you can't jump from correlation to causation. For example, there's a well-known social science phenomenon about social status/class, and propensity to spend/save. For many many years it was believed that this showed causation. Last year more intensive research showed it wasn't.

Classic "correlation isn't causation" - in this case, the confounding factor was that growing up in poverty teaches people to use money differently, and spend if there is a surplus, because it may not be there tomorrow even if saved for various reasons.

In your example, suppose the older people all lived through a war, which the younger people didn't. The link might be that people who grew up in social chaos, with real risk of harm and loss of life, learn to prioritise saving resources for themselves and against need, more than those who grow up in happier circumstances where the state, employers, or health insurers will take care of it, and survival isn't an issue that shaped their outlook. Then you would get the same apparent link - older people (including those closer to their generation) keep more, but it would only apparently be linked to age. In reality the causative element is the social situation one spent formative years in, and what habits that taught - not age per se.


2

There are a few reasons why this conclusion doesn't make sense.

  1. It's not a prespecified hypothesis.
  2. There is no control group.
  3. Age is not a modifiable risk factor... depending on what question you're trying to ask.

A suggested improvement to the design is the following cross-over type study.

Same setting: random despots of any age who rule lands. Design: Select matched pairs of young and old dictators. Give them money pot, inspect proportion-difference withheld (old - young = p1). Steal the money back so the country and the ruler have basically the same assets as before. Depose them from their respective thrones and install them in the other's land. Reperform the pot-giving, inspect proportion-difference withheld (old - young = p2).


1

Causality and correlation are different categories of things. That is why correlation alone is not sufficient to infer causality.

For example, causality is directional, while correlation is not. When infering causality, you need to establish what is cause and what is effect.

There are other things that might interfere with your inference. Hidden or third variables and all the questions of statistics (sample selection, sample size, etc.)

But assuming that your statistics are properly done, correlation can provide clues about causality. Typically, if you find a correlation, it means that there is some kind of causality somewhere and you should start looking for it.

You can absolutely start with a hypothesis derived from your correlation. But a hypothesis is not a causality, it is merely a possibility of a causality. You then need to test it. If your hypothesis resists sufficient falsification attempts, you may be on to something.

For example, in your age-causes-greed hypothesis, one alternative hypothesis would be that it is not age, but length of being a dictator. So you would look for old, but recently-empowered dictators as a control group, and young-but-dictator-since-childhood as a second one and check the results there.


-2

Thank-you to @AdamO for offering much discussion and points of contention to this post. I am trying to offer a physical view of causality, which may be unfamiliar to the average reader of stats.

You are correct from a physical sciences point of view. In simplest form, the possibility of a physical time-independent view of causality is at the basis of the deductive-nomological (D-N) view of scientific explanation, considering an event to be explained if it can be subsumed under a scientific law. In the D-N view, a physical state is considered to be explained if, applying the (deterministic) law, it can be derived from given initial conditions. (Such initial conditions could include the momenta and distance from each other of binary stars at any given moment.) Such 'explanation by determinism' is sometimes referred to as causal determinism.

Getting a bit more complete about this, one would include Hempel's inductive-statistical model to form a scientific explanation, which link offers a more complete discussion of causality.

As for the problem at hand, age can be related to experience, but the relationship is not simple, moreover, brain function at different ages is different (time demarcation dilates with age). Experience as a modifier of behaviour is quite variable, and just because a cohort in a certain territorial and temporal sense may have similar historical experiences does not imply that any behaviour resulting from those experiences can be extrapolated to other cohorts without fear of contradiction. With respect to a controlled trial, the commonality of experiences is an uncontrolled variable that introduces an unknown and unexplored amount of spurious correlation into any binary comparison such that any difference found should not be thought of as revealing a probably causal linkage. Moreover, a probable cause, when found, would only constitute a suspicion and not something one can state with conviction; it is at best a working hypothesis not a best conclusion. Convictions concerning causality should only be drawn from a body of evidence that is inclusive enough for those convictions to be without reasonable doubt. That is not the case for the question above for which there is not enough information to claim any causal relationship beyond a coincidental context from cohort grouping. One can, indeed, formulate so many hypotheses, for example, that the evolution of generosity with age is modified by cultural/historical epoch experience, that no firm conclusions can be drawn from the problem as stated.


if X-> M and M->Y most would agree X causes Y (mediation). I think you need to be clear about how a "third" variable is specifically involved: collider bias and confounding are yet another "third variable" case.
AdamO

@AdamO Intervening variables (X → W → Y), if undetected, may make indirect causation look direct. Because of this, experimentally identified correlations do not represent causal relationships unless spurious relationships can be ruled out. I put in a link to spurious relationships for those who want to read more about it.
Carl

1
Hi @Carl, thanks for the Wiki link. I edited the text you verbatim cited above because there's no such thing as "intervening variables" expect perhaps in theology. The right term is mediation. Pearl has written a lot about it if you want a formal reference. Example: omitting salt from the diet (x) reduces endogenous ouabain (m), and excess ouabain raises blood pressure (y). However, recommendations to reduce salt (x) are efficacious in reducing blood pressure (y). The ouabain doesn't "intervene", rather it mediates: (m) is exactly why (x) works. We are rarely interested in direct effects.
AdamO

Hi, @AdamO, there is a difference between common usage and exact language. For example, (1) people say "Smoking (cigarettes) causes lung cancer." Does it? Smoking modifies the natural predilection for a stochastic event. That is, it increases the odds of getting lung cancer. (2) In classical English grammar, we say that an adjective modifies a noun. It would make less sense to say that "Smoking mediates lung cancer" or that an adjective "mediates" a noun. I have no doubt that someone is using the term "mediate". However, that seems to be an inexact usage of the word.
Carl

4
"Even its most ardent advocates fail to say how smoking increases the odds ratios of lung cancer. " - irrelevant: that was not the question, nor is it necessary to declare causation using proper counterfactual reasoning. "Not all lung cancer is 'caused' by smoking" - that was never implied and again, irrelevant. Again, please read Causality and share your thoughts after.
AdamO
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.