Verilerde nedensel ilişkileri nasıl buluyorsunuz?


11

Diyelim ki "A", "B" sütunlarına sahip bir tablom var

"A" nın "B" nin ortaya çıkmasına neden olup olmadığını belirlemek için istatistiksel bir yöntem var mı? Gerçekten kimse Pearson r kullanamaz, çünkü:

  • sadece değerler arasındaki korelasyonu test eder
  • korelasyon nedensellik değildir
  • Pearson r sadece doğrusal ilişkileri ilişkilendirebilir

Burada başka hangi seçeneklerim var?


1
Yok. Bu tür verilerden yüksek derecede bir korelasyon gösterebilirsiniz; nedensellik gösteremezsiniz.

göz atın

1
Nedensellik sadece rakamlardan sıkabileceğiniz bir şey değil ... bu yüzden, benden sonra tekrar et: nedensellik korelasyon değil , nedensellik korelasyon değil ...
JM bir istatistikçi değil

1
Judea Pearl (2011 Turing Ödülü sahibi) tarafından "Nedensellik" konusuna bakın.

Yanıtlar:


4

Şimdiye kadar cevaplar ve yorumlar temelde pratik düzeyde doğrudur, ancak bütünlük için Bayesci istatistiklere ve grafik teorisine dayanan sözde nedensellik modelleri üzerinde araştırmalar vardır. Bu nedenle, genel olarak korelasyon gerçekten nedensellik anlamına gelmese de, nedenselliği ortadan kaldırmaya çalışan daha karmaşık modeller vardır. Daha fazla ayrıntı için Judea Pearl'ün Nedensellik kitabına bakın , ancak bu çok ağır bir matematiktir ve muhtemelen istediğiniz şey değildir.


2

Verileriniz gözlemsel olsa da, nedensellik hakkında güvenilir bir şekilde tartışabileceğiniz birçok yarı deneysel yöntem vardır. Bu yöntemler tipik olarak ilgilendiğiniz değişkente dışsal bir varyasyon kaynağı bulmaya dayanır.

Bence "Zararsız Ekonometri" kitabında iyi ve erişilebilir bir genel bakış sunuldu. Temelde insanların (yani iktisatçıların) inandığı tüm yarı deneysel yöntemleri kapsar (en azından bazen). Örneğin trb456 tarafından belirtilen yöntemleri kapsamazlar (aynı nedenden dolayı: pek çoğu onlara inanmaz).


1

Nedeni belirlemek için bir randomizasyon testi yapmanız gerekir. Test deneklerinizi alırsınız ve bunların yarısını rastgele olarak A kalitesine ve yarısını sahip olamayacak şekilde seçersiniz. Daha sonra iki grup arasında B kalitesinde istatistiksel olarak anlamlı bir fark olup olmadığını görüyorsunuz.

Herhangi bir ölçüm yapmadan önce rasgeleleştirmeyi yapmanız önemlidir . Özellikle, önceden ölçülen ve ile bir veri kümesi verilirse , nedenselliği belirlemek imkansızdır.AB

Yapmak istediğiniz randomizasyon testini yapmanın imkansız olabileceğini unutmayın. Örneğin, uzun olmanın daha fazla tartmanıza neden olup olmadığını nasıl test edebilirsiniz? Kesinlikle boy ve kilo arasında bir korelasyon vardır, ancak bir grup insanı 'uzun' bir gruba ve bir 'kısa' gruba rastgele atayamazsınız. Bu durumda, randomizasyon testi yapılamaz.


0

Somers, ordinal değişkenler arasındaki ilişkiyi pearson korelasyon katsayısının veri setleri için yaptığı şekilde açıklamak için çalışır.


1
Nedensellik oluşturmak rakamlardan daha fazlasının gerekli olduğunu kabul ediyorum. Sıra değişkenlerinin kullanımı soruya nasıl giriyor?
Michael R. Chernick

1
@MichaelChernick Somers 'D, asimetrik bir ilişki ölçüsüdür. "Yağmur yağıyorsa, o zaman bulutlu, 'bulutlu' ise, o zaman yağmur yağıyor" arasında ayrım yapabilir. Sıralı veya daha yüksek veri için çalışır. Nedensellik oluşturmaz, ancak yönlülük oluşturur.
Dave Harris
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.