Eğer korelasyon nedensellik anlamına gelmiyorsa, iki değişken arasındaki korelasyonu bilmenin değeri nedir?


11

Bir işletme sahibi (veya pazarlama veya dağılma planını anlayan herhangi biri) olarak iki değişkenli bir dağılım grafiği gösterilir: son 5 yılda reklam sayısı ile aylık ürün satışlarının sayısı (veya başka bir zaman ölçeği) daha fazla örnek var. Ben sadece bir tane yaptım).

Şimdi dağılım grafiğini görüyor ve korelasyon katsayısının (düzeltme) olduğu söyleniyor:

  1. 1 veya
  2. 0.5 veya
  3. 0.11 veya
  4. 0 veya
  5. -0,75 veya
  6. -1

Temelde geçerli herhangi bir değer corr

Soru: Bu, karar alıcı veya dağılım planının herhangi bir tüketicisi için ne anlama geliyor? Buna dayanarak hangi kararlar alınabilir?

Yani: İki değişken arasındaki korelasyonu görmenin faydası nedir ve bu bilgilerle tek başına ne yapılabilir? Sadece regresyon analizine dahil edilmek için neyin dikkate alınacağını ve neyin dikkate alınmayacağını görmek mi yoksa daha pratik bir kullanımı var mı?

Sadece merak ediyorum, her zaman bu teknikle çalıştım, ancak kendim korelasyonun çok fazla faydası olmadığı söylendi - öyleyse kullanımı ne?

Yanıtlar:


12

Birkaç düşünce:

  • Korelasyonun nedensellik olmaması hakkındaki eski kanunu, hikayenin sadece yarısıdır. Korelasyon nedensellik olmayabilir, ancak nedensellik gösterme yolu boyunca iki değişken arasındaki bir ilişki biçimi gerekli bir adımdır ve korelasyon bunu göstermeye yardımcı olabilir.
  • Trendleri göstermeye yardımcı olur. Bir işletme sahibine gösterin ve "Evet, bu mantıklı, Widget X ve Widget Y'nin her ikisi de gerçekten ilgili olmasalar bile belirli bir grup kişi tarafından kullanıldığını görürsünüz. Ya da "Bu ... tuhaf", bu noktada daha fazla araştırma başlattınız.
  • Şuna bak. Korelasyon bir araçtır. Bir çekiç, tek başına, o kadar da kullanışlı değil. Kesinlikle tek başına bir ev inşa etmeyecek. Ama hiç bir ev inşa çalıştık olmadan bir çekiç?

5
İlk merminizde korelasyonun nedensellik için gerekli bir koşul olduğunu söylüyorsunuz - bu doğru değil. İki değişken arasında monotonik olmayan bir ilişki varsa, bunlar ilişkisiz olabilir - bu nedenselliği engellemez.
Makro

@Macro - doğru ve düzenlenmiş
Fomite

@Macro True, ancak pratikte test edilecek ilişkiyi monotonik yapmak için değişkeninize bir işlev uygulayabilirsiniz. bu işlevi bilmiyorsanız, o zaman ... ne aradığınız hakkında çok şey bilmiyorsunuz
RockScience

@EpiGrad: İki değişkenin XY korelasyon grafiğinin mutlu bir surat (veya kendi başına başka bir şekil) gibi olduğunu varsayın. Korelasyon katsayısı aslında oldukça küçük olurdu, ama kesinlikle bazı ilişkiler arası olurdu, değil mi? Böyle bir durumda kişi nasıl / ne yapmalı?
Doktora

@Nupul XY'nin doğrusallığın ötesinde biraz daha karmaşık bir keşfi.
Fomite

7

Kumar perspektifinden bakın. Diyelim ki, çalışmak için çalışma alanı takan insanların işte 1,5 yaralanması ve loafer takan insanların ortalama 0,05 yaralanması olacağını biliyoruz. Ya da, çalışma botları giyen bir kişi için yaralanma olasılığı 0,85'tir ve mokasen giyen bir kişinin yaralanma olasılığı 0,1'dir.

Popülasyondan rastgele bir kişi seçersem ve size kişinin çalışma botları giydiğini söylesem ve geçen yıl işyerinde yaralanma olup olmadıklarına dair size eşit bir bahis teklif edersem, bahse girer misiniz? Eğer sakatlandıkları tarafa bahse girebilseydin bahse girerdin .. Kazanacağın zamanın% 85'i ve hatta para kazanıyorsun.

Mesele şu ki, bu bilgi parçası bize iş yerinde bir yaralanma yaşayıp yaşamayacakları hakkında bilgi veriyor. Ayakkabıların bununla hiçbir ilgisi yok, aslında çalışma botları yaralanmayı önlüyor .. Ama buradaki değişken değişken çalışma alanları ile birlikte giden iş türüdür .. Ve belki de kişi gibi muhtemelen daha dikkatsiz olmak gibi şeyler.


6

"Korelasyon nedensellik anlamına gelmez" ifadesi abartılıyor. (Cohen'in yazdığı gibi, "bu çok büyük bir ipucu".) Bu ifadeyi insan zihnine özgü bir önyargı nedeniyle öğrencilere yendik. 'Suç oranı yoksulluk oranı ile ilişkili' ya da bunun gibi bir şey duyduğunuzda, bunun yardım edemeyeceğinizi ancak bunun yoksulluğun suça neden olduğu anlamına geldiğini düşünemezsiniz. İnsanların bunu varsayması doğaldır, çünkü zihin bu şekilde çalışır. Buna karşı koyma umuduyla ifadeyi tekrar tekrar kullanıyoruz. Bununla birlikte, fikri özümsedikten sonra, ifade değerinin çoğunu kaybeder ve daha sofistike bir anlayışa geçme zamanı.

İki değişken arasında bir korelasyon olduğunda, iki olasılık vardır: hepsi bir tesadüf veya işte bir nedensel kalıp var. Dünyada bir örüntü tesadüf etmek korkunç bir açıklayıcı çerçevedir ve muhtemelen son çareniz olmalıdır. Bu nedensellik bırakır. Sorun şu ki, o nedensel modelin doğasını bilmiyoruz. Yoksulluğun suça neden olması iyi olabilir, ancak suçun yoksulluğa neden olması da olabilir (örneğin, insanlar yüksek suçlu bir alanda yaşamak istemezler, bu nedenle taşınırlar ve mülk değerleri düşer vb.). Aynı zamanda, hem suça hem de yoksulluğa neden olan bazı üçüncü değişkenler veya değişkenler grubu olabilir, ancak aslında doğrudan bir şey yoktur suç ve yoksulluk arasındaki nedensel bağlantı ('ortak neden' modeli olarak bilinir). İstatistiksel bir modelde, diğer tüm varyasyon kaynakları bağımlı değişkenin hata terimine daraltılmıştır. Sonuç olarak, bağımsız değişken hata terimiyle ilişkilidir (neden olur) ve bu da endojenite sorununa yol açar . Bu sorunlar çok zordur ve hafife alınmamalıdır. Bununla birlikte, bu senaryoda bile, işyerinde gerçek nedensellik olduğunu kabul etmek önemlidir.

Kısacası, bir korelasyon gördüğünüzde, muhtemelen bir yerlerde oyunda bir çeşit nedensellik olduğunu, ancak bu nedensel paternin doğasını bilmediğinizi düşünmelisiniz .


4

Ben bu şeyler hakkında bilgili olduğumu düşündüm, ama sadece geçen ay sözlükte "ima" aradım ve bunun iki farklı anlamı vardı. 1. Öner ve 2. Gerekli. (!) Korelasyon nadiren nedensellik gerektirir, ancak kesinlikle önerebilir. @EpiGrad'ın belirttiği gibi, nedensellik oluşturmak için yeterli olmasa da gerekli bir durumdur.

Zaman geçtikçe, umarım korelasyonu son ve tamamen işe yaramaz olarak görmek arasında bir orta yol bulur. Ve kişi, korelasyon sonuçlarını yorumlamada konuya / alana / içeriğe özgü bilgileri dikkate alır. Açıkladığınız reklam-satış sonuçlarını görünce çok az insan nedensel bir bağlantı olduğunu sorgulayacaktır. Ancak diğer olasılıklara, gözlemlenen ilişkiyi en azından kısmen açıklayabilecek diğer değişkenlere açık kalmak her zaman iyidir. Şaşırtıcı değişkenler, geçerlilik ve benzerleri ile ilgili okumalar büyük temettülerle sonuçlanır. Örneğin, Cook ve Campbell'in eski klasik Quasi-Experimentation , geçerlilik ve geçerliliğe yönelik tehditler konusunda iyi bir bölüme sahiptir.


1
@EpiGrad'a işaret ettiğim gibi, korelasyon nedensellik için gerekli bir koşul değildir . Veri analizinde, değişkenler arasındaki ilişkinin her zaman monotonik bir ilişkiyi ifade ettiğine dair yaygın bir fikir vardır;
Makro

1
Yeterince adil. Diyelim ki "istatistiksel birliktelik" gerekli.
rolando2

2

X'in değerini bilmenin Y'nin değeri hakkında ne kadar bilgi sahibi olduğunu bilmek istiyorsanız, korelasyon katsayısı, diğer ilişkilendirme ölçütleri gibi yararlıdır. Bu, X'i belirli bir değere ayarlayıp ayarlamayacağınızı bilmekten farklıdır. alacağınız Y değeri (nedenselliğin karşı-olgusal bir yorumunun özüdür).

Bununla birlikte, birçok bağlamda (örneğin, tahmin) korelasyona dayalı çıkarımlar kendi başlarına değerli olacaktır. Sarı dişler akciğer kanseri ile ilişkilidir (her ikisi de olasılıkla kanserden kaynaklanır). İkisi arasında nedensellik yoktur: beyazlatıcı dişler akciğer kanserini iyileştirmez. Ancak, akciğer kanseri geçirmesi muhtemel olanlar için hızlı bir tarama testine ihtiyacınız varsa, sarı dişleri kontrol etmek iyi bir ilk adım olabilir.

Korelasyon katsayısının mevcut en iyi birlik ölçüsü olup olmadığı farklı bir sorudur, ancak sorunun nedensel olmayan ilişkilendirmeyi bilmenin değeri hakkında daha fazla olduğunu düşünüyorum.

Btw, sadece korelasyonun nedensellik için yeterli bir gösteri değil, aynı zamanda da gerekli değildir. İki değişken nedensel olarak ilişkili olabilir, ancak belirli bir veri kümesinde hiçbir korelasyon göstermez (örneğin, seçim yanlılığı veya çelişkiler nedeniyle).


1

tek başına korelasyon pek işe yaramaz - öyleyse bu kullanım ne demek?

Bu cümleye katılmama izin verin, korelasyon 2 değişken arasındaki ilişki seviyesini bilmeme izin verin. Ardından, bu değişkenler arasındaki ilişkiyi açıklamaya çalışırken yararlıdır. Öte yandan, (Macro'un yazdığı gibi) korelasyon nedensellik için gerekli bir koşul değildir, ancak ilişki düzeyini açıklamak için yeterlidir. Dahası, değişkenlerin bağımsızlığını test edebilirsiniz, ancak korelasyon size başka faydalı bilgiler, belirleme katsayısı verebilir.

Bununla birlikte, analist ilişkinin türünü açıklayabilmek için etki alanını bilmelidir.


Bununla ne demek istediğinden emin değilim:Furthermore, you can test the independence of the variables, but correlation can give you another useful information, the coefficient of determination
Doktora

Demek istediğim: "değişkenlerin bağımsızlığını test edebilirsiniz" ama yine de, bağımsızlığı, korelasyon ve resifi test etmese bile. belirleme değişkenleri arasındaki ilişki türünü anlamak ve açıklamak için "yararlıdır".
Jose Zubcoff

1

Bence veri toplama ve çalışma tasarımı da bu sorunun cevabında rol oynayabilir. Gözlemsel çalışmalarda bile bir çalışma tasarlamayacak ve birbirinizle tamamen alakasız bir veri kümesi toplayamayacaksınız. Nedensel bir ilişki olmamasına rağmen, ilgili bir ilişki olabilir.

Bununla birlikte, tamamen ilgisiz iki veri kümesinden bahsediyor, ancak yine de ilişkiyi ve nedenselliği açıklamak için korelasyon kullanmak istiyorsanız, o zaman uygun olmayabilir. Örneğin, dondurma veri satışları ve evlilik sayısı gibi iki veri kümesinin aşağı yönlü eğilimleri varsa, korelasyon katsayısı çok yüksek olabilir. Fakat bir ilişki demek gerekli midir?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.