Regresyon Analizinde neden bağımsız değişkenleri “bağımsız” olarak adlandırıyoruz?


30

Yani bu değişkenlerin bazıları kendi aralarında kuvvetle koreledir. Bunları nasıl / neden / hangi bağlamda bağımsız değişkenler olarak tanımlarız ?


1
Bu tarihsel ve Fransız bilimsel eserlerinden geliyor. Referans bulmaya çalışıyorum.
Alecos Papadopoulos

1
Nedensellik çıkarımını önlemek için "potansiyel olarak ortak bağımlı" değişkenler kümesi derdim .
qed

1
Güzel bir soru!
Rafael Marazuela,

Yanıtlar:


29

Günümüzün makine öğrenmesi konusundaki vurgusundan geri çekilir ve kontrollü deneysel çalışmalar için ne kadar istatistiksel analizin geliştirildiğini hatırlarsak, "bağımsız değişkenler" ifadesi iyi bir anlam ifade eder.

Kontrollü deneysel çalışmalarda, ilacın ve konsantrasyonlarının veya gübrenin tercihlerinin ve dönüm başına miktarlarının seçimleri , araştırmacı tarafından bağımsız olarak yapılır . İlgi, ilgilenilen bir yanıt değişkeninin (örneğin, kan basıncı, mahsul verimi) bu deneysel manipülasyonlara nasıl bağlı olduğu ile ilgilidir. İdeal olarak, bağımsız değişkenlerin özellikleri sıkıca belirtilmiştir, temelde değerlerini bilmede hata yoktur. Daha sonra standart lineer regresyon, örneğin, bağımsız değişkenlerin artı kalıntı hataların değerleri açısından bağımlı değişkenlerin değerleri arasındaki farkları modeller.

Kontrollü deneysel çalışmalar bağlamında regresyon için kullanılan aynı matematiksel formalizm, gözlemlenen veri setlerinin deneysel manipülasyonu çok az olan veya hiç olmayan bir manipülasyon ile analiz edilmesine de uygulanabilir, bu nedenle "bağımsız değişkenler" ifadesinin bu tip tiplere taşınması şaşırtıcı değildir. çalışmaları. Ancak, bu sayfadaki diğerlerinin belirttiği gibi, bu tür bağlamlarda daha uygun olan "öngörücüler" veya "özellikler" ile muhtemelen talihsiz bir seçimdir.


2
Ancak, ilacın seviyelerinin seçimi, araştırmacının ne yaptığına bağlıdır, bu yüzden hangisinin hangisi olduğunu asla hatırlayamıyorum.
mdewey

Makine öğreniminde "özellikler" genellikle gizli, gözlemlenmeyen değişkenlerdir. “Gözlenen özellikler” daha yaygındır.
Neil G,

18

Birçok yönden "bağımsız değişken" talihsiz bir seçimdir. Değişkenlerin birbirinden bağımsız olması gerekmez ve elbette bağımlı değişkeninden bağımsız olması gerekmez . Öğretimde ve kitabımda Regresyon Modelleme Stratejileri Tahmini kelimesini kullanıyorum . Bazı durumlarda bu kelime yeterince güçlü değildir, ancak ortalama olarak iyi çalışır. (sağ taraf) değişkenlerin istatistiksel bir modeldeki rolünün tam bir açıklaması her seferinde kullanılamayacak kadar uzun olabilir: dağılımının şartlandırıldığı değişkenler veya ölçümler kümesi . Bu, dağılımları şu anda ilgilenmediğimiz ancak değerlerini sabit olarak değerlendirdiğimiz değişkenler kümesini söylemenin başka bir yoludur.X YYXY


Yani tüm söyledikleriniz girdi değişkenlerini "bağımsız" olarak adlandırmanın yanlış bir uygulama olduğunu? @Frank
Amarpreet Singh,

11
Kesinlikle HERHANGİ BİRİNDEN bağımsız olmadıkları varsayılmaktadır, bu yüzden bu sadece alışkanlık nedeniyle kullanılan yanlış bir uygulamadır.
Frank Harrell

1
"Y dağılımının koşullandırıldığı değişkenler veya ölçümler kümesi" ... aslında onları çok uzun olmayan "koşullandırma değişkenleri" veya "şartlandırılmış değişkenler" olarak adlandırıyorum (ve bazen de adlandırıyoruz). tanımı ve doğal olarak gösterimiE(Y|X)
Silverfish

11

Buradaki diğer cevaplara katılıyorum, "bağımsız" ve "bağımlı" ifadesinin zayıf terminoloji olduğu. Olarak EDM açıklar, bu terminoloji araştırmacı birbirinden bağımsız regressors ayarlayabilirsiniz kontrol deneyleri bağlamında ortaya çıkmıştır. Bu yüklü nedensel çağrışımı olmayan birçok tercih edilen terim var ve benim tecrübeme göre istatistikçiler daha tarafsız terimleri tercih etme eğilimindedir. Burada, aşağıdakiler de dahil olmak üzere kullanılan birçok terimler vardır :

Yixi,1,...,xi,mResponsePredictorsRegressandRegressorsOutput variableInput variablesPredicted variableExplanatory variables

Şahsen, açıklayıcı değişkenler ve cevap değişkeni terimlerini kullanıyorum, çünkü bu terimlerin istatistiksel bağımsızlık veya kontrol, vb. Çağrışımları yoktur. sorunlu bulamadım.)


1
(+1) Regressor / regressand'ın en nötr terimler olduğunu düşünüyorum, ancak açıklayıcı / cevap kullanarak açıklamayı da tercih ediyorum.
Frans Rodenburg

2
Tarafsız terimleri tercih etme eğilimine katılıyorum, ancak "açıklayıcı" şu şekilde bana oldukça nedensel geliyor: "X değişkenleri , Y değişkeninin neden böyle davrandığını açıklıyor ."
timwiz

1
Olasılıksal anlamda açıklayıcı anlamında alıyorum - yani, cevap değişkeninin dağılımındaki değişiklikleri açıklıyor. Haklı olabilirsin, ancak tüm bu durumlarda herhangi bir nedenselliğe çağrışım zayıf.
Monica'yı

2
Açıklayıcı, nedensel olduğu anlamına gelir, bu nedenle uygunsuzdur.
Frank Harrell

1
@ Frank: Bu görüşe mutlaka katılmıyorum. Açıklayıcı, "açıklamak" kelimesinden türetilmiştir, bu yüzden sadece değişkenlerin bir şekilde yanıt değişkenini açıkladığını ima etmek için kabul ediyorum. Bu açıklama nedensel olabilir ya da sadece istatistiksel olabilirdi ve ben bunu ikincisi olarak kabul ediyorum. Yine de, insanların bu kelimelerin çağrışımlarını farklı yorumladıkları anlaşılıyor, bu yüzden bazılarının nedensel çağrışımlar olarak okuyacağını kabul edeceğim.
Monica'yı

9

Frank Harrell ve Peter Flom'un cevaplarına eklemek için:

Değişken "bağımsız" veya "bağımlı" olarak adlandırmanın çoğu zaman yanıltıcı olduğunu kabul ediyorum. Ancak bazı insanlar hala bunu yapıyor. Bir keresinde neden bir cevap duydum:

Regresyon analizinde biz bir "özel" değişkeni (genellikle ile gösterilir var ) ve pek çok "-so-özel değil" değişkenleri ( 'ler) ve değişimler nasıl görmek istiyorum s etkileyen' . Diğer bir deyişle, biz nasıl görmek istiyorum bağlıdır üzerinde 's.X X Y Y XYXXYY X

Bu yüzden “bağımlı” denir. Ve eğer biri “bağımlı” olarak adlandırılırsa, nasıl bir tane daha denir?Y


Y'nin X'e bağlı olduğunu söylüyorsunuz, (yani Y bağımlı değişken olarak adlandırılır) ve X'in Y'ye bağlı olmadığını kastediyorsunuz. artık "bağımsız" denmiyor). Bununla ilgili görüş var mı?
Amarpreet Singh

Hayır, X'in Y'ye bağlı olmadığını kastetmiyorum, sadece regresyon analizinin ne yaptığının en temel açıklamasının Y'nin X'e nasıl bağımlı olduğunu açıkladığı anlamına gelir. Yani Y için en temel isim "bağımlı olur" "
asukasz Deryło

6
"X bağımsız mı demeliyiz?" Sorusuna cevap vermeye çalışmıyorum. ama daha çok "neden bağımsız diyoruz?", tıpkı gönderinizin başlığında olduğu gibi
asukasz Deryło

5

"Bağımlı" ve "bağımsız" terimleri kafa karıştırıcı olabilir. Bir anlam sözde-nedensel hatta nedenseldir ve bu “bağımsız değişken” ve “bağımlı değişken” derken kastedilendir. Bir anlamda DV'nin IV'e bağlı olduğunu kastediyoruz. Bu nedenle, örneğin yetişkin insanlarda boy ve kilo ilişkisini modellerken, ağırlığın DV ve boy IV olduğunu söylüyoruz.

Bu, “öngörücü” nin yapmadığı bir şeyi yakalar - yani ilişkinin yönü. Boy kilo öngörürken, ağırlık da boyu tahmin eder. Yani, insanların yüksekliğini tahmin etmeniz ve ağırlıklarının söylenmesi söylendiyse, bu faydalı olacaktır.

Fakat boyun ağırlığa bağlı olduğunu söyleyemeyiz.


SEM modeli konusunda belirli misiniz?
Amarpreet Singh,

Hayır. Ben gerilemeyi düşünüyordum.
Peter Flom - Reinstate Monica

Tamam, bu sadece bir isim meselesi. Girdi değişkenlerini "bağımsız" olarak adlandırmanın bir anlamı olduğu konusunda kafam karıştı.
Amarpreet Singh

12
DV ve IV ortak kısaltmalardır (şahsen sevmediğim), ancak IV'ün sadece araçsal değişken anlamına gelebileceği birçok iktisatçı ve diğer bazı sosyal bilimcilere dikkat edin. DV'nin yalnızca Deo volente (Tanrı'nın istekli) anlamına gelebileceği insanlarla karşılaşmak daha az yaygındır.
Nick Cox,

0

Yukarıdaki cevaplara dayanarak, evet, bu bağımlı ve bağımsız değişkenin zayıf terminoloji olduğuna katılıyorum. Ancak birçoğumuz tarafından kullanıldığı bağlamı açıklayabilirim. Genel bir regresyon problemi için, bir Çıktı değişkenine sahip olduğumuzu söylüyorsunuz, ki değeri Y, diğer girdi değişkenlerine bağlıdır, örneğin, x1, x2, x3. Bu nedenle "Bağımlı Değişken" olarak adlandırılır. Ve benzer şekilde sadece bu içeriğe bağlı olarak ve sadece Çıktı ve Girdi Değişkenleri arasında ayrım yapmak için, x1, x2, x3 bağımsız değişken olarak adlandırılır. Çünkü Y'nin aksine başka bir değişkene bağlı değildir (Ama evet, burada kendileriyle olan bağımlılıktan bahsetmiyoruz).


@Ramya R.
Amarpreet

-2

Bağımsız değişkenler bağımsız olarak adlandırılır çünkü diğer değişkenlere bağlı değildir. Örneğin, ev fiyatı tahmin problemini düşünün. House_size, location ve house_price hakkında verilerimiz olduğunu varsayalım. Burada, house_price, house_size ve yere göre belirlenir, ancak yer ve house_size farklı evler için değişiklik gösterebilir.


4
Bazen regresyonda "bağımsız" denilen değişkenler ilişkilendirilir. Bu yüzden mutlaka istatistiksel olarak bağımsız değillerdir. Bunları yordayıcı değişken olarak adlandırmak daha iyi olur.
Michael R. Chernick

Micheal, Bunu gösterdiğin için teşekkürler. Takip eden bir sorum var. Eş zamanlı olan iki yordayıcı değişkenimizin olduğu durumlarda, çok değişkenlilik sorununu ortadan kaldırmak için bunlardan birini yok etmeyiz, böylece yordayıcı değişkenlerimiz birbirinden bağımsız olur mu?
Ramya R

1
Şart değil. Her iki değişken dahil edildiğinde tahminlerin istikrarını etkileyip etkilememesine ve tahminin ne kadar güçlü olduğuna bağlıdır. Eğer iki değişken korelasyona sahipse, 0.1 bağımsız değildir, ancak aralarındaki ilişki zayıftır.
Michael R. Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.