Yani bu değişkenlerin bazıları kendi aralarında kuvvetle koreledir. Bunları nasıl / neden / hangi bağlamda bağımsız değişkenler olarak tanımlarız ?
Yani bu değişkenlerin bazıları kendi aralarında kuvvetle koreledir. Bunları nasıl / neden / hangi bağlamda bağımsız değişkenler olarak tanımlarız ?
Yanıtlar:
Günümüzün makine öğrenmesi konusundaki vurgusundan geri çekilir ve kontrollü deneysel çalışmalar için ne kadar istatistiksel analizin geliştirildiğini hatırlarsak, "bağımsız değişkenler" ifadesi iyi bir anlam ifade eder.
Kontrollü deneysel çalışmalarda, ilacın ve konsantrasyonlarının veya gübrenin tercihlerinin ve dönüm başına miktarlarının seçimleri , araştırmacı tarafından bağımsız olarak yapılır . İlgi, ilgilenilen bir yanıt değişkeninin (örneğin, kan basıncı, mahsul verimi) bu deneysel manipülasyonlara nasıl bağlı olduğu ile ilgilidir. İdeal olarak, bağımsız değişkenlerin özellikleri sıkıca belirtilmiştir, temelde değerlerini bilmede hata yoktur. Daha sonra standart lineer regresyon, örneğin, bağımsız değişkenlerin artı kalıntı hataların değerleri açısından bağımlı değişkenlerin değerleri arasındaki farkları modeller.
Kontrollü deneysel çalışmalar bağlamında regresyon için kullanılan aynı matematiksel formalizm, gözlemlenen veri setlerinin deneysel manipülasyonu çok az olan veya hiç olmayan bir manipülasyon ile analiz edilmesine de uygulanabilir, bu nedenle "bağımsız değişkenler" ifadesinin bu tip tiplere taşınması şaşırtıcı değildir. çalışmaları. Ancak, bu sayfadaki diğerlerinin belirttiği gibi, bu tür bağlamlarda daha uygun olan "öngörücüler" veya "özellikler" ile muhtemelen talihsiz bir seçimdir.
Birçok yönden "bağımsız değişken" talihsiz bir seçimdir. Değişkenlerin birbirinden bağımsız olması gerekmez ve elbette bağımlı değişkeninden bağımsız olması gerekmez . Öğretimde ve kitabımda Regresyon Modelleme Stratejileri Tahmini kelimesini kullanıyorum . Bazı durumlarda bu kelime yeterince güçlü değildir, ancak ortalama olarak iyi çalışır. (sağ taraf) değişkenlerin istatistiksel bir modeldeki rolünün tam bir açıklaması her seferinde kullanılamayacak kadar uzun olabilir: dağılımının şartlandırıldığı değişkenler veya ölçümler kümesi . Bu, dağılımları şu anda ilgilenmediğimiz ancak değerlerini sabit olarak değerlendirdiğimiz değişkenler kümesini söylemenin başka bir yoludur.X Y
Buradaki diğer cevaplara katılıyorum, "bağımsız" ve "bağımlı" ifadesinin zayıf terminoloji olduğu. Olarak EDM açıklar, bu terminoloji araştırmacı birbirinden bağımsız regressors ayarlayabilirsiniz kontrol deneyleri bağlamında ortaya çıkmıştır. Bu yüklü nedensel çağrışımı olmayan birçok tercih edilen terim var ve benim tecrübeme göre istatistikçiler daha tarafsız terimleri tercih etme eğilimindedir. Burada, aşağıdakiler de dahil olmak üzere kullanılan birçok terimler vardır :
Şahsen, açıklayıcı değişkenler ve cevap değişkeni terimlerini kullanıyorum, çünkü bu terimlerin istatistiksel bağımsızlık veya kontrol, vb. Çağrışımları yoktur. sorunlu bulamadım.)
Frank Harrell ve Peter Flom'un cevaplarına eklemek için:
Değişken "bağımsız" veya "bağımlı" olarak adlandırmanın çoğu zaman yanıltıcı olduğunu kabul ediyorum. Ancak bazı insanlar hala bunu yapıyor. Bir keresinde neden bir cevap duydum:
Regresyon analizinde biz bir "özel" değişkeni (genellikle ile gösterilir var ) ve pek çok "-so-özel değil" değişkenleri ( 'ler) ve değişimler nasıl görmek istiyorum s etkileyen' . Diğer bir deyişle, biz nasıl görmek istiyorum bağlıdır üzerinde 's.X X Y Y X
Bu yüzden “bağımlı” denir. Ve eğer biri “bağımlı” olarak adlandırılırsa, nasıl bir tane daha denir?
"Bağımlı" ve "bağımsız" terimleri kafa karıştırıcı olabilir. Bir anlam sözde-nedensel hatta nedenseldir ve bu “bağımsız değişken” ve “bağımlı değişken” derken kastedilendir. Bir anlamda DV'nin IV'e bağlı olduğunu kastediyoruz. Bu nedenle, örneğin yetişkin insanlarda boy ve kilo ilişkisini modellerken, ağırlığın DV ve boy IV olduğunu söylüyoruz.
Bu, “öngörücü” nin yapmadığı bir şeyi yakalar - yani ilişkinin yönü. Boy kilo öngörürken, ağırlık da boyu tahmin eder. Yani, insanların yüksekliğini tahmin etmeniz ve ağırlıklarının söylenmesi söylendiyse, bu faydalı olacaktır.
Fakat boyun ağırlığa bağlı olduğunu söyleyemeyiz.
Yukarıdaki cevaplara dayanarak, evet, bu bağımlı ve bağımsız değişkenin zayıf terminoloji olduğuna katılıyorum. Ancak birçoğumuz tarafından kullanıldığı bağlamı açıklayabilirim. Genel bir regresyon problemi için, bir Çıktı değişkenine sahip olduğumuzu söylüyorsunuz, ki değeri Y, diğer girdi değişkenlerine bağlıdır, örneğin, x1, x2, x3. Bu nedenle "Bağımlı Değişken" olarak adlandırılır. Ve benzer şekilde sadece bu içeriğe bağlı olarak ve sadece Çıktı ve Girdi Değişkenleri arasında ayrım yapmak için, x1, x2, x3 bağımsız değişken olarak adlandırılır. Çünkü Y'nin aksine başka bir değişkene bağlı değildir (Ama evet, burada kendileriyle olan bağımlılıktan bahsetmiyoruz).
Bağımsız değişkenler bağımsız olarak adlandırılır çünkü diğer değişkenlere bağlı değildir. Örneğin, ev fiyatı tahmin problemini düşünün. House_size, location ve house_price hakkında verilerimiz olduğunu varsayalım. Burada, house_price, house_size ve yere göre belirlenir, ancak yer ve house_size farklı evler için değişiklik gösterebilir.