Regresyon modellerinde sol ve sağ taraf terminolojisi


10

y=β0+β1x1+ε0

Yukarıda belirtilen çok basit doğrusal regresyon gibi regresyon modellerini tanımlayan dil sıklıkla değişir ve bu tür varyasyonlar genellikle anlamlarda hafif değişimler taşır. Örneğin, modelin denklemin sol tarafındaki kısmı (bilmediğim diğerleri arasında) parantez içindeki çağrışımlar ve ifadelerle ifade edilebilir:

  • Bağımlı değişken (nedensel bağımlılıkta ipuçları)
  • Öngörülen değişken (model tahminlerini ima eder / tahminlerde bulunur)
  • Yanıt değişkeni (nedensellik veya en azından zamansal sıralama anlamına gelir)
  • Sonuç değişkeni (nedensellik anlamına gelir)

Nomenklatürdeki varyasyon, denklemin sağ tarafında da geçerlidir (diğer terimler hakkında bir cahil olduğumla aynı sorumluluk reddi):

  • Bağımsız değişken (nedensel önceliği ifade eder, deney tasarımında ipuçları)
  • Tahmin değişkeni (tahminleri ima eder, değişkenin kendisiyle ilişkilendirilmiş sıfır olmayan bir parametre tahminine sahip olduğunu ima eder)

Veterinerlik önerme veya araştırmaları iletme sürecinde sadece bir veya daha fazla terimin kullanımıyla ilgili değil, daha sonra yerine geçmeyi tercih ettiğim terimle de çağrılma fırsatım oldu. Arayanlar elbette bilgiçlik yaparken (NB: Profesyonel bir bilgiciyim, bu yüzden sempati duyuyorum), çünkü elbette hepimiz neyin iletildiğini anladık , hala merak ediyorum:

Regresyon modellerinde (a) modelin dış kullanımları, (b) değişkenler arasındaki nedensel ilişkiler ve (c) çalışmanın yönleri açısından agnostik olan sol ve sağ değişkenler için yaygın olarak kullanılan terimler var mı? Değişkenleri kendileri üretmek için kullanılan tasarımlar?

NB: Ben am değil (yani ben nedensellik, çalışma tasarımı, vb çok fazla dikkat), ancak genellikle bu tür modelleri hakkında konuşmak için bir dilde daha ilgileniyorum doğru modelleme ve uygun yorumlama önemli konular hakkında sorular soruyorlardı.

(Sanırım, "sol değişkenler" ve "sağ değişkenler" in güvenilir bir cevap olarak yorumlanabileceğini, ancak bu terimlerin hantal göründüğünün farkındayım ... belki de bu tıknaz bir sorudur. :)


Bu konuda bir karışıklık olmamalı.
Carl

1
Bence kısa cevap hayır. Bence bu iyi bir sebep. Resmi durumlarda, değişkenleri tanımlamak için kullanılan dil, uygulama / etki alanı amaçlanan modellerde ayırt edici bir yorum ima edecek kadar incelikli olmalıdır (yani, bir regresyon modelinde nedenselliğin ima edilip edilmediğini bilmek ve isimlendirmenin uygun şekilde kullanılmasının yardımcı olacağını bilmek çok önemlidir. Bununla).
Zachary Blumenfeld

2
@ZacharyBlumenfeld (a) Yorumlarda cevap vermeyin. :) (b) Ve yine de, tasarım, disiplin bilgi alanları vb. incelemeye başvurmadan genel olarak "regresyon" hakkında konuşuyoruz (örneğin, pek çok kişi çalışma tasarımı, nedensellik çağırmadan en küçük kareler tahmincisi hakkında konuşuyor ve yazıyor. , vb.). Geniş bir istatistiksel çaba sınıfını tanımlamak için uygulamadan bağımsız bir dilimiz varsa, neden bu tür çabaların bileşenleri için benzer şekilde agnostik bir dil yoktur?
Alexis

1
Ben yorum olarak mesaj am yüzden emin değil bu, bir cevap dikkate alınması gereken değer ise: Belki olarak projeksiyonlar gelen bazı terminoloji (orada bir izdüşümüdür üzerine ) alan? Gibi projektörler ve Proje ve (ı ilgili terimleri hatırlamıyorum olarak artık bu kadar yapıyorum). Bu terminoloji sizin (a), (b) ve (c) 'nizden arınmış olmalıdır. X(X'X)-1X'yyX
Richard Hardy

1
@Kenji Ben senin bakış açının çoğuna yürekten katılıyorum. Bununla birlikte, uygulanan bir durumda sadece regresyon denklemleri hakkında konuşabileceğimi / konuşabileceğimi kabul etmiyorum: örneğin, bu tür yöntemlerin uygulanmasını incelerken, tüm regresyon modellerinin sol ve sağ değişkenleri hakkında konuşabilen bir dile sahip olmalıyız. disiplinler arasında meta düzeyde.
Alexis

Yanıtlar:


6

Bu mükemmel bir soru. Aslında, cevabı o kadar iyi ki. Bildiğim kadarıyla, Y'yi tanımlamak için gerçek bir "agnostik" terim yoktur.

Deneyimlerim ve okumalarımda, anlambilimin alana özgü ve aynı zamanda model-hedefe özgü olduğunu buldum.

Ekonometristler, açıklayıcı bir model oluştururken Bağımlı değişken terimlerini kullanacaktır. Teorik açıklayıcı güce göre daha doğru tahmin / tahmine odaklanan bir tahmin modeli oluştururken Öngörülen veya Takılan veya Tahmini değişken terimlerini kullanabilirler.

Büyük Veri / Derin Öğrenme kalabalığı tamamen farklı bir dil kullanır. Ve genellikle Yanıt değişkeni veya Hedef değişkeni terimlerini kullanırlar. Modelleri öyle kara kutulardır ki, tipik olarak bir fenomeni tahmin etmek ve doğru bir şekilde tahmin etmek yerine açıklamaya çalışmazlar. Ancak, bir şekilde Öngörülen terimini kullanarak yakalanmazlardı. Yanıt veya Hedef terimlerini çok tercih ederler.

Sonuç değişkeni terimine daha az aşinayım. Psikoloji, tıp, klinik araştırmalar, epidemiyoloji gibi sosyal bilimler gibi daha az maruz kaldığım diğer alanlarda yaygın olabilir.

Yukarıdakiler göz önüne alındığında, Y'yi tanımlamak için size herhangi bir "agnostik" semantik sağlayamadım. Bunun yerine, farklı kitleye hitap ederken ve modelinizin hedefini yansıtırken hangi semantiğin kullanılacağı hakkında biraz bilgi verdim. Özetle, ekonometrilerle Bağımlı değişken ve Derin Öğrenme türleriyle Yanıt veya Hedef değişken hakkında konuşursanız kimsenin zarar göreceğini düşünmüyorum. Umarım bu kalabalıkları birbirinden ayırabilirsiniz, aksi takdirde elinizde sözlü bir yemek savaşı olabilirsiniz.


Keşke size "sözlü gıda kavga" için fazladan oy verebilir: D
Alexis
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.