Neden dikey mesafeler?


11

OLS tahmini neden noktaların yatay mesafelerden ziyade çizgiye dikey sapmalarını içeriyor?


1
Eski soru, ama veriyi x tarafından parametrelenen bir olasılık dağılımının bir örneği olarak görüntülemek yararlıdır
Bendy

Yanıtlar:


12

OLS ( normal en küçük kareler ), yatay mesafelerle temsil edilen değerlerin deneyci tarafından önceden belirlendiğini veya yüksek doğrulukla (dikey mesafelere göre) ölçüldüğünü varsayar. Yatay mesafelerde bir belirsizlik söz konusu olduğunda, OLS kullanmamalısınız, bunun yerine değişkenlerde hata modellerine veya muhtemelen temel bileşenler analizine bakmalısınız .


"Ortogonal regresyon", kontamine apsis ve koordinatlarla başa çıkmak için yöntemler ararken karşılaşılabilecek başka bir şeydir.
JM bir istatistikçi değil

+1 Bu sadece istatistiklerde bir niş; daha karmaşık en küçük kareler yöntemleri (sadece X değişkenliği eklemekle kalmayıp aynı zamanda hata tahminlerine dayalı puanlar için farklı cezalar) deneysel fizikte yaygındır; KÖK çerçevesi onlarca var.

1

İlginç soru. Benim cevabım, bir OLS modelini takarken örtük olarak ve öncelikle eldeki bağımlı değişkeni tahmin etmeye / açıklamaya çalışıyoruz - "Y'ye X" deki "Y". Bu nedenle, asıl endişemiz, sonuç olarak, takılmış hattımızdan gerçek gözlemlere olan mesafeyi en aza indirmek, yani dikey mesafeyi en aza indirmek olacaktır. Bu elbette kalıntıları tanımlar.

Ayrıca, en küçük kareler formüllerinin elde edilmesi diğer rakip yöntemlerin çoğundan daha kolaydır, belki de bu yüzden ilk önce ortaya çıkmıştır. : P

'Whuber' yukarıda belirtildiği gibi, X ve Y'ye en uygun çizgiyi takarken eşit vurgu ile tedavi eden başka yaklaşımlar da vardır. Fark ettiğim bu yaklaşımlardan biri, noktalar ve çizgi arasındaki dikey mesafeleri en aza indiren "ana çizgiler" veya "ana eğriler" regresyonudur (dikey hata çizgileri yerine, monte edilen çizgiye 90 derece olanlarınız vardır) . Aşağıda okumanız için bir referans yazıyorum. Uzun ama çok erişilebilir ve aydınlatıcı.

Umarım bu yardımcı olur, Brenden

  1. Trevor Hastie. Temel Eğriler ve Yüzeyler , Doktora tezi, Stanford Üniversitesi; 1984

1

Muhtemelen tasarlanmış deneylerle de ilgilidir - x, deneysel tasarımın bir parçası olan kontrollü bir miktarsa, deterministik olarak kabul edilir; y ise sonuçtur ve rastgele bir niceliktir. x sürekli bir miktar olabilir (örn. bazı ilaçların konsantrasyonu), ancak 0/1'lik bir bölünme olabilir (y'nin Gaussian olduğu varsayılarak 2 örnek t-testine yol açar). X sürekli bir miktarsa, bazı ölçüm hataları olabilir, ancak tipik olarak bu, y değişkenliğinden çok daha küçükse, bu dikkate alınmaz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.