Doğrusal regresyonda, regülasyon neden parametre değerlerini de cezalandırıyor?


9

Şu anda sırt regresyonunu öğreniyorum ve daha karmaşık modellerin (veya daha karmaşık bir modelin tanımının) cezalandırılması konusunda biraz kafam karıştı.

Anladığım kadarıyla, model karmaşıklığı mutlaka polinom düzeni ile ilişkili değildir. Yani:

2+3+4x2+5x3+6x4
aşağıdakilerden daha karmaşık bir modeldir:
5x5

Düzenlemenin amacının model karmaşıklığını düşük tutmak olduğunu biliyorum, yani diyelim ki 5. dereceden bir polinomumuz var

f(x;w)=w0+w1x+w2x2+w3x3+w4x4+w5x5

0 olan daha fazla parametre daha iyidir.

Ama anlamadığım şey, eğer aynı sıra polinomuysa, daha düşük parametre değerleri neden daha az cezalandırılır? Öyleyse neden:

2+5x+x3
daha az karmaşık bir model olmak

433+342x+323x3
ikisi de aynı polinom düzenindedir ve parametre değerleri sadece verilere bağlıdır.

Teşekkür ederim!

Yanıtlar:


10

parametre değerleri sadece verilere bağlıdır

Bu, sorunuzun anahtar kısmıdır. Burada kafan karışıyor.

Evet, parametre değerleri verilere bağlıdır. Ancak bir modele uyduğumuzda veriler sabittir . Başka bir deyişle, gözlemlere bağlı bir modele uyuyoruz . Farklı veri kümelerine takılan farklı modellerin karmaşıklığını karşılaştırmak mantıklı değildir .

Ve sabit bir veri kümesi bağlamında, bir model

2+5x+x3

gerçekten mümkün olan en basit modele, yani düz sıfır modeline,

433+342x+323x3,

ve bu, gözlemlerinizin ölçeğinden bağımsız olarak geçerlidir.

Bu arada, kesişme (2 ve 433örneğin, çoğu Lasso formülasyonunda sıklıkla cezalandırılmaz, çünkü genellikle gözlemlerin genel ortalamasını yakalama konusunda serbestçe değişmesine izin vermekte iyiyiz. Başka bir deyişle, modeli tam bir sıfır modeli (sıfırın genellikle keyfi olacağı) değil, gözlemlerin ortalamasına doğru küçültüriz. Bu anlamda bir daire2 ve bir daire 433 model eşit derecede karmaşık kabul edilir.


1
Düşük katsayılar yüksek sıfır katsayılardan yüksek katsayılardan daha mı uzaktır? Bu bir yazım hatası mı, yoksa sabit bir modelden daha uzak bir modelin neden daha yakın bir sabit model kadar cezalandırılmadığını yanlış anlıyor muyum?
RM

Üzgünüm, bu gerçekten bir yazım hatasıydı. Düzenleyeyim. Bunu işaret ettiğiniz için teşekkürler!
Stephan Kolassa
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.