İki lineer regresyon modeli göz önüne alındığında, hangi model daha iyi performans gösterir?


14

Üniversitemde bir makine öğrenimi kursu aldım. Sınavlardan birinde bu soru soruldu.

Model 1:

y=θx+ϵ
Model 2:
y=θx+θ2x+ϵ

Yukarıdaki modellerden hangisi verilere daha uygun? (verilerin doğrusal regresyon kullanılarak modellenebileceğini varsayın)

Doğru cevap (profesöre göre) her iki modelin de eşit derecede iyi performans göstereceğidir. Ancak ilk modelin daha uygun olacağına inanıyorum.

Cevabımın arkasındaki sebep bu. αx+ϵ , olarak yeniden yazılabilen ikinci model, α=θ+θ2ilk modelle aynı olmaz. α aslında bir paraboldir ve bu nedenle minimum bir değere sahiptir ( bu durumda 0.25 ). Bundan dolayı , ilk modeldeki θ aralığı ikinci modeldeki aralığından daha büyüktür α. Dolayısıyla, eğer veriler en iyi uyumun daha az bir eğime sahip 0.25olacağı şekilde olsaydı, ikinci model birinciye kıyasla çok kötü performans gösterecektir. Bununla birlikte, en uygun eğimin eğimi0.25 , her iki model de aynı şekilde iyi performans gösterecektir.

İlki daha mı iyi, yoksa ikisi de aynı mı?


3
Bence haklısın. Bir parametre gerektiren eksprese olacak şekilde θ + θ 2 (bazıları için İçeride ISTV melerin RWMAIWi'nin bunun ne sınırlayıcı bir zorunlu kılmaz) a s mümkündür.' Bu, ikinci modelin , aslında kısıtlı bir optimizasyon problemi olduğu için, birinciden daha az ilişki ifade edebileceği anlamına gelir . Akıl yürütmen bana sağlam geliyor. αθ+θ2θα
Matthew Drury

@MatthewDrury Sadece nerede yanlış gittiğimi anladım, aşağıdaki cevaba bir göz atın (ve yorum)
kush

3
Ben yorum görüyorum ama o varsaymak olaylara ciddi jimnastik olan karmaşık değerler alacaktı. Ben kesinlikle profesör ile konuşmak için bazı çalışma saatleri katılmak istiyorum. Her iki şekilde de iyi bir tartışma yapacaksınız. θ
Matthew Drury

1
-0,25'in nereden geldiği net değil. Açıklayabilir misin?
Mad Jack

1
Profesörün iki noktalı veri kümesi için her modelin uyabilecek nasıl ilgilenen olacağını . Model 1 ve θ = - 1 ile uyum mükemmeldir, ancak Model 2'de mükemmel bir uyum elde etmek için θ nasıl tahmin eder ? {(1,1),(2,2)}θ=1θ
whuber

Yanıtlar:


9

Model 2 şu şekilde yazılabilir: Bu, model 1'e benziyor, sadece hiperparametreler için farklı gösterimle ( θ , β ). Ancak, modelin 1 için biz yazabiliriz θ = ( X

y=(θ+θ2)x+ϵ=βx+ϵ.
θ,β
θ^=(XX)1Xy.

Model 2'de o sahip Fakat Eğer gerçekten belirtildiği gibi o aralığı p ait olmalıdır [ - 0.25 , + ] için İçeride ISTV melerin RWMAIWi'nin R . Bu da bu 2 modelde fark yaratacak.

β=θ+θ2,
β^[0.25,+]θR

θ^Β =arg dakika β - 0.25 (y-xβ)

θ^=argminθR  (yXθ)(yXθ)=(XX)1Xy.
β^=argminβ0.25  (yXβ)(yXβ)

1
Bu mantıklı, ikinci modelde üzerinde herhangi bir kısıtlama olmaması beni çok ! Durumunda , negatif kompleks değerlere sahip olabilir. Ancak bu modeli gerçekten etkilemez, değil mi? Ben oy için temsilcisi yok, ama çok teşekkürler! θ + θ 2 θθθ+θ2θ
kush

@kush Lütfen endişenizi de düzenleyen düzenlenmiş yanıtımı kontrol edin
Wis

1

Sebebini anladığımdan emin değilim. Eğer alırsan:

y = θ x + ϵ

y=αx+ϵ
ve
y=θx+ϵ

ve ve basit bir doğrusal regresyon kullanarak tahmin ederseniz = elde edersiniz . Dahası, metodoloji tamamen aynı olduğundan, her iki denklemde alacağınız değerinde bir fark yoktur . , ilk denklemdeki temel değeri farklı olacaktır , ancak bunun uyumla ilgisi yoktur.θ α θ R 2 θ α = θ + θ 2αθαθR2θα=θ+θ2


5
( - , ) α ( - 0.25 , ) xθ ilk modeldeki aralıkta herhangi bir değer alabilir Ancak ikinci modeldeki yalnızca aralıktaki değerleri alabilir . Her ikisine de basit bir doğrusal regresyon modeli olarak baktığımızda, katsayısına (ikinci modelde) bir kısıtlama getirmiyor muyuz ? Verilere en uygun olumsuz eğim olması durumunda bu bir sorun yaratmaz mı? (,)α(0.25,)x
kush
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.