Dereceyi düşürmek yerine neden polinom regresyonunda düzenlileştirme kullanılmalı?


32

Örneğin, regresyon yaparken, seçilecek iki hiper parametresi genellikle fonksiyonun kapasitesidir (örneğin bir polinomun en büyük üssü) ve düzenlileştirme miktarıdır. Kafam karıştı, neden sadece düşük kapasiteli bir işlev seçmiyor ve ardından herhangi bir düzenlemeyi yok sayıyorsunuz? Bu şekilde, fazla giymeyecek. Düzenlemeyle birlikte yüksek kapasiteli bir işleve sahipsem, düşük kapasiteli bir işleve sahip olmakla aynı düzenlileşmeyle aynı değil mi?

Yanıtlar:


49

Kısa bir süre önce bu fikirlerle oynamak için kullanabileceğiniz bir tarayıcı uygulamasında biraz ulaştım : Scatterplot Smoothers (*).

İşte düşük derecede polinom uyumu ile oluşturduğum bazı veriler

Kuadratik Uyum

İkinci dereceden polinomun verilere iyi bir uyum sağlayacak kadar esnek olmadığı açıktır. Biz arasında çok yüksek bir eğilim sahip bölgelere sahip ve tüm veri uyum altındadır ve sonra tüm veri eğrisi üzerindedir.0.60.850.85

Önyargıdan kurtulmak için, eğrinin derecesini üçe çıkarabiliriz, ancak sorun devam ediyor, kübik eğri hala çok katı

Kübik uygun

Böylece dereceyi arttırmaya devam ediyoruz, fakat şimdi ters problemi yaşıyoruz

On derece uygun

Bu eğri, verileri çok yakından takip eder ve verilerdeki genel biçimlerle iyi karşılanmayan yönlerde uçma eğilimindedir. Düzenlemenin geldiği yer burasıdır. Aynı derece eğrisi (on) ve bazı iyi seçilmiş düzenlemeler ile

Derece On Düzenli

Gerçekten güzel bir form yakaladık!

Yukarıda iyi seçilmiş bir yönü üzerinde küçük bir odaklanma değerinde . Polinomları verilere uyarlarken derece için ayrı bir seçim seçeneğiniz vardır. Derece üç eğrisi underfit ve derece dört eğrisi overfit ise, ortada gitmek için hiçbir yerde yok. Düzenlileştirme, size oynayabileceğiniz sürekli bir karmaşıklık parametreleri yelpazesi sağladığından, bu sorunu çözer.

"Gerçekten çok güzel bir form yakaladık!" Benim için hepsi aynı, yani sonuçsuz görünüyorlar. Neyin iyi ve kötü olduğuna karar vermek için hangi mantığı kullanıyorsunuz?

Doğru tespit.

Burada yaptığım varsayımı, uygun bir modelin kalıntılarda ayırt edilebilir bir yapıya sahip olmaması gerektiğidir. Şimdi, artıkları çizmiyorum, bu yüzden resimlere bakarken biraz çalışmanız gerekiyor, ama hayal gücünüzü kullanabilmelisiniz.

İlk resimde, kuadratik eğri verilere uygunken, artıkları aşağıdaki desende görebiliyorum

  • 0.0'dan 0.3'e kadar, eğrinin üstüne ve altına düzgün bir şekilde yerleştirilirler.
  • 0,3 ile 0,55 arası tüm veri noktaları eğrinin üzerindedir.
  • 0,55'ten 0,85'e kadar tüm veri noktaları eğrinin altında.
  • 0,85'den itibaren, hepsi tekrar eğrinin üstünde.

Bu davranışları yerel önyargı olarak adlandırırdım , eğrinin verinin koşullu ortalamasına iyi yaklaşmadığı bölgeler var.

Kübik spline ile bunu son uyumla karşılaştırın. Tam olarak veri noktalarının kütle merkezinden geçiyor gibi göründüğü gibi görünmeyen herhangi bir bölgeyi seçemiyorum. Bu, genellikle (kesin olarak), iyi bir uyumla kastettiğim şeydir.


2

  • Verilerinizin sınırlarındaki davranışları, düzenlileşmelerde bile çok karmakarışık olabilir.
  • Hiçbir şekilde yerel değiller . Verilerinizi tek bir yerde değiştirmek, çok farklı bir yere uyumu önemli ölçüde etkileyebilir.

Bunun yerine, tarif ettiğiniz gibi bir durumda, doğal kübik eğri çizgileri kullanarak , esneklik ve stabilite arasında en iyi uzlaşmayı sağlayan düzenlileştirme ile birlikte tavsiye ederim . Uygulamada bazı splinelar takarak kendiniz görebilirsiniz.

Doğal Kübik Spline

(*) Bazı modern javascript özelliklerini kullandığım için (ve genel olarak temeli ve safari'yi düzeltmek için tembelliği kullandığım için) bunun yalnızca krom ve firefox'ta çalıştığına inanıyorum. Eğer ilgileniyorsanız kaynak kodu burada .


3
Teşekkürler, ve tarayıcı aracınız harika - böyle küçük etkileşimli demoları seviyorum!
Karnivaurus

@Karnivaurus Teşekkürler, yardımcı olabileceğim için memnunum. Aracı oluşturmak eğlenceliydi, javascript yazmaktan hoşlanıyorum
Matthew Drury

3
6. Bu aracı yazmaya iyi iş! İplik bir ödül verecek kadar yaşlandıkça benden bir ödül alacaksınız.
amip diyor Reinstate Monica

4
+1 Bu gerçekten iyi bir cevap. Yüksek dereceli polinom uyumunun kararsızlığını göstermenin bir yolu, her bir nokta için çıkarılmış bir veri noktasıyla yüksek dereceli regresyonun çizilmesi ve bunun RCS çözümü ile karşılaştırılmasıdır.
Sycorax

1
@MatthewDrury "sınırlı kübik spline" - bunun için üzgünüm.
Sycorax, Reinstate Monica'ya

4

Hayır, aynı değil. Örneğin, dördüncü dereceden bir polinom ile düzenli hale getirilmemiş ikinci dereceden bir polinomu karşılaştırın. İkincisi, üçüncü ve dördüncü güçler için, tahmin prosedürünün doğruluğunu arttırdığı görülüyorsa, normalizasyon prosedürü için ceza boyutunu seçmek için kullanılan prosedüre (muhtemelen çapraz doğrulama) göre büyük katsayılar ortaya koyabilir. Bu, düzenlileşmenin yararlarından birinin, fazladan takma ve alttan takma arasında bir denge kurmak için model karmaşıklığını otomatik olarak ayarlamanıza izin vermesi olduğunu göstermektedir.


Ancak dördüncü dereceden bir polinomun düzenlenmesi eklenirse, bu durum ifade düzeyinin tamamını kullanmasını engeller. Bu nedenle, yeterince düzenlileşmeyle, ifade, ikinci dereceden bir polinom kadar ifade ettiği noktaya indirgenecektir. Yok hayır?
Karnivaurus

1
Belki ceza büyüklüğünüzü önceden düzelttiyseniz, bunun anlamı nedir? Ceza büyüklüğü verilere göre seçilmelidir.
Kodiolog

4

Polinomlar için katsayılardaki küçük değişiklikler bile daha yüksek üsler için fark yaratabilir.

L2


2

Tüm cevaplar harika ve Matt ile benzer düzenlemelerim var. Düzenlemeli karmaşık modelin neden basit modelden daha iyi olduğunu göstermek için başka bir örnek vereceğim .

Sezgisel bir açıklamaya sahip olmak için bir benzetme yaptım.

  • Örnek 1, yalnızca sınırlı bilgiye sahip bir lise öğrencisine sahip (normalleştirmeden basit bir model)
  • 2. davada lisansüstü bir öğrenciniz var, ancak problemleri çözmek için yalnızca lise bilgisini kullanması kısıtlanıyor. (Düzenli karmaşık model)

Eğer iki kişi aynı problemi çözüyorsa, genellikle lisansüstü öğrenciler daha iyi bir çözüm işe yarar, çünkü bilgi ve tecrübe ile ilgili bilgiler.

Şekil 1 aynı verilere 4 bağlantı göstermektedir. 4 bağlantı parçası çizgi, parabol, 3. sıra model ve 5. sıra modeldir. 5. dereceden oluşan modelin fazla uydurma sorunu olabileceğini gözlemleyebilirsiniz.

görüntü tanımını buraya girin

Öte yandan, ikinci deneyde, 5. seviye modelini farklı seviyelerde düzenlilik ile kullanacağız. Sonuncuyu ikinci dereceden modelle karşılaştırın. (iki model vurgulanmıştır), sonuncusunun parabol ile benzer (kabaca aynı model karmaşıklığına sahip) olduğunu ancak verilere göre biraz daha esnek olduğunu göreceksiniz.

görüntü tanımını buraya girin


1
"kabaca aynı model karmaşıklığına sahip" ... görsel olarak "açık" bir karşılaştırma, bunu ölçmenin matematiksel bir yolu var mı?
Silverfish
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.