Bu sanat regresyon metodolojisi mi?


33

Kaggle yarışmalarını uzun zamandır takip ediyorum ve birçok kazanma stratejisinin "büyük üçler" den en az birini kullanmayı içerdiğini fark ettim: torbalama, güçlendirme ve istifleme.

Regresyonlar için, mümkün olan en iyi regresyon modelini oluşturmak yerine, (Genelleştirilmiş) doğrusal regresyon, rasgele orman, KNN, NN ve SVM regresyon modelleri gibi çoklu regresyon modelleri oluşturmak ve sonuçları makul bir şekilde harmanlamak gibi görünüyor. Her bir yöntemi bir çok kez uygulayın.

Tabii ki, her yöntemin sağlam bir şekilde anlaşılması anahtardır ve doğrusal bir regresyon modeline dayanan sezgisel bir hikaye anlatılabilir, ancak bunun mümkün olan en iyi sonuçları elde etmek için sanat metodolojisi haline gelip gelmediğini merak ediyorum.


Bazı durumlarda, Sinir Ağı, regresyon yapmanın "klasik" yolunu yendi. Örnek olarak, Ne kadar yağmur yağdı II . Ama kesinlikle bir kara kutu.
YCR

@YCR Bir kara kutu olduğuna katılıyorum. İşyerinde harika bir makine öğrenme modeli oluşturdum ve iş insanlarına ya da modele aşina olmayan birine açıklamaya çalıştım, konuşma genellikle şu şekilde bitiyor: Harika bir Makine Öğrenme modeli kurdum, sihir gibi çalışır, ancak Sana ilginç bir hikaye anlatamam.
Maxareo

Yanıtlar:


41

Bu birkaç tahminleri alırsak o, en azından geç 1960' den, iyi bilinmektedir ve ortalama bunları, daha sonra birçok durumda sonuçlanan toplu tahmini bireysel tahminleri geride bırakacaktır. Torbalama, yükseltme ve istifleme tamamen bu fikre dayanır. Yani evet, amacınız tamamen öngörü ise, o zaman çoğu durumda yapabileceğiniz en iyisidir. Bu yöntemle ilgili problemli olan, sonucunu geri getiren, ancak onu anlamanıza ve yorumlamanıza yardımcı olmayan bir kara kutu yaklaşımı olmasıdır. Açıkçası, tek bir yöntem yerine birkaç tahmin yapmanız gerektiğinden, diğer yöntemlerden daha fazla hesaplama gerektiriyor.

† Bu , genel olarak herhangi bir tahminle ilgilidir , ancak literatür tahmininde sıklıkla tarif edilmektedir.


Winkler, RL. ve Makridakis, S. (1983). Tahminlerin birleşimi. JR Statis. Soc. A. 146 (2), 150-157.

Makridakis, S. ve Winkler, RL (1983). Tahminlerin Ortalamaları: Bazı Ampirik Sonuçlar. Yönetim Bilimi, 29 (9) 987-996.

Clemen, RT (1989). Tahminlerin birleştirilmesi: Bir gözden geçirme ve açıklamalı kaynakça. Uluslararası Tahmini Dergisi, 5, 559-583.

Bates, JM ve Granger, CW (1969). Tahminlerin birleşimi. Veya, 451-468.

Makridakis, S. ve Hibon, M. (2000). M3 Yarışması: sonuçları, sonuçları ve sonuçları. Uluslararası tahmin dergisi, 16 (4), 451-476.

Reid, DJ (1968). Gayri safi yurtiçi hasıla üç tahminini birleştirerek. Economica, 431-444.

Makridakis, S., Spiliotis, E. ve Assimakopoulos, V. (2018). M4 Yarışması: Sonuçlar, bulgular, sonuç ve ileriye dönük. Uluslararası Tahmini Dergisi.


1
Hançer dipnotundaki bağlantı benim için çalışmıyor gibi görünüyor?
Silverfish,

@ Silverfish teşekkürler, düzeltildi. Bağlantı küçük bir öneme sahipti ama yine de işe yaramazsa işe yaramaz.
Tim

0

Arthur (1994) , karmaşıklık literatüründe iyi bilinen hoş bir kısa bildiri / düşünce deneyine sahiptir.

Sonuçlardan biri, ajanların denge dışı koşullar altında (bunlardan "ormanları" olsalar bile) daha iyi tahmin modelleri seçememesidir. Örneğin, soru borsa performansına uygulanırsa, Arthur'un (1994) ayarı geçerli olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.