R kare değeri modelleri karşılaştırmak için uygun mu?


17

Otomobil seri ilan sitelerinde mevcut fiyatları ve özellikleri kullanarak, otomobil fiyatlarını tahmin etmek için en iyi modeli belirlemeye çalışıyorum.

Bunun için scikit-öğrenim kütüphanesinden birkaç model ve pybrain ve neurolab'dan sinir ağı modelleri kullandım. Şu ana kadar kullanılan bir yaklaşım, bazı örneklerle veri sabit bir miktar (makine öğrenme algoritmaları) çalıştırmak ve karşılaştırmaktır R2 scikit öğrenmek ölçümlerini modülü ile hesaplanmıştır değerleri.

  1. Mi farklı modellerin performansını karşılaştırmak için iyi bir yöntem?R2
  2. Elastik ağ ve Rastgele ormanlar gibi modeller için oldukça kabul edilebilir sonuçlar elde etsem de , Sinir ağı modelleri için çok zayıf değerleri aldım , bu yüzden sinir ağlarını (veya doğrusal olmayan yöntemleri) değerlendirmek için uygun bir yöntem mi?R 2R2R2

2
Kısa cevap hayır . Cevabımı burada okumanıza yardımcı olabilir: Sorunuzla yakından ilgili olan en iyi modeli seçmek için model değerlendirme ve karşılaştırma . Bir aday çözüm açıklanmıştır burada . Daha genel bir anlayış için, sitedeki model seçim etiketi altında kategorilere ayrılmış bazı konuları okumaya çalışabilirsiniz .
gung - Monica'yı eski

Sinir ağları kullanarak regresyon için uygun bir uyum ölçüsünün ne olacağını sorabilir miyim?
Manik

Yanıtlar:


18

Bence sorunuzu cevaplarken dikkate alınması gereken önemli kısım

Otomobil fiyatlarını tahmin etmek için en iyi modeli belirlemeye çalışıyorum

çünkü bu ifade , modeli neden kullanmak istediğiniz hakkında bir şey ifade eder . Model seçimi ve değerlendirme, ayarlanmış değerlerinizle ne elde etmek istediğinize dayanmalıdır.

İlk olarak, geniş özeti sağlayan neyi doesR2 Ben emin zaten farkında değilim karesel kayıp fonksiyonu dayalı bir ölçekli tedbir, hesaplar. Bunu anlamak için, kalıntı tanımlamak i-inci gözlem için y i ve buna karşılık gelen yerleştirilen değeri, y i . Uygun gösterimi kullanarak S S R : = N i = 1 e 2 i , S S T : = ei=yiy^iyiy^iSSR:=i=1Nei2,R '2, sadece gibi tanımlanmıştır, R2=1-SS, R/SS, T.SST:=i=1N(yiy¯)2R2R2=1SSR/SST

İkincisi, bakalım kullanarak neyi modeli seçimi / değerlendirme aracı içinR2 . M : M M modeli kullanılarak oluşturulan bir dizi tahmin seçtiğimizi varsayalım , burada M göz önünde bulundurulan modeller koleksiyonudur (örneğin, bu koleksiyon Sinir ağları, rastgele ormanlar, elastik ağlar, ...). Yana S S T tüm modeller arasında sabit kalır minimize eğer R 2 tam olarak modelini bu en aza indirir seçecek S S R . Başka bir deyişle,Y¯MM:MMMSSTR2SSRMinimum kare hata kaybını üreten M M !MM

R2SSR L2L1

R2Lp1p<2p=1LpLp

Özetle, model seçimi / değerlendirmesi modelin amacından bağımsız olarak düşünülemez.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.