Belki de sadece yorgunum, ama İleri Stagewise Regresyon algoritmasını anlamaya çalışırken sorun yaşıyorum. Gönderen "İstatistiksel Öğrenme Elements" sayfa 60:
İleri-aşamalı regresyon (FS), ileri-aşamalı regresyondan daha da kısıtlıdır. Bu, [ortalama] y değerine eşit bir kesişme ve başlangıçta hepsi 0 olan, katsayıları olan ortalanmış tahmin edicilerle ileri-adım regresyon gibi başlar.
Her adımda algoritma, mevcut artık ile en ilişkili değişkeni tanımlar. Daha sonra, bu seçilen değişken üzerindeki artıkların basit doğrusal regresyon katsayısını hesaplar ve daha sonra bu değişken için akım katsayısına ekler. Bu, değişkenlerin hiçbirinin artıklarla korelasyonu bulunmayana kadar sürdürülür - yani N> p olduğunda en küçük kareler fi t.
Peki, bu algoritma mı ?:
b[1]=mean(y)
b[2..n]=0
r=(y-X*b)
index, maxCorr = max(transpose(r)*X)
while(abs(maxCorr) > someThreshold)
b[index]=b[index]+regress(r,X[1..n][index])
r=(y-X*b)
index, maxCorr = max(transpose(r)*X)
B, katsayıların bir sütun-vektörü olduğunda, X, bir girdi matrisidir ve y, bir çıktıların sütun-vektörüdür. Yani y = X * b + hatası.
Çünkü bu algoritma bana test ettiğim veri kümesinde yalnızca birkaç sıfır olmayan katsayı verdiğinden (eşik = .0001 ile) ve tahmin doğruluğu hiç de iyi değil.