Sorunuza kısa cevap:
algoritma artık (veya negatif eğime) uyduğunda her adımda bir özellik (yani tek değişkenli model) veya tüm özellikler (çok değişkenli model) kullanıyor mu?
Algoritma bir özellik kullanıyor veya tüm özellikler kurulumunuza bağlıdır. Aşağıda listelenen uzun cevabımda, hem karar kütüğü hem de doğrusal öğrenen örneklerinde, tüm özellikleri kullanıyorlar, ancak isterseniz bir özellik alt kümesine de sığabilirsiniz. Örnekleme sütunları (özellikler), özellikle çok sayıda özelliğiniz varsa, modelin varyansını azaltmak veya modelin "sağlamlığını" artırmak olarak görülmektedir.
İçinde xgboost
, ağaç tabanı öğrenicisi için, colsample_bytree
her yinelemeye uyacak şekilde örnek özellikleri ayarlayabilirsiniz . Doğrusal temel öğrenen için böyle seçenekler yoktur, bu nedenle tüm özelliklere uymalıdır. Buna ek olarak, çok fazla insan xgboost'ta doğrusal öğrenen veya genel olarak gradyan artırıcı kullanmaz.
Güçlendirme için zayıf öğrenci olarak doğrusal için uzun cevap:
Çoğu durumda, doğrusal öğrenenleri temel öğrenen olarak kullanmayabiliriz. Nedeni basit: Birden fazla doğrusal modelin birlikte eklenmesi yine de doğrusal bir model olacaktır.
Modelimizi güçlendirirken temel öğrencilerin bir toplamıdır:
f( x ) =Σm = 1Mbm( x )
burada , yineleme sayısıdır, yinelemenin modelidir .Mbmmth
Örneğin, temel öğrenci doğrusalsa, sadece yineleme çalıştırdığımızı ve ve ,2b1=β0+β1xb2=θ0+θ1x
f(x)=∑m=12bm(x)=β0+β1x+θ0+θ1x=(β0+θ0)+(β1+θ1)x
ki bu basit bir doğrusal model! Başka bir deyişle, topluluk modeli temel öğrenen ile "aynı güce" sahiptir!
Daha da önemlisi, eğer temel modeli temel öğrenci olarak kullanırsak, desteklemede çoklu yinelemeler yerine gitmek yerine doğrusal sistemi çözerek bir adım yapabiliriz .XTXβ=XTy
Bu nedenle, insanlar temel öğrenci olarak doğrusal modelden başka modeller kullanmak isterler. İki ağaç eklemek bir ağaca eşit olmadığından ağaç iyi bir seçenektir. Basit bir vaka ile göstereceğim: karar kütüğü, sadece 1 bölünmüş bir ağaç.
Verileri basit ikinci dereceden bir işlev, tarafından oluşturulan bir işlev uydurma yapıyorum . Doldurulmuş kontur zemin gerçeği (sol) ve son karar güdük artırma (sağ).f(x,y)=x2+y2
Şimdi, ilk dört yinelemeyi kontrol edin.
Not, doğrusal öğreniciden farklı olarak, 4. yinelemedeki modele, diğer parametrelerle bir yineleme (bir tek karar kütüğü) ile ulaşılamaz.
Şimdiye kadar, insanların neden doğrusal öğrenenleri temel öğrenen olarak kullanmadığını açıkladım. Ancak, hiçbir şey insanların bunu yapmasını engellemez. Temel öğrenci olarak doğrusal modeli kullanırsak ve yineleme sayısını kısıtlarsak, doğrusal bir sistemi çözmeye eşittir, ancak çözme işlemi sırasında yineleme sayısını sınırlandırırız.
Aynı örnek, ancak 3B çizimde, kırmızı eğri verilerdir ve yeşil düzlem son uyumdur. Kolayca görebilirsiniz, son model doğrusal bir modeldir ve z=mean(data$label)
x, y düzlemine paraleldir. (Bunun nedenini düşünebilirsiniz? Bunun nedeni, verilerimizin "simetrik" olmasıdır, bu nedenle uçağın eğilmesi kaybı artıracaktır). Şimdi, ilk 4 iterasyonda neler olduğuna bakın: Takılan model yavaşça optimal değere (ortalama) yükseliyor.
Sonuç olarak, doğrusal öğrenen yaygın olarak kullanılmamaktadır, ancak hiçbir şey insanların onu kullanmasını veya bir R kütüphanesinde uygulamasını engellemez. Buna ek olarak, modeli normalleştirmek için kullanabilir ve yineleme sayısını sınırlayabilirsiniz.
İlgili yazı:
Doğrusal Regresyon için Gradyan Arttırma - neden çalışmıyor?
Karar kütüğü doğrusal bir model midir?