Herhangi bir regresyon modeline dahil edilecek seyrek temel bileşenlerin sayısını seçme yaklaşımları konusunda deneyimi olan var mı?
Herhangi bir regresyon modeline dahil edilecek seyrek temel bileşenlerin sayısını seçme yaklaşımları konusunda deneyimi olan var mı?
Yanıtlar:
Sorunuzla ilgili doğrudan öngörülerim olmasa da , ilginizi çekebilecek bazı araştırma makaleleriyle karşılaştım . Tabii ki, seyrek PCA , temel bileşen regresyonu ve ilgili konular hakkında konuştuğunuzu doğru anlarsam . Bu durumda, işte kağıtlar:
Çapraz doğrulama sonuçları ayrıca LSI alanı için optimal boyut sayısını belirlemek için kullanıldı. Çok az boyut, verilerin tahmin gücünden faydalanmadı; çok fazla boyut aşırı oturmaya neden oldu. Şekil 4, farklı sayıda LSI boyutuna sahip modeller için ortalama hataların dağılımını gösterir. Dört boyutlu LSI alanlarına sahip modeller, hem en az ortalama hata sayısını hem de en az ortalama hata sayısını üretti, bu nedenle son model dört boyutlu bir LSI alanı kullanılarak oluşturuldu.
Ieee üyesi değilseniz bir kopya gönderebilirim.
Bu lisansta yazdığım bir makaleden. Lojistik regresyon modelimde kaç boyutun (Gizli Semantik Dizin Oluşturma PCA'ya benzer) karar vermem gerektiğinde bir sorun yaşadım. Yaptığım şey bir metrik (yani .5 işaretleme olasılığı kullanıldığında hata oranı) seçmekti ve farklı boyutlarda eğitilmiş farklı modeller için bu hata oranının dağılımına baktı. Daha sonra en düşük hata oranına sahip modeli seçtim. ROC eğrisinin altındaki alan gibi diğer metrikleri kullanabilirsiniz.
Sizin için boyut sayısını seçmek için aşamalı regresyon gibi bir şey de kullanabilirsiniz. Özellikle ne tür bir regresyon yapıyorsunuz?
Seyrek btw ile ne demek istiyorsun?