Sinir ağı için özellikler nasıl seçilir?


16

Bu soruya net bir cevap olmadığını biliyorum, ama diyelim ki çok fazla veri içeren devasa bir sinir ağım var ve girişe yeni bir özellik eklemek istiyorum. "En iyi" yol, ağı yeni özellik ile test etmek ve sonuçları görmek olacaktır, ancak özelliğin BENZERSİZ YARDIMCI olup olmadığını test etmenin bir yöntemi var mı? Korelasyon önlemleri gibi ( http://www3.nd.edu/~mclark19/learn/CorrelationComparison.pdf ) vb?


1
Olmayan bir rasgele korelasyon özelliği olduğunu bir göstergesi olabilir olduğunu faydalıdır. Ancak, fikirleri göz ardı edebilecek eğitim öncesi testlerden emin değilim. Bağladığınız makale, lineer olmayan korelasyonların mevcut testlerle iyi tespit edilmediğini, ancak bir sinir ağının bunları bulma ve kullanma şansına sahip olduğunu açıkça ortaya koymaktadır.
Neil Slater

Yanıtlar:


16

Yeni özellik ile mevcut bir özellik arasında çok güçlü bir ilişki olması, yeni özelliğin çok az yeni bilgi sağladığının oldukça iyi bir işaretidir. Yeni özellik ile mevcut özellikler arasında düşük bir korelasyon olması muhtemeldir.

Yeni özellik ile öngörülen değişken arasında güçlü bir doğrusal korelasyon, yeni bir özelliğin değerli olacağının iyi bir işaretidir, ancak yüksek bir korelasyonun olmaması, zayıf bir özelliğin işareti değildir, çünkü sinir ağları doğrusal kombinasyonlarla sınırlı değildir. değişkenler.

Yeni özellik, mevcut özelliklerin bir kombinasyonundan manuel olarak oluşturulduysa, dışarıda bırakmayı düşünün. Sinir ağlarının güzelliği, çok az özellik mühendisliği ve önişlemenin gerekli olmasıdır - özellikler bunun yerine ara katmanlar tarafından öğrenilir. Mümkün olduğunda, onları mühendislik için öğrenme özelliklerini tercih edin.


Her zaman öngörülen değeri özelliklerle karşılaştırmayı düşündüm, özellikler arasındaki korelasyondan bahsediyorsunuz. Cevabınız davam için de geçerli mi? teoride sadece tahmin edilecek değerle ilişkili yeni özellikler eklemeliyim, değil mi?
marcodena

Bu aynı zamanda değerli bir metrik - bunu da yanıtlamak için cevabımı güncelledim.
Madison Mayıs

Kısacası, öngörme değeri ile güçlü korelasyonlar büyük bir işarettir, ancak öngörme değeri ile zayıf korelasyon mutlaka kötü bir işaret değildir.
Madison Mayıs

Teşekkürler. Bir rapor yazıyorum ve özellikleri (hatta sonuçlardan önce) haklı göstermek için doğrusal / doğrusal olmayan korelasyonları göstermek istedim. Bir anlam ifade ediyor mu? Cevabınızdan bir korelasyon matrisi yapabilirdim ama belki de nosense
marcodena

1
Doğrusal olmayan korelasyonları kullanırdım, ama tamam teşekkürler
marcodena

0

Sklearn kullanıyorsanız, model.feature_importances_ adında iyi bir işlev vardır. Modelinizi / yeni özelliğinizi deneyin ve yardımcı olup olmadığını görün. Ayrıca bak burada ve burada örnekler için.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.