«feature-construction» etiketlenmiş sorular

Özellik mühendisliği, makine öğrenimi modellerine yönelik özellikler oluşturmak için verilerin alan bilgisini kullanma sürecidir. Bu etiket, CrossValidated'da konu dışı olacak kod soran sorular hariç, özellik mühendisliğiyle ilgili hem teorik hem de pratik sorular içindir.

6
Kategorik değişkenleri birçok seviyede çökertmenin ilkeli yolu?
İstatistiki bir modelde bir girdi (öngörücü) olarak kullanmak amacıyla birçok kategoriyi bir kaçına çökertmek (veya birleştirmek) için hangi teknikler mevcuttur? Üniversite öğrencisi büyük (bir lisans öğrencisi tarafından seçilen disiplin) gibi bir değişken düşünün . Sırasız ve kategoriktir, ancak potansiyel olarak onlarca farklı seviyeye sahip olabilir. Diyelim ki regresyon modelinde majör …

2
Otomatik kodlayıcılar anlamlı özellikleri öğrenemez
Bu ikisi gibi 50.000 imge var: Veri grafiklerini gösteriyorlar. Bu görüntülerden özellikler çıkarmak istedim, böylece Theano (deeplearning.net) tarafından sağlanan otomatik kodlayıcı kodunu kullandım. Sorun şu ki, otomatik kodlayıcılar herhangi bir özellik öğrenmiyor gibi görünüyor. RBM'yi denedim ve aynı. MNIST veri kümesi hoş özellikler sağlıyor ancak verilerim hiçbir sonuç vermedi. Aşağıdaki …

7
Coğrafya veya posta kodunu makine öğrenme modelinde veya öneri sisteminde nasıl temsil edilir?
Bir model yapıyorum ve coğrafi konumumun hedef değişkenimi tahmin etmede çok iyi olacağını düşünüyorum. Kullanıcılarımın her birinin posta kodunu aldım. Yine de, modelimde posta kodunu tahmin özelliği olarak eklemenin en iyi yolu hakkında tam olarak emin değilim. Posta kodu bir sayı olmasına rağmen, sayı yukarı ya da aşağı giderse bir …

2
Filtre matrisinin elemanları nasıl başlatılır?
Daha iyi (Convnet veya TensorFlow gibi) kütüphanelere bağlı olmayan Python kodunu yazarak kıvrımlı sinir ağlarını daha iyi anlamaya çalışıyorum ve ne zaman çekirdek matris için değerleri seçmek için literatürde sıkışıp kalıyorum görüntü üzerinde evrişim yapmak. Bir CNN katmanları gösteren aşağıdaki resimde özellik haritaları arasındaki adımda uygulama ayrıntılarını anlamaya çalışıyorum . …

2
Sürekli bağımsız değişkenleri / özellikleri ne zaman ayrılmalı / atmalıyız ve ne zaman yapmamalıyız?
Bağımsız değişkenleri / özellikleri ne zaman ayrılmalı / atmalıyız ve ne zaman yapmamalıyız? Soruma cevap verme girişimlerim: Genelde, binmemeliyiz çünkü binicilik bilgi kaybeder. Çekme aslında modelin serbestlik derecesini arttırıyor, bu nedenle çekmeden sonra aşırı sığmaya neden olmak mümkündür. Eğer bir "yüksek önyargı" modelimiz varsa, kırma kötü olmayabilir, fakat "yüksek sapma" …

5
Özellik mühendisliği neden çalışır?
Son zamanlarda, ML sorunlarına daha iyi çözümler bulmanın yollarından birinin özelliklerin oluşturulması olduğunu öğrendim. Örneğin iki özelliği toplayarak bunu yapabiliriz. Örneğin, bir tür kahramanın iki “saldırı” ve “savunması” özelliğine sahibiz. Daha sonra "saldırı" ve "savunma" nın toplamı olan "toplam" adı verilen ek bir özellik oluştururuz. Şimdi bana garip görünen şey, …

2
Özellik mühendisliği için öğreticiler
Herkesin bildiği gibi, özellik mühendisliği makine öğrenimi için son derece önemlidir, ancak bu alanla ilişkili çok az malzeme buldum. Kaggle'daki çeşitli yarışmalara katıldım ve bazı durumlarda iyi özelliklerin iyi bir sınıflandırıcıdan daha önemli olabileceğine inanıyorum. Özellik mühendisliği hakkında herhangi bir öğretici bilen var mı, ya da bu saf deneyim mi?


1
“Özellik alanı” nedir?
"Feature space "'nin tanımı nedir? Örneğin, SVM'leri okurken "özellik alanına eşleme" hakkında okudum. CART hakkında okurken, "özellik alanına bölümleme" hakkında okudum. Neler olduğunu anlıyorum, özellikle de CART için, ama kaçırdığım bir tanım olduğunu düşünüyorum. "Özellik alanı" nın genel bir tanımı var mı? SVM çekirdekleri ve / veya CART hakkında bana …

2
Sürekli ve ikili verileri doğrusal SVM ile mi karıştırıyorsunuz?
Bu yüzden SVM'lerle oynuyorum ve bunun iyi bir şey olup olmadığını merak ediyorum: Ben sürekli özellikleri (0-1) bir dizi ve ben kukla değişkenlere dönüştürdü kategorik özellikleri bir dizi var. Bu özel durumda, kukla değişkente ölçüm tarihini kodlarım: Veri aldığım 3 dönem var ve onlar için 3 özellik numarası ayırdım: 20: …

5
Sadece eğitim veri kümesinde keşifsel veri analizi yapmak daha mı iyi?
Veri kümesinde keşifsel veri analizi (EDA) yapıyorum. Sonra bağımlı bir değişkeni tahmin etmek için bazı özellikleri seçeceğim. Soru şu: EDA'yı sadece eğitim veri setimde yapmalı mıyım? Ya da eğitim ve test veri setlerine birlikte katılmalı mıyım, sonra da ikisi üzerinde EDA mı yapmalı ve bu analize dayalı özellikleri mi seçmeliyim?



1
Otomatik anahtar kelime çıkarma: özellik olarak kosinüs benzerliklerini kullanma
Bir belge terimi matris ve şimdi denetimli bir öğrenme yöntemi (SVM, Naive Bayes, ...) ile her belge için anahtar kelimeler ayıklamak istiyorum. Bu modelde, zaten Tf-idf, Pos etiketi, ... kullanıyorumMMM Ama şimdi nexts'i merak ediyorum. Terimler arasında kosinüs benzerlikleri olan bir matrisim var .CCC Bu benzerlikleri modelim için bir özellik …

2
Anlamsal anlamı koruyan alan-agnostik özellik mühendisliği?
Özellik mühendisliği genellikle makine öğrenimi için önemli bir bileşendir ( 2010'da KDD Kupası'nı kazanmak için yoğun olarak kullanılmıştır ). Ancak, çoğu mühendislik tekniğinin de altta yatan özelliklerin sezgisel anlamlarını yok etmek veya belirli bir alan adına ve hatta belirli türdeki özelliklere çok özeldir. Birincisinin klasik bir örneği temel bileşen analizi …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.