Özellik oluşturma ve özellik çıkarma arasındaki fark nedir?


13

Birisi bana özellik yaratmanın amacının ne olduğunu söyleyebilir mi? ve bir görüntüyü sınıflandırmadan önce neden özellik alanı zenginleştirmesi gerekiyor? Bu gerekli bir adım mı?

Özellik alanını zenginleştirmek için herhangi bir yöntem var mı?

Yanıtlar:


13

Özellik Üretimi - Bu, istatistiksel analizinizde potansiyel kullanım için ham, yapılandırılmamış veri alma ve özellikleri (yani değişkenleri) tanımlama işlemidir. Örneğin, metin madenciliği söz konusu olduğunda, binlerce metin mesajının (örneğin SMS, e-posta, sosyal ağ mesajları, vb.) İşlenmemiş bir günlüğü ile başlayabilir ve belirli bir boyutu kullanarak düşük değerli kelimeleri (örn. Stopwords) kaldırarak özellikler oluşturabilirsiniz. kelime blokları (n-gram) veya başka kurallar uygulamak.

Özellik Çıkarma - Özellik oluşturduktan sonra, orijinal özelliklerin dönüşümlerini test etmek ve modelinizde kullanmak için bu potansiyel orijinal ve türetilmiş özellikler havuzunun bir alt kümesini seçmek gerekir (yani özellik çıkarma ve seçim). Elde edilen değerleri test etmek yaygın bir adımdır, çünkü veriler doğrusal olmayan bir patern veya sonucunuzla ilişkisi olan önemli bilgiler içerebilir, bu nedenle veri elemanının önemi sadece dönüştürülmüş durumunda görülebilir (örn. Daha yüksek mertebeden türevler). Çok fazla özellik kullanmak, katsayıların çoğalmasına veya başka şekilde birbirine karışan istatistiksel modellere neden olabilirken, analizinizin amacına uygun minimum sayıda özelliğin çıkarılması, parsimony prensibini takip eder.

Özellik alanınızı bu şekilde geliştirmek genellikle görüntülerin veya diğer veri nesnelerinin sınıflandırılmasında gerekli bir adımdır çünkü ham özellik alanı genellikle paradigmada "gürültü" olarak adlandırılan şeyi içeren çok büyük miktarda yapılandırılmamış ve alakasız verilerle doldurulur bir "sinyal" ve "gürültü" (yani bazı verilerin tahmin değeri vardır ve diğer veriler yoktur). Özellik alanını zenginleştirerek, kafa karıştırıcı bilgileri kaldırırken (yani "gürültü") analizinizde öngörücü veya başka bir değere sahip önemli verileri (yani "sinyal") daha iyi tanımlayabilirsiniz.


2
Güzel cevap! (+1)
Aleksandr Blekh

1
Benim için bir zevktir!
Aleksandr Blekh

Teşekkür ederim .. Özellik alanı zenginleştirmenin herhangi bir yöntemi var mı?
Saratha Priya

Elbette. Böyle birçok yöntem var. Örneğin Gabor filtresi, yüz tanıma ve doku sınıflandırmasında özellik üretimi için yaygın olarak kullanılan bir bant geçiren filtre kenarı algılama algoritmasıdır. Bu, destek vektör makineleri gibi sınıflandırma algoritmaları ile birlikte kullanılabilir.
Hack-R

Bunu görüntü sınıflandırmasında özellik zenginleştirme için kullanabilir miyim?
Saratha Priya
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.